notícias

De brinquedos e ferramentas a “colegas” e “AI Einstein”, quão longe estamos da inteligência artificial geral?

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Hoje, a inteligência artificial geral (AGI) tornou-se uma das palavras-chave focadas pela comunidade científica e pela indústria. Há apenas alguns anos, muitas pessoas acreditavam que levaria pelo menos 10 a 50 anos para realizar a AGI. isso nunca seria possível. Hoje, estes últimos são poucos e raros. No entanto, em comparação com o entusiasmo do público sobre esta onda de mudanças tecnológicas, muitos estudiosos da linha de frente e líderes da indústria no campo da IA ​​(inteligência artificial) sentem que ainda há um longo caminho a percorrer antes que a IA actual possa evoluir para AGI.

De acordo com Qi Yuan, Distinto Professor Hao Qing da Universidade Fudan, Reitor do Instituto de Inteligência Científica de Xangai (doravante denominado "Instituto de Xangai") e fundador da grande empresa de modelos confiável "Infinite Lightyear", "uma das mais altas manifestações da inteligência artificial geral "É descobrir as leis desconhecidas do mundo complexo. Em suma, deveria ser um 'AI Einstein'. Isso exige que criemos uma combinação de previsão de probabilidade de 'caixa preta' de pensamento rápido e pensamento lento ' raciocínio lógico de caixa branca para criar um grande modelo confiável de 'caixa cinza'; e por meio da profunda integração da tecnologia e da indústria, promovemos pesquisa básica, treinamento de talentos e a implementação de resultados para criar um ecossistema de inovação científica e inteligente ".

Na Conferência Mundial de Inteligência Artificial (WAIC) de 2024 e na Conferência de Alto Nível sobre Governança Global de Inteligência Artificial, concluída há pouco tempo, o Instituto de Tecnologia de Xangai realizou com sucesso o fórum temático "Inteligência Artificial: Mudança de Paradigma de Pesquisa Científica e Desenvolvimento Industrial" Esta é também a primeira vez que esta nova instituição de P&D aparece no WAIC. Pode-se dizer que o Instituto Shangzhi é um modelo para Xangai na exploração do modelo ecológico científico inteligente "1 + 1 + N" orientado para a inovação. Ou seja, o "1" do Instituto Shangzhi serve como centro e hub do ecossistema, responsável. para o planejamento estratégico geral, integração de recursos e A P&D e inovação de tecnologias-chave, combinadas com outra Universidade Fudan "1" e os "N" de muitas universidades, instituições de pesquisa científica, empresas de tecnologia, equipes de inovação e instituições de investimento, promovem conjuntamente pesquisa científica, treinamento de talentos, transformação de conquistas científicas e tecnológicas e inovação e atualização da indústria.

O padrão para AGI deveria ser criar "AI Einstein"

Do ponto de vista técnico, os grandes modelos com cada vez mais parâmetros levarão à inteligência artificial geral? Hoje, seja do ponto de vista da própria tecnologia de IA ou do ponto de vista do consumo de energia, embora os grandes modelos baseados na arquitetura autorregressiva do Transformer ainda tenham dividendos, eles não são suficientes para levar à inteligência artificial geral. A inteligência artificial requer o desenvolvimento de novos modelos grandes e confiáveis ​​​​da "caixa cinza". Este é um resumo dos muitos anos de experiência prática de Qi Yuan na academia e na indústria.

Dez anos atrás, com a ideia de "tornar a inteligência artificial útil", Qi Yuan liderou a equipe para aumentar o sistema central de aprendizado de máquina do Alibaba de 2 milhões de parâmetros para centenas de milhões de parâmetros pela primeira vez, alcançando um efeito comercial em grande escala melhorias Demonstrar transformação integrada de dados, algoritmos e capacidades de engenharia. Esta é exatamente a personificação da lei de escala de que se fala hoje no círculo da inteligência artificial.

Qi Yuan lembrou que a equipe experimentou os benefícios da Lei de Escala naquela época: depois que os parâmetros do modelo foram aumentados cem vezes, o efeito geral foi melhorado aos trancos e barrancos. “Mas agora estou pensando: por que não fizemos modelos de IA em maior extensão naquela época? Por que parei aqui quando demos um passo à frente? Ele disse: “Grandes modelos com centenas de milhões de parâmetros ainda existem?” não é suficiente, para avançar para dezenas de bilhões, centenas de bilhões, ou mesmo trilhões. Naquela época, tanto a academia quanto as instituições careciam de poder computacional e, mesmo no mundo industrial, alcançar um poder computacional tão alto exigia custos muito elevados. mais ainda.

A razão pela qual o padrão para AGI deveria ser criar um “AI Einstein”, explicou Qi Yuan, é ser eficaz e inteligente. Em primeiro lugar, Einstein viu as "nuvens negras da física no início do século 20" através de vários pontos de dados importantes. AGI também deveria ser capaz de descobrir leis desconhecidas que compreendem o mundo complexo. No entanto, nenhum dos grandes modelos atuais pode fazer isso. Embora o grande modelo visual SORA simule o mundo físico em uma extensão sem precedentes, o SORA ainda constrói um mundo tridimensional baseado na simulação do mundo bidimensional, que ainda está longe. de uma compreensão completa do mundo físico. O segundo é o consumo de energia. A potência do cérebro humano é de cerca de 15 watts, e a potência de pico de uma GPU é de várias centenas de watts. Sem mencionar que o suporte ao treinamento de grandes modelos de uso geral requer um quilocard ou dez mil clusters de cartões. . Por enquanto, se você continuar a usar a arquitetura existente, isso exigirá um enorme consumo de energia, dificultando o alcance do objetivo de ser eficaz e inteligente.

"AI Einstein" também é um objetivo fundamental da IA ​​para a Ciência (Nota: Inteligência Científica, doravante referida como AI4S). A inteligência científica já desempenha um papel importante na aceleração da solução de equações físicas conhecidas, mas a inteligência científica precisa combinar regras e dados conhecidos, reduzir a forte dependência de dados e poder computacional, melhorar a precisão do raciocínio e da previsão e ajustar com base no conhecimento dos dados. regras e propor novas teorias científicas. Isto também coincide com o objetivo de longo prazo de Qi Yuan de trabalhar na Universidade Fudan e no Instituto de Propriedade Intelectual de Xangai - "usar inteligência artificial para compreender o mundo complexo e descobrir leis desconhecidas".

Modelo grande e confiável de campo vertical "caixa cinza" capacita milhares de indústrias

Que problemas precisam ser resolvidos urgentemente quando grandes modelos implementam nova produtividade a partir de ferramentas de IA? Do ponto de vista de Qiyuan, a grande indústria de modelos enfrenta muitos desafios comuns, tornando difícil combinar tecnologia, produtos e demanda do mercado.

"Atualmente, o maior problema na implementação de modelos de grande escala é que eles parecem úteis à primeira vista, mas são inúteis depois de usados." Qi Yuan explicou que o núcleo dos modelos de linguagem de grande escala de hoje é simplesmente usar. prever a próxima palavra para prever a próxima palavra, mas isso não é adequado para um raciocínio rigoroso em várias etapas. "A linguagem é uma ferramenta de comunicação, não uma ferramenta de pensamento." Recentemente, um artigo publicado pelo Instituto de Tecnologia de Massachusetts (MIT) e outras instituições na importante revista acadêmica "Nature" apontou que a linguagem é uma ferramenta poderosa para divulgação. conhecimento cultural, e pode estar relacionado com Nossas habilidades de pensamento e raciocínio co-evoluíram para refletir a complexidade da cognição humana. Mas a linguagem não cria a complexidade do raciocínio.

Tendo em vista as características existentes de grandes modelos, como falta de confiabilidade, baixa interpretabilidade e alto custo, uma solução verdadeiramente eficaz é combinar o raciocínio probabilístico de redes neurais com cálculos lógicos simbólicos, semelhante ao ganhador do Prêmio Nobel de economia Daniel Card. o pensamento rápido baseado no instinto humano e o pensamento lento baseado no raciocínio lógico descritos no livro de Niemann "Thinking Fast and Slow" "podem ser considerados um grande modelo de 'caixa cinza'. Qi Yuan acredita que a "caixa cinza" confiou em grandes modelos que." combinar a computação simbólica com redes neurais pode reduzir a "ilusão" da inteligência artificial e resolver problemas profissionais em campos verticais, capacitando assim milhares de indústrias e liberando a produtividade de grandes modelos.

O que é um modelo grande confiável de “caixa cinza”? "A aprendizagem profunda foi originalmente considerada uma 'caixa preta', mas agora combinamos a 'caixa branca' do raciocínio lógico com a aprendizagem profunda, e ela se torna uma 'caixa cinza'", explicou Qi Yuan, "A 'caixa preta' original." 'faz com que as pessoas não saibam nada sobre o processo de produção de resultados de dados, e o grande modelo da 'caixa cinza' pode fazer com que as pessoas 'saibam o que está acontecendo e por quê' com a ajuda do raciocínio lógico. Os modelos podem usar o aprendizado profundo para reduzir regras que não o fazem. corresponder aos dados observacionais do mundo real."

Qi Yuan disse que para fazer com que cenários complexos em vários setores se tornem novos campos de batalha onde a IA desempenha um papel central, seja em finanças e seguros, energia eólica, transporte marítimo, cenários médicos e farmacêuticos, é necessário integrar o conhecimento sistemático da indústria, lógica de raciocínio e mecanismos de tomada de decisão Combinados com grandes modelos. Grandes modelos de "caixa cinza" não são apenas a direção geral da inteligência artificial geral, mas também uma ferramenta poderosa para grandes modelos penetrarem profundamente em campos verticais e realmente resolverem problemas práticos. “Se você olhar de uma perspectiva industrial, esse entendimento é muito intuitivo.” Qi Yuan deu um exemplo. Cada função profissional deve se concentrar em sua própria. campo e criar suas próprias ferramentas de produtividade. Tecnicamente falando, o “esquecimento catastrófico” pode ocorrer se um modelo grande for aprendido demais em tarefas irrelevantes. Assim como se Li Bai trabalhasse como contador o dia todo e não escrevesse poesia, sua inspiração poética poderia desaparecer gradualmente. "Observamos que ao treinar um modelo grande em um campo vertical, se for permitido ao modelo aprender muitas funções irrelevantes, isso interferirá em suas capacidades originais. Portanto, é necessário fazer um modelo grande de 'caixa cinza' em o campo vertical. Acho que tem grande valor na implementação industrial”.

"Acho que o grande modelo da 'caixa cinza' desempenhará um papel cada vez mais importante no caminho para a AGI e a implementação da indústria vertical, porque a partir de uma metodologia bayesiana, é combinar nosso conhecimento conhecido e oculto. As informações desconhecidas nos dados são combinadas para descobrir novas leis e resolver problemas científicos e industriais "Qi Yuan disse sem rodeios que, no futuro," AI Einstein "também pode ser" AI Buffett.

Abrir a cadeia de inovação e construir um ecossistema de inovação científica e inteligente

Na Conferência Mundial de Inteligência Artificial de 2024, uma equipe liderada por Qi Yuan lançou um modelo médico e financeiro em linguagem leve confiável e em larga escala com dezenas de bilhões de parâmetros. Os testes de grandes modelos nesses dois campos verticais ultrapassaram o grande modelo GPT4-Turbo de trilhões de parâmetros da OPEN AI, despertando mais uma vez a atenção da indústria para a implementação de grandes modelos.

"Os avanços atuais da inteligência artificial não vêm apenas da inovação dos princípios subjacentes, mas também são impulsionados por produtos orientados para as necessidades sociais. O que a sociedade precisa não é apenas da publicação de artigos teóricos ou da inovação de modelos de negócios, mas da profunda integração de tecnologias inovação e inovação industrial, que se baseia em Um avanço no princípio da unidade. Uma vez combinados os dois, poderemos nadar para um lugar onde a água seja mais azul", disse Qi Yuan.

A academia e a indústria têm missões diferentes. A academia deve explorar coisas novas, enquanto a indústria deve primeiro resolver problemas práticos. Há um problema comum no país e no estrangeiro: as instituições de investigação precisam de estudar muitas questões de inovação tecnológica, mas se ignorarem a produção e as necessidades sociais, haverá duas deficiências: a falta de pressão competitiva real e a incapacidade de moderar as tecnologias inovadoras na concorrência. ; O feedback eficaz das informações de mercado orienta a pesquisa e o desenvolvimento de tecnologia.

Para este fim, Qiyuan tem esperado abrir a cadeia de inovação de "universidades-institutos de pesquisa-start-ups" e criar um bom ecossistema de inovação. Ele não só pensa na tecnologia subjacente, mas também compreende a demanda do mercado. Use a demanda e os cenários do mercado para orientar a direção do produto e inove de baixo para cima para construir a competitividade central do produto.

A Shangzhiyuan, fundada em 2023, está comprometida com a inovação original em IA para a Ciência que combina conhecimento e dados. Recentemente, o Instituto Shangzhi lançou a série Fuxi de modelos meteorológicos em grande escala 2.0 para aplicações industriais, como novas energias, seguros e gestão urbana, e assumiu a liderança no lançamento da Aliança Ecológica de Inovação Meteorológica Inteligente, unindo várias unidades para promover gradualmente a industrialização da série Fuxi de aplicação de modelos meteorológicos em grande escala 2.0. O lançamento do produto do modelo grande confiável "caixa cinza" também está em andamento. A Infinite Lightyear, uma empresa modelo grande e confiável da qual Qi Yuan é o fundador, foi estabelecida.

A fim de prosperar ainda mais o ecossistema de inovação científica e inteligente, a segunda conferência foi patrocinada conjuntamente pela Academia Inteligente de Xangai e pela Universidade Fudan, e orientada conjuntamente pela Comissão Municipal de Ciência e Tecnologia de Xangai, Comissão Municipal de Desenvolvimento e Reforma de Xangai, Economia Municipal de Xangai e Informação Comissão, Comissão Municipal de Educação de Xangai e outros departamentos Foi lançada a Competição Mundial de Ciência e Inteligência. A competição estabelece um prêmio de um milhão de dólares para recrutar jogadores de todo o mundo para explorarem conjuntamente os campos fronteiriços da inteligência científica. Ao mesmo tempo, o Instituto Shangzhi liderou o desenvolvimento de uma plataforma de dados científicos que abrange dados científicos multimodais. A plataforma possui capacidades de ligação completa, desde a recolha e processamento de dados até à gestão e modelação, garantindo processamento eficiente, fiabilidade e interoperabilidade segura dos dados. . Com base nesta plataforma, a SPIC e os seus parceiros construíram múltiplos conjuntos de dados científicos de alta qualidade para as áreas das ciências da vida, ciências físicas e ciências atmosféricas, fornecendo recursos valiosos para a investigação de inteligência científica. Além disso, o Instituto Shangzhi assumiu a liderança no lançamento da Aliança Ecológica de Dados Científicos Globais. O primeiro lote de unidades membros da aliança inclui mais de dez unidades, incluindo China Telecom Co., Ltd., COSCO Shipping Property Insurance Captive Co., Ltd., Shanghai. Lingang Nova Área Transfronteiriça Tecnologia de Dados Co., Ltd. A aliança construirá uma plataforma global e multifacetada de abertura e compartilhamento de recursos de big data de pesquisa científica por meio da cooperação com governos, empresas, universidades, instituições de pesquisa e outras partes.

"Tanto a pesquisa científica quanto a indústria não deveriam ser 'novas pela novidade'. Esperamos poder construir futuras aplicações e inteligência artificial geral para resolver problemas do mundo real", disse Qi Yuan.

autor:

Foto: Foto cortesia do Shanghai Intelligence Research Institute Editor: Wu Jinjiao Editor-chefe: Jiang Peng

Por favor indique a fonte ao reimprimir este artigo.