Visitando a nova produtividade de Pequim·Fora do laboratório｜Grande modelo invisível, produtividade visível

Visitando a Nova Produtividade de Pequim·Fora do Laboratório｜Grande modelo invisível, produtividade visível

2024-08-05

Em 2017, a inteligência artificial foi incluída pela primeira vez no relatório de trabalho do governo chinês e tornou-se uma estratégia nacional. Em 2018, o Instituto de Pesquisa de Inteligência Artificial Zhiyuan de Pequim (doravante denominado "Zhiyuan") nasceu em um pequeno escritório na liderança. espaço de inovação. Naquela época, o modelo GPT de primeira geração lançado pela OpenAI ainda não havia conquistado as manchetes da mídia.

Em 2023, Zhiyuan atualizou o primeiro modelo inteligente de ultragrande escala "Wudao" do meu país para 3.0, tornando-se uma das três instituições de IA mais avançadas do mundo na mente do presidente da Microsoft, Brad Smith. No campo de grandes modelos, Zhiyuan é a única instituição de pesquisa não empresarial no mundo que não é apoiada por um grande fabricante. É também a primeira nova instituição de pesquisa na China a apresentar sistematicamente pesquisa e desenvolvimento de tecnologia de grandes modelos, aberta. fonte de construção ecológica, treinamento de talentos e cultivo empresarial.

"Direitos iguais em ciência e tecnologia sempre deram origem a grandes oportunidades industriais no passado." Wang Zhongyuan, o novo presidente da Zhiyuan, que tem experiência corporativa e experiência em instituições de pesquisa, tem uma compreensão mais profunda das indústrias capacitadas pela tecnologia. . A definição de inteligência artificial do país também é mais específica: a inteligência artificial é um motor importante para o desenvolvimento de novas forças produtivas.

Trabalhe duro para ficar à frente da tempestade

Uma ou duas vezes, o CEO do Dark Side of the Moon, Yang Zhilin, foi cercado por participantes pelo menos três vezes na Conferência Zhiyuan de Pequim em 2024. Quando o fundador da OpenAI, Sam Altman, fez um discurso em vídeo na Conferência Zhiyuan, há um ano, a inquietação era igualmente óbvia. .

De 2023 a 2024, cientistas de IA, CEOs de grandes empresas de tecnologia e fundadores de startups famosas se reunirão em vários locais para pregar sobre grandes modelos. Quer sejam especialistas técnicos ou não, todos no palco já ouviram falar mais ou menos. o nome Zhiyuan Muitos deles estavam diretamente envolvidos nos projetos de pesquisa de modelos em grande escala de Zhiyuan naquela época. O CTO do Baidu, Wang Haifeng, já atuou como diretor da Zhiyuan, Tang Jie, fundador da Zhipu AI, atuou como vice-presidente da Zhiyuan e Yang Zhilin participou da pesquisa e desenvolvimento de Wu Dao.

Esses criadores de tendências de IA não se envolveram com Zhiyuan agora, e Zhiyuan não se envolveu em modelos grandes somente depois que eles se tornaram populares.

Em 2019, Zhiyuan começou a apresentar grandes modelos. Em 2020, estabeleceu uma equipe de pesquisa Wudao e lançou pesquisa e desenvolvimento de grandes modelos. Em março de 2021, o modelo grande Wu Dao 1.0 foi lançado pela primeira vez e, em junho, o Wu Dao 2.0 Wisdom usou 1,75 trilhão de parâmetros para criar o recorde do "maior" modelo grande do mundo na época. modelo grande GPT-3 na época 10 vezes o número de parâmetros.

A pesquisa científica dá atenção ao somatossensorial, fazendo perguntas e fazendo julgamentos. O julgamento de que “a era dos grandes modelos de inteligência artificial está chegando” deu a Zhiyuan coragem sem reservas. Até mesmo o termo chinês “grande modelo” foi proposto pela primeira vez por Zhiyuan.

O que é um modelo grande? Huang Tiejun, presidente do Instituto de Pesquisa Zhiyuan, acredita que três condições devem ser atendidas: grande escala, com parâmetros emergentes superiores a dezenas de bilhões, capazes de produzir novas capacidades inesperadas, versáteis, não limitadas a problemas ou campos especializados, capazes de lidar; Muitas tarefas diferentes.

Em 2023, os modelos grandes chegarão aos olhos do público. Os modelos da série Wudao foram atualizados para a versão 3.0, abrangendo grandes modelos básicos, como linguagem, visão e multimodalidade, e são totalmente de código aberto. Na discussão sobre modelos básicos na Universidade de Stanford naquela época, a Intelligent Source foi classificada ao lado de gigantes da tecnologia como Google, Microsoft e Facebook (agora Meta), tornando-se a instituição representativa para pesquisas de grandes modelos no mundo.

"O surgimento da maioria dos resultados de pesquisa na história foi acidental e ninguém poderia planejá-lo. Todos os esforços são para melhorar a probabilidade - para reunir pesquisadores excepcionais e fornecer-lhes um ambiente comunitário onde possam colidir ideias, descobrir problemas e encontrar parceiros colaborativos. "O prefácio escrito por Zhang Hongjiang, presidente fundador do Zhiyuan Research Institute, à autobiografia do vencedor do Prêmio Turing, Yann LeCun, é mais parecido com a razão pela qual Zhiyuan veio em primeiro lugar.

Faça engenharia de sistema

No início de 2018, Pequim emitiu as "Medidas de Implementação de Pequim para Apoiar a Construção de Novas Instituições de P&D de Classe Mundial" para realizar uma reforma inovadora do sistema de ciência e tecnologia. Em dezembro, com a orientação e apoio do Ministério da Ciência e Tecnologia e do Comitê Municipal do Partido e do Governo de Pequim, Zhiyuan foi oficialmente estabelecida.

Anteriormente, o processo de gestão da investigação científica era complexo, com longos ciclos desde a proposta do projecto até ao lançamento do guia até à candidatura e revisão do financiamento, dificultando a adaptação às necessidades de investigação científica em constante mudança num ambiente altamente competitivo. De acordo com este sistema, a instituição de investigação apresentou propostas de projectos em Outubro de 2020, e a investigação de modelos em grande escala não pode ser lançada oficialmente antes de 2022, no mínimo. O modelo Zhiyuan levou menos de cinco meses desde o estabelecimento do projeto até o lançamento de modelos grandes.

Este é um novo tipo de instituição de P&D entre universidades e empresas. Xin Zai não utiliza artigos como índice de avaliação final, nem produtos como índice de avaliação, mas para construir sistemas inovadores. Xin Zai reúne acadêmicos de diferentes instituições e empresas, como Universidade de Tsinghua, Universidade de Pequim, Laboratório de Inteligência Artificial do Facebook, Baidu, etc. Grandes coisas; a novidade é mirar em grandes problemas, manter um olhar atento sobre as principais questões científicas e fazer planos voltados para o futuro.

"O modelo universitário está em operação há décadas e é difícil conduzir P&D sistemático de maneira organizada, em grande escala e entre equipes. As empresas também investirão em P&D, mas estão mais inclinadas a P&D que esteja intimamente relacionado aos negócios. Zhiyuan fará de 3 a Um projeto de pesquisa que levará 5 anos ou mais para ver resultados", disse Wang Zhongyuan em uma entrevista exclusiva com um repórter do Beijing Business Daily.

Actualmente, a confiança de Zhiyuan ainda reside na determinação do país na inteligência artificial. Em Março de 2024, Li Qiang, membro do Comité Permanente do Birô Político do Comité Central do PCC e Primeiro-Ministro do Conselho de Estado, deixou claro durante uma investigação em Pequim: A inteligência artificial é um motor importante para o desenvolvimento de novas forças produtivas. .

A nova produtividade de qualidade é uma qualidade de produtividade avançada que desempenha um papel de liderança na inovação, rompe com o modo tradicional de crescimento económico e o caminho de desenvolvimento da produtividade, tem as características de alta tecnologia, alta eficiência e alta qualidade, e está em conformidade com o novo conceito de desenvolvimento. Nasceu de avanços tecnológicos revolucionários, de uma atribuição inovadora de factores de produção e de uma profunda transformação e modernização industrial. "Direitos iguais em ciência e tecnologia sempre criaram grandes oportunidades industriais no passado, e grandes modelos podem trazer nova igualdade em ciência e tecnologia", acredita Wang Zhongyuan firmemente.

Por exemplo, os grandes modelos são os portadores de "inteligência", a onda centrada na IA são as operações de inteligência, a camada inferior são os sistemas técnicos de software e hardware, a camada superior são as aplicações de IA e os grandes modelos estão no meio dos dois, desempenhando o papel de “tronco”. A importância do grande modelo é transformar a “inteligência” em serviços públicos como água, electricidade e Internet, e fornecer serviços de IA a um grande número de empresas ou indivíduos através da computação em nuvem.

Este é um projeto sistemático. “Requer investimento concentrado de recursos e mão de obra. Não pode ser feito por muitas pessoas, mas cada uma o faz separadamente, mas um sistema técnico deve ser formado. Huang Tiejun deu um exemplo: “Desenvolver inteligência artificial é”. como siderurgia e geração de energia É necessário um conjunto completo de sistemas técnicos para garantir a produção de aço de alta qualidade e geração de energia estável a um custo relativamente baixo", disse Huang Tiejun.

Vá além da indústria

O sistema técnico construído por Zhiyuan inclui: balde familiar de modelo grande, sistema operacional de modelo grande, conjunto de dados, estrutura de treinamento, biblioteca de operador, etc. Essas conquistas e a visão e os objetivos de Chi Yuan estão pendurados na parede do primeiro andar do Edifício Chi Yuan.

A visão e os objetivos estão divididos em cinco grandes setores, incluindo mecanismos e desenvolvimento industrial, que podem ser resumidos como inovação. "Zhiyuan deseja desenvolver a tecnologia de inteligência artificial mais avançada, liderar e prever o desenvolvimento da inteligência artificial e ir além do que a indústria explicou em detalhes:" Zhiyuan fará coisas que as universidades não podem fazer e as empresas não estão dispostas. fazer. Pesquisa e desenvolvimento, projetos de pesquisa que levam de 3 a 5 anos ou até mais para ver resultados."

Na sua opinião, quando as capacidades técnicas dos grandes modelos atingirem um determinado nível, haverá duas direcções principais: “Uma direcção é integrar-se com produtos, promover aplicações e exercer valor comercial. de instituições que continuam a fazer iteração e otimização dos principais modelos de grande porte, sejam empresas ou instituições de pesquisa, elas devem continuar a lidar com tecnologias-chave.

Por exemplo, na multimodalidade, a maioria das empresas nacionais escolhe a arquitetura DiT para pesquisa e desenvolvimento. "Isso ocorre porque DiT é uma rota comprovada. Zhiyuan espera colocar diferentes modalidades de informação, como texto, imagens, vídeos e vozes, em um modelo de treinamento desde o início." “Este grande modelo multimodal pode ver, compreender e raciocinar sobre o mundo. No futuro, grandes modelos combinados com hardware, ou seja, inteligência incorporada, podem entrar no mundo físico para servir aos humanos.

As empresas permanecem próximas do mercado e procuram cenários ascendentes, enquanto as instituições de I&D concentram-se nos principais avanços tecnológicos e fornecem apoio descendente. A Wisdom Source pertence ao segundo tipo, que está longe de aplicações e cenários, mas utiliza código aberto como suporte para. a industria.

“Inteligência artificial não é o mesmo que modelos grandes, é apenas um gênero de inteligência artificial”, explicou Wang Zhongyuan a um repórter do Beijing Business Daily. A Fonte Inteligente de hoje também está investindo em outras tecnologias de inteligência artificial, como a pesquisa semelhante ao cérebro e o coração digital, o que significa que não há limite máximo para a imaginação da inteligência artificial em outras indústrias.

Wei Wei, repórter do Beijing Business Daily

notícias

Visitando a Nova Produtividade de Pequim·Fora do Laboratório｜Grande modelo invisível, produtividade visível

Introdução

minhas informações de contato