notícias

O primeiro cientista de IA do mundo! Entregou 4 artigos de nível de conferência de uma só vez, mas secretamente "trapacearia" e mudaria o roteiro

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


coisas inteligentes
Autor Li Shuiqing
Editor Yunpeng

Sempre que a IA faz progressos significativos, os investigadores costumam brincar: “Quando vamos deixar a IA escrever artigos para nós?”

Agora,AI cria artigos de pesquisa científicatornou-se uma realidade e o custo de escrita é tão baixo quanto aprox.US$ 15

Wisdom News em 14 de agosto, em 13 de agosto, a equipe japonesa Sakana AI se uniu a pesquisadores da Universidade de Oxford e da Universidade da Colúmbia Britânica para lançar umO cientista de IA, que é um agente automatizado de pesquisa científica (Agente) baseado em um grande modelo.

Dê-lhe um amplo campo de pesquisa e ele poderá criar um artigo no campo da IA, assim como um ser humano.

Programador de IA“As habilidades de programação são apenas parte da capacidade dos cientistas de IA.Brainstorming, execução de código, resumo de resultados experimentais, visualização, revisão automáticaNão é grande coisa para isso.

Por exemplo, o seguinte artigo intitulado "Dualscale Diffusion: Adaptive feature balanceamento para modelos generativos de baixa dimensão" foi escrito por cientistas de IA. Em experimentos concluídos de forma independente por cientistas de IA e revisados ​​por pares, os artigos que eles concluíram alcançaram excelentes resultados empíricos e foram capazes de alcançarO aprendizado de máquina atende ao critério de “fraca aceitação”


Endereço do artigo: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

A equipe citou vários modelos de ponta no projeto científico de IA, comoGPT-4o e Sonetoetc. modelos de código fechado, eDeepSeek e Lhama 3e outros modelos de código aberto.

É relatado que os cientistas de IA têm principalmente os seguintes destaques:

1. Este é umTotalmente alimentado por IAsistema automatizado de pesquisa científica, com foco emCampo de aprendizado de máquinapesquisar.

2. É realizadoEstude a automação de toda a cadeia, desde a inspiração, escrita e execução do código até o resumo e visualização dos resultados experimentais e, finalmente, a redação de um artigo científico completo.

3. Apresenta de forma inovadoraMecanismo automatizado de revisão por pares, usado para avaliar os documentos produzidos, fornecer feedback e otimizar continuamente os resultados,A precisão da avaliação está próxima do nível humano

4. Este processo automatizado de pesquisa científicaCiclo contínuo, abrir e acumular continuamente conhecimento e simular o modelo operacional da comunidade científica humana.

5. Em testes preliminares, esteve envolvido em aprendizado de máquinaObtenha resultados em vários campos, como emModelo de difusão, arquitetura Transformer e GrokkingContribuições foram feitas em outros campos.

Endereço do artigo do cientista de IA: https://arxiv.org/abs/2408.06292/
Código-fonte aberto do cientista de IA e endereço de resultados experimentais: https://github.com/SakanaAI/AI-Scientist


▲ O artigo "Cientista de IA: avançando em direção à descoberta científica aberta totalmente automatizada"

1. Conclua o trabalho de pesquisa científica em 4 etapas e atenda aos padrões de aceitação do AI Summit

Já ouvi falar de poetas de IA, pintores de IA, programadores de IA e agora também apareceram cientistas de IA.

AI Scientist é um sistema de geração de papel totalmente automatizado que faz uso total de grandes modelos de última geração.

istoComece com uma base de código inicial básica, como o código de pesquisa de código aberto pronto para uso no GitHub, desde quedado umAmplas áreas de pesquisa, os cientistas de IA podem completar a tarefa deConcepção criativa, pesquisa bibliográfica, desenho experimental, iteração experimental, produção de gráficos, redação de artigos para revisão preliminarTodo o processo de trabalho é realizado para produzir trabalhos acadêmicos ricos em insights profundos.

O que é ainda mais surpreendente é que os cientistas de IA podemOperação contínua em ciclo aberto, ele aprende continuamente ideias anteriores e feedback para otimizar ideias de pesquisa subsequentes. Este processo é altamente.Simula o modelo operacional da comunidade científica humana


▲ Diagrama de padrão do cientista de IA

O fluxo de trabalho de um cientista de IA inclui principalmenteQuatro links principais

A criatividade brota:A partir do modelo inicial fornecido, os cientistas de IA iniciarão o modo de “brainstorming” e descobrirão uma série de novas direções de pesquisa em torno de tópicos existentes. Este modelo não contém apenas a estrutura básica do código, mas também vem com uma pasta LaTeX contendo arquivos de estilo e predefinições de títulos de capítulos, estabelecendo a base para a escrita subsequente do artigo. No processo de exploração livre, os cientistas de IA também utilizarão o mecanismo de busca acadêmico Semantic Scholar para garantir a originalidade das ideias propostas.

Iteração da experiência:Uma vez determinada a direção da pesquisa, os cientistas de IA entram na fase experimental. Ele executa planos experimentais automaticamente, coleta dados e gera gráficos para exibir visualmente os resultados experimentais. Ao mesmo tempo, os cientistas de IA registrarão detalhadamente o conteúdo de cada gráfico para garantir que notas experimentais e materiais gráficos possam fornecer suporte abrangente para a redação subsequente do artigo.

Escrita em papel:Após a conclusão do experimento, o cientista de IA usará o formato LaTeX para escrever um artigo com estrutura clara e conteúdo detalhado para mostrar aos leitores os resultados de sua pesquisa. Durante o processo de redação, ele também usará o Semantic Scholar para pesquisar e citar automaticamente literatura em áreas relacionadas para aprimorar a natureza acadêmica e confiável do artigo.

Revisão automática:Para melhorar a qualidade dos artigos, a equipe desenvolveu especialmente um sistema de revisão automatizado baseado em um grande modelo de linguagem. O sistema é capaz de avaliar objetivamente os artigos gerados com julgamento quase humano e fazer sugestões de melhorias. Este feedback não só ajuda os cientistas de IA a otimizar os projetos atuais, mas também fornece referências valiosas para pesquisas futuras. Através deste ciclo de feedback contínuo, os cientistas de IA podem melhorar e melhorar continuamente e de forma iterativa o nível e o impacto dos resultados da investigação.

Quando combinados com a tecnologia LLM de última geração, os cientistas de IA são capazes de escreverCritérios de "aceitação fraca" para as principais conferências de aprendizado de máquinatese e passouSistema de revisão automatizado ganha reconhecimento

2. Apresentação de artigos de cientistas de IA: abrangendo modelos de difusão, modelagem de linguagem e outros campos

No anúncio, a equipe apresentou uma série de artigos na área de aprendizado de máquina gerados por cientistas de IA, demonstrando suas capacidades de pesquisa científica em áreas como modelos de difusão, modelagem de linguagem e Grokking.

1. Modelo de difusão: "DualScale Diffusion: Balanceamento de recursos adaptativos de modelos generativos de baixa dimensão"


Endereço do artigo: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Endereço do código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising

2. Modelagem de linguagem: "StyleFusion: geração adaptativa de vários estilos em modelos de linguagem em nível de caractere"


Endereço do artigo: https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
Endereço do código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter

Modelagem de linguagem: "Implementando a taxa de aprendizagem adaptativa do Transformer por meio de Q-Learning"


Endereço do artigo: https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
Endereço do código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation

3. Grokking: "Desbloqueando Grokking: Um Estudo Comparativo de Estratégias de Inicialização de Peso em Modelos de Transformadores"


Endereço do artigo: https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
Endereço do código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking

3. Capacidade insuficiente de “desenhar” e dificuldade em comparar com precisão os tamanhos de dois números

Limitados pelo atual nível de desenvolvimento de grandes modelos, os cientistas de IA ainda apresentam deficiências.

Atualmente, os cientistas de IA ainda estãoSem recursos de processamento visual, portanto, ele não pode corrigir automaticamente elementos visuais ou problemas de layout de diagrama em seu artigo.

Por exemplo, os gráficos gerados às vezes carecem de clareza, as tabelas podem ultrapassar os limites da página e o layout geral da página costuma ser confuso. Espera-se que a introdução de modelos básicos multimodais resolva fundamentalmente este problema.

Além disso, quando os cientistas de IA implementam ideias ou realizam comparações de base, podemResultados enganosos devido à operação inadequada

Ao mesmo tempo, pode ocasionalmente cometer erros mais graves ao redigir e avaliar resultados, tais comoDificuldade em comparar com precisão dois números, que é uma falha conhecida em modelos grandes. Para mitigar este problema, a equipe garantiu que todos os resultados experimentais sejam reproduzíveis e que todos os arquivos de execução tenham sido salvos corretamente.

No relatório, a equipe forneceu uma análise aprofundada das atuais limitações dos cientistas de IA e dos desafios que poderão enfrentar no futuro.

4. Os cientistas de IA estão "jogando de forma inteligente": modificando scripts por conta própria, causando riscos à segurança da IA

A equipe também observou que os cientistas de IA às vezes tentam aumentar a chance de sucesso por meio de alguma “pequena inteligência”, comoModifique e execute o script você mesmo. No artigo, a equipe discutiu profundamente os riscos de segurança da IA ​​que esse comportamento pode trazer.

Por exemplo, durante uma execução, na verdadeEditei o código, fazendo-se rodar em um loop infinito através de chamadas do sistema.

Outra vez, um experimento demorou muito e estava prestes a ultrapassar o limite de tempo definido pela equipe. Porém, em vez de otimizar o código para melhorar a eficiência, ele tentou passar.Modifique o código para estender o tempo limite

Aqui estão alguns exemplos específicos de suas tentativas de modificar o código:



Esses problemas podem ser aliviados colocando em sandbox o ambiente operacional dos cientistas de IA. No relatório completo, a equipe discute detalhadamente a execução segura de código e o sandbox.

Conclusão: Os cientistas da IA ​​fazem a sua estreia e as suas capacidades de inovação subversiva precisam de ser verificadas

Olhando para o futuro, a Sakana AI disse que seu objetivo é aplicar cientistas de IA a sistemas de circuito fechado com modelos abertos para promover o autoaperfeiçoamento contínuo da IA. Os cientistas de IA trarão um novo mundo de ciência totalmente impulsionado pela IA. Não existem apenas pesquisadores capacitados por grandes modelos de linguagem, mas também revisores, presidentes de campo e até mesmo todo o sistema de conferências acadêmicas.

Mas Sakana AI não acredita que o estatuto dos cientistas humanos seja enfraquecido como resultado. Pelo contrário, com o surgimento de novas tecnologias, os papéis dos cientistas tornar-se-ão mais diversificados e estes passarão para níveis mais elevados no campo da investigação científica. A automatização do processo de descoberta da investigação científica e a incorporação de mecanismos de revisão orientados pela IA abrem principalmente caminho à inovação e soluções para os problemas mais difíceis no domínio da ciência e tecnologia.

A versão atual dos cientistas de IA demonstrou a extraordinária capacidade de inovar com base em tecnologias maduras, como modelos de difusão e transformadores. No entanto, ainda leva tempo para verificar se tais sistemas podem realmente apresentar novas ideias disruptivas.

Fonte: Sakana AI