noticias

¡El primer científico de IA del mundo! Entregó 4 artículos de alto nivel de conferencia de una vez, pero secretamente "hacía trampa" y cambiaba el guión.

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


cosas inteligentes
Autor Li Shuiqing
Editor Yunpeng

Cada vez que la IA logra avances significativos, los investigadores suelen bromear: "¿Cuándo vamos a dejar que la IA escriba artículos por nosotros?"

Ahora,La IA crea artículos de investigación científicase ha hecho realidad y el coste de escritura es tan bajo como aprox.$15

Wisdom News el 14 de agosto, el 13 de agosto, el equipo japonés de IA Sakana se asoció con investigadores de la Universidad de Oxford y la Universidad de Columbia Británica para lanzar unEl científico de la IA, que es un agente de investigación científica automatizado (Agente) basado en un modelo grande.

Si se le da un amplio campo de investigación, podrá crear un artículo en el campo de la IA como un ser humano.

programador de IA"Las habilidades de programación son sólo una parte de las capacidades de los científicos de IA.Lluvia de ideas, ejecución de código, resumen de resultados experimentales, visualización, revisión automáticaNo es gran cosa.

Por ejemplo, científicos de IA escribieron el siguiente artículo titulado "Difusión de doble escala: equilibrio de características adaptativas para modelos generativos de baja dimensión". En experimentos realizados de forma independiente por científicos de IA y revisados ​​por pares, los artículos que completaron lograron excelentes resultados empíricos y pudieron lograrEl aprendizaje automático cumple con el criterio de "aceptación débil"


Dirección del artículo: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf

El equipo citó varios modelos de vanguardia en el proyecto científico de IA, comoGPT-4o y Sonetoetc. modelos de código cerrado, yDeepSeek y Llama 3y otros modelos de código abierto.

Se informa que los científicos de IA tienen principalmente los siguientes aspectos destacados:

1. Este es unCompletamente impulsado por IAsistema automatizado de investigación científica, centrado enCampo de aprendizaje automáticoinvestigación.

2. Se realizaEstudiar la automatización de toda la cadena, desde la inspiración, la escritura y ejecución del código hasta el resumen y visualización de los resultados experimentales y, finalmente, la redacción de un artículo científico completo.

3. Introduce de forma innovadoraMecanismo automatizado de revisión por pares, utilizado para evaluar los artículos resultantes, proporcionar retroalimentación y optimizar continuamente los resultados,La precisión de la evaluación se acerca al nivel humano

4. Este proceso de investigación científica automatizadoCiclo continuo, abrir y acumular conocimientos continuamente y simular el modelo operativo de la comunidad científica humana.

5. En pruebas preliminares, se ha involucrado en aprendizaje automático.Lograr resultados en múltiples campos, como enModelo de difusión, arquitectura Transformer y Grokking.Se han realizado contribuciones en otros campos.

Dirección del artículo científico de IA: https://arxiv.org/abs/2408.06292/
Dirección de código fuente abierto y resultados experimentales del científico de IA: https://github.com/SakanaAI/AI-Scientist


▲ El artículo "Científico de IA: Avanzando hacia un descubrimiento científico abierto totalmente automatizado"

1. Complete el trabajo de investigación científica en 4 pasos y cumpla con los estándares de aceptación de la Cumbre de IA.

He oído hablar de poetas de IA, pintores de IA, programadores de IA y ahora también han aparecido científicos de IA.

AI Scientist es un sistema de generación de papel totalmente automatizado que aprovecha al máximo modelos grandes de última generación.

élComience con una base de código inicial básica, como el código de investigación de código abierto ya preparado en GitHub, siempre quedado unAmplias áreas de investigación, los científicos de IA pueden completar la tarea desdeConcepción creativa, investigación bibliográfica, diseño experimental, iteración experimental, producción de gráficos, redacción de artículos para revisión preliminar.Todo el proceso de trabajo se lleva a cabo para producir artículos académicos ricos en conocimientos profundos.

Lo que es aún más sorprendente es que los científicos de IA puedenFuncionamiento continuo en ciclo abierto., aprende continuamente ideas previas y comentarios para optimizar las ideas de investigación posteriores. Este proceso es altamente importante.Simula el modelo operativo de la comunidad científica humana.


▲ Diagrama de patrón del científico de IA

El flujo de trabajo de un científico de IA incluye principalmenteCuatro vínculos principales

Brotes de creatividad:A partir de la plantilla inicial proporcionada, los científicos de IA iniciarán el modo de "lluvia de ideas" y descubrirán una serie de direcciones de investigación novedosas en torno a temas existentes. Esta plantilla no solo contiene el marco de código básico, sino que también viene con una carpeta LaTeX que contiene archivos de estilo y ajustes preestablecidos de títulos de capítulos, sentando las bases para la redacción posterior del artículo. En el proceso de exploración libre, los científicos de IA también utilizarán el motor de búsqueda académico Semantic Scholar para garantizar la originalidad de las ideas propuestas.

Iteración del experimento:Una vez determinada la dirección de la investigación, los científicos de IA entran en la etapa experimental. Ejecuta automáticamente planes experimentales, recopila datos y genera gráficos para mostrar visualmente los resultados experimentales. Al mismo tiempo, los científicos de IA registrarán el contenido de cada gráfico en detalle para garantizar que las notas experimentales y los materiales gráficos puedan brindar un apoyo integral para la redacción posterior del artículo.

Escritura en papel:Una vez completado el experimento, el científico de IA utilizará el formato LaTeX para escribir un artículo con una estructura clara y contenido detallado para mostrar a los lectores los resultados de su investigación. Durante el proceso de redacción, también utilizará Semantic Scholar para buscar y citar automáticamente literatura en campos relacionados para mejorar la naturaleza académica y autorizada del artículo.

Revisión automática:Para mejorar la calidad de los artículos, el equipo desarrolló especialmente un sistema de revisión automatizado basado en un modelo de lenguaje grande. El sistema es capaz de evaluar objetivamente los artículos generados con un juicio casi humano y hacer sugerencias de mejora. Esta retroalimentación no sólo ayuda a los científicos de IA a optimizar los proyectos actuales, sino que también proporciona una referencia valiosa para futuras investigaciones. A través de este circuito de retroalimentación continua, los científicos de IA pueden mejorar y potenciar continuamente y de forma iterativa el nivel y el impacto de los resultados de la investigación.

Cuando se combina con tecnología LLM de última generación, los científicos de IA pueden incluso escribirCriterios de "aceptación débil" para las principales conferencias sobre aprendizaje automáticotesis y aprobadoEl sistema de revisión automatizado gana reconocimiento

2. Presentación de artículos de científicos de IA: que cubren modelos de difusión, modelado de lenguaje y otros campos.

En el anuncio, el equipo presentó una serie de artículos en el campo del aprendizaje automático generados por científicos de IA, demostrando sus capacidades de investigación científica en campos como modelos de difusión, modelado de lenguaje y Grokking.

1. Modelo de difusión: "Difusión DualScale: equilibrio de características adaptativas de modelos generativos de baja dimensión"


Dirección del artículo: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Dirección del código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising

2. Modelado de lenguaje: "StyleFusion: generación adaptativa de múltiples estilos en modelos de lenguaje a nivel de caracteres"


Dirección del artículo: https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
Dirección del código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter

Modelado de lenguaje: "Implementación de la tasa de aprendizaje adaptativo de Transformer a través de Q-Learning"


Dirección del artículo: https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
Dirección del código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation

3. Grokking: "Desbloqueo de Grokking: un estudio comparativo de estrategias de inicialización de peso en modelos de transformadores"


Dirección del artículo: https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
Dirección del código: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking

3. Capacidad insuficiente para "dibujar" y dificultad para comparar con precisión los tamaños de dos números.

Limitados por el nivel actual de desarrollo de modelos grandes, los científicos de IA todavía tienen deficiencias.

Actualmente, los científicos de IA todavía estánSin capacidades de procesamiento visual, por lo que no puede corregir automáticamente elementos visuales o problemas de diseño de diagramas en su artículo.

Por ejemplo, los gráficos que genera a veces carecen de claridad, las tablas pueden exceder los límites de las páginas y el diseño general de la página suele estar desordenado. Se espera que la introducción de modelos básicos multimodales resuelva fundamentalmente este problema.

Además, cuando los científicos de IA implementan ideas o realizan comparaciones de referencia, puedenResultados engañosos debido a una operación incorrecta

Al mismo tiempo, en ocasiones puede cometer errores más graves al redactar y evaluar los resultados, comoDificultad para comparar con precisión dos números, que es un defecto conocido de los modelos grandes. Para mitigar este problema, el equipo se ha asegurado de que todos los resultados experimentales sean reproducibles y que todos los archivos de ejecución se hayan guardado correctamente.

En el informe, el equipo proporcionó un análisis en profundidad de las limitaciones actuales de los científicos de IA y los desafíos que pueden enfrentar en el futuro.

4. Los científicos de IA están "jugando de forma inteligente": modifican los scripts por su cuenta, lo que genera riesgos de seguridad para la IA.

El equipo también observó que los científicos de IA a veces intentan aumentar las posibilidades de éxito mediante un poco de "poco de inteligencia", comoModifique y ejecute el script usted mismo. En el documento, el equipo analizó en profundidad los riesgos de seguridad de la IA que puede conllevar este comportamiento.

Por ejemplo, durante una ejecución, en realidadEditado el código, ejecutándose en un bucle infinito a través de llamadas al sistema.

En otra ocasión, un experimento tomó demasiado tiempo y estuvo a punto de exceder el límite de tiempo de espera establecido por el equipo. Sin embargo, en lugar de optimizar el código para mejorar la eficiencia, intentó aprobar.Modifique el código para extender el tiempo de espera.

A continuación se muestran algunos ejemplos específicos de sus intentos de modificar el código:



Estos problemas pueden aliviarse mediante el aislamiento del entorno operativo de los científicos de IA. En el informe completo, el equipo analiza en profundidad la ejecución segura de código y el sandboxing.

Conclusión: los científicos de IA hacen su debut y es necesario verificar sus capacidades de innovación subversiva

De cara al futuro, Sakana AI dijo que su objetivo es aplicar a los científicos de IA a sistemas de circuito cerrado con modelos abiertos para promover la mejora continua de la IA. Los científicos de IA traerán un nuevo mundo de la ciencia totalmente impulsado por la IA. No solo hay investigadores capacitados por grandes modelos de lenguaje, sino también revisores, presidentes de campo e incluso todo el sistema de conferencias académicas.

Pero Sakana AI no cree que esto debilite el estatus de los científicos humanos. Por el contrario, con la aparición de nuevas tecnologías, las funciones de los científicos se diversificarán más y ascenderán a niveles más altos en el campo de la investigación científica. La automatización del proceso de descubrimiento de la investigación científica y la incorporación de mecanismos de revisión impulsados ​​por la IA allanan principalmente el camino para la innovación y las soluciones a los problemas más difíciles en el campo de la ciencia y la tecnología.

La versión actual de los científicos de IA ha demostrado una extraordinaria capacidad para innovar basándose en tecnologías maduras como los modelos de difusión y los transformadores. Sin embargo, todavía lleva tiempo verificar si dichos sistemas realmente pueden generar nuevas ideas disruptivas.

Fuente: Sakana AI