2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
des choses intelligentes
Auteur Li Shuiqing
Éditeur Yunpeng
Chaque fois que l’IA fait des progrès significatifs, les chercheurs plaisantent souvent : « Quand allons-nous laisser l’IA rédiger des articles à notre place ?
Maintenant,L'IA crée des articles de recherche scientifiqueest devenu une réalité et le coût d'écriture est aussi bas qu'env.15 $。
Wisdom News le 14 août et le 13 août, l'équipe japonaise Sakana AI s'est associée à des chercheurs de l'Université d'Oxford et de l'Université de la Colombie-Britannique pour lancer unLe scientifique en IA, qui est un agent de recherche scientifique automatisé (Agent) basé sur un grand modèle.
Donnez-lui un vaste domaine de recherche et il pourra créer un article dans le domaine de l’IA, tout comme un humain.
“Programmeur IA"Les compétences en programmation ne représentent qu'une partie des capacités des scientifiques en IA.Brainstorming, exécution de code, résumé des résultats expérimentaux, visualisation, revue automatiqueCe n'est pas grave.
Par exemple, l'article suivant intitulé « Diffusion à double échelle : équilibrage adaptatif des fonctionnalités pour les modèles génératifs à faible dimension » a été rédigé par des scientifiques en IA. Dans le cadre d'expériences réalisées indépendamment par des scientifiques en IA et examinées par leurs pairs, les articles qu'ils ont rédigés ont obtenu d'excellents résultats empiriques et ont pu atteindreL'apprentissage automatique répond au critère de « faible acceptation »。
Adresse papier : https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
L'équipe a cité divers modèles de pointe dans le projet AI Scientist, tels queGPT-4o et Sonnetetc. modèles à source fermée, etDeepSeek et Lama 3et d'autres modèles open source.
Il est rapporté que les scientifiques en IA présentent principalement les points forts suivants :
1. Ceci est unEntièrement alimenté par l'IAsystème de recherche scientifique automatisé, axé surDomaine de l'apprentissage automatiquerecherche.
2. C’est réaliséÉtudier l’automatisation de toute la chaîne, de l'inspiration, de l'écriture et de l'exécution du code au résumé et à la visualisation des résultats expérimentaux, et enfin à la rédaction d'un article scientifique complet.
3. Il introduit de manière innovanteMécanisme automatisé d’examen par les pairs, utilisé pour évaluer les documents de sortie, fournir des commentaires et optimiser en permanence les résultats,La précision de l’évaluation est proche du niveau humain。
4. Ce processus de recherche scientifique automatiséCycle continu, ouvrir et accumuler continuellement des connaissances et simuler le modèle de fonctionnement de la communauté scientifique humaine.
5. Lors de tests préliminaires, il a été impliqué dans l'apprentissage automatiqueObtenez des résultats dans plusieurs domaines, comme dansModèle de diffusion, architecture de transformateur et GrokkingDes contributions ont été apportées dans d'autres domaines.
Adresse de l'article scientifique sur l'IA : https://arxiv.org/abs/2408.06292/
Adresse du code open source et des résultats expérimentaux d'un scientifique en IA : https://github.com/SakanaAI/AI-Scientist
▲L'article « AI Scientist : Vers une découverte scientifique ouverte entièrement automatisée »
1. Complétez le document de recherche scientifique en 4 étapes et répondez aux normes d'acceptation du AI Summit
J'ai entendu parler de poètes IA, de peintres IA, de programmeurs IA, et maintenant des scientifiques IA sont également apparus.
AI Scientist est un système de génération de papier entièrement automatisé qui exploite pleinement les grands modèles de pointe.
ilCommencez avec une base de code initiale de base, comme le code de recherche open source prêt à l'emploi sur GitHub, à condition quedonné unGrands domaines de recherche, les scientifiques en IA peuvent accomplir la tâche depuisConception créative, recherche documentaire, conception expérimentale, itération expérimentale, production de graphiques, rédaction d'articles jusqu'à la révision préliminaireL'ensemble du processus de travail est mené pour produire des articles académiques riches en connaissances approfondies.
Ce qui est encore plus étonnant, c'est que les scientifiques en IA peuventFonctionnement continu en cycle ouvert, il apprend en permanence les idées et les commentaires précédents pour optimiser les idées de recherche ultérieures. Ce processus est hautement.Simule le modèle opérationnel de la communauté scientifique humaine。
▲Diagramme de modèle d'un scientifique en IA
Le flux de travail d'un scientifique en IA comprend principalementQuatre liens majeurs:
Des germes de créativité :À partir du modèle de départ donné, les scientifiques en IA lanceront le mode « brainstorming » et découvriront une série de nouvelles orientations de recherche autour de sujets existants. Ce modèle contient non seulement le cadre de code de base, mais est également livré avec un dossier LaTeX contenant des fichiers de style et des préréglages de titres de chapitre, jetant les bases de la rédaction ultérieure d'un article. Dans le processus d'exploration libre, les scientifiques de l'IA utiliseront également le moteur de recherche académique Semantic Scholar pour s'assurer de l'originalité des idées proposées.
Itération d'expérimentation :Une fois l’orientation de la recherche déterminée, les scientifiques en IA entrent dans la phase expérimentale. Il exécute automatiquement des plans expérimentaux, collecte des données et génère des graphiques pour afficher visuellement les résultats expérimentaux. Dans le même temps, les scientifiques en IA enregistreront le contenu de chaque graphique en détail pour garantir que les notes expérimentales et les documents graphiques puissent fournir un support complet pour la rédaction ultérieure du document.
Rédaction papier :Une fois l'expérience terminée, le scientifique en IA utilisera le format LaTeX pour rédiger un article avec une structure claire et un contenu détaillé afin de montrer aux lecteurs les résultats de leurs recherches. Au cours du processus de rédaction, il utilisera également Semantic Scholar pour rechercher et citer automatiquement de la littérature dans des domaines connexes afin de renforcer la nature académique et faisant autorité de l'article.
Révision automatique :Afin d'améliorer la qualité des articles, l'équipe a spécialement développé un système de révision automatisé basé sur un grand modèle linguistique. Le système est capable d'évaluer objectivement les articles générés avec un jugement quasi humain et de faire des suggestions d'amélioration. Ces commentaires aident non seulement les scientifiques en IA à optimiser les projets en cours, mais constituent également une référence précieuse pour les recherches futures. Grâce à cette boucle de rétroaction continue, les scientifiques en IA peuvent continuellement améliorer et accroître de manière itérative le niveau et l’impact des résultats de la recherche.
Lorsqu'ils sont combinés à la technologie LLM de pointe, les scientifiques en IA sont même capables d'écrireCritères de « faible acceptation » pour les meilleures conférences sur l'apprentissage automatiquethèse et réussiLe système d’évaluation automatisé gagne en reconnaissance。
2. Présentation d'articles par des scientifiques de l'IA : couvrant les modèles de diffusion, la modélisation du langage et d'autres domaines
Dans cette annonce, l'équipe a présenté une série d'articles dans le domaine de l'apprentissage automatique générés par des scientifiques de l'IA, démontrant ses capacités de recherche scientifique dans des domaines tels que les modèles de diffusion, la modélisation du langage et Grokking.
1. Modèle de diffusion : « Diffusion DualScale : équilibrage adaptatif des fonctionnalités des modèles génératifs de faible dimension »
Adresse papier : https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Adresse du code : https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising
2. Modélisation du langage : "StyleFusion : Génération adaptative multi-styles dans des modèles de langage au niveau des caractères"
Adresse papier : https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
Adresse du code : https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter
Modélisation du langage : "Mise en œuvre du taux d'apprentissage adaptatif de Transformer via Q-Learning"
Adresse papier : https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
Adresse du code : https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation
3. Grokking : "Déverrouiller Grokking : une étude comparative des stratégies d'initialisation de poids dans les modèles de transformateur"
Adresse papier : https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
Adresse du code : https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking
3. Capacité de « dessin » insuffisante et difficulté à comparer avec précision les tailles de deux nombres
Limités par le niveau actuel de développement des grands modèles, les scientifiques en IA ont encore des lacunes.
Actuellement, les scientifiques en IA sont encoreAucune capacité de traitement visuel, il ne peut donc pas corriger automatiquement les éléments visuels ou les problèmes de mise en page des diagrammes dans votre article.
Par exemple, les graphiques générés manquent parfois de clarté, les tableaux peuvent dépasser les limites des pages et la mise en page globale est souvent encombrée. L’introduction de modèles de base multimodaux devrait résoudre fondamentalement ce problème.
De plus, lorsque les scientifiques en IA mettent en œuvre des idées ou effectuent des comparaisons de base, ils peuventRésultats trompeurs en raison d’un mauvais fonctionnement。
En même temps, il peut occasionnellement commettre des erreurs plus graves lors de la rédaction et de l’évaluation des résultats, commeDifficulté à comparer avec précision deux nombres, ce qui est un défaut connu des grands modèles. Pour atténuer ce problème, l'équipe s'est assurée que tous les résultats expérimentaux sont reproductibles et que tous les fichiers d'exécution ont été correctement enregistrés.
Dans le rapport, l’équipe a fourni une analyse approfondie des limites actuelles des scientifiques en IA et des défis auxquels ils pourraient être confrontés à l’avenir.
4. Les scientifiques de l'IA « jouent intelligemment » : ils modifient eux-mêmes les scripts, ce qui entraîne des risques pour la sécurité de l'IA.
L'équipe a également observé que les scientifiques en IA tentent parfois d'augmenter leurs chances de succès grâce à quelques « petites astuces », telles queModifiez et exécutez le script vous-même. Dans le document, l’équipe a discuté en profondeur des risques de sécurité de l’IA que ce comportement peut entraîner.
Par exemple, lors d'une exécution, ilJ'ai édité le code, se faisant exécuter dans une boucle infinie via des appels système.
Une autre fois, une expérience a pris trop de temps et était sur le point de dépasser le délai d’attente fixé par l’équipe. Cependant, au lieu d’optimiser le code pour améliorer l’efficacité, elle a tenté d’aboutir.Modifier le code pour prolonger le délai d'attente。
Voici quelques exemples spécifiques de ses tentatives de modification du code :
Ces problèmes peuvent être atténués en mettant en sandbox l’environnement d’exploitation des scientifiques en IA. Dans le rapport complet, l’équipe discute en profondeur de l’exécution de code sécurisé et du sandboxing.
Conclusion : les scientifiques en IA font leurs débuts et leurs capacités d'innovation subversive doivent être vérifiées
En ce qui concerne l'avenir, Sakana AI a déclaré que son objectif était d'appliquer les scientifiques de l'IA à des systèmes en boucle fermée avec des modèles ouverts afin de promouvoir l'auto-amélioration continue de l'IA. Les scientifiques en IA apporteront un nouveau monde scientifique entièrement piloté par l’IA. Il n’y aura pas seulement des chercheurs dotés de grands modèles de langage, mais aussi des évaluateurs, des chaires de recherche et même l’ensemble du système de conférences universitaires.
Mais Sakana AI ne pense pas que le statut des scientifiques humains en sera affaibli. Au contraire, avec l’émergence de nouvelles technologies, les rôles des scientifiques se diversifieront et ils passeront à des niveaux plus élevés dans le domaine de la recherche scientifique. L'automatisation du processus de découverte de la recherche scientifique et l'intégration de mécanismes d'examen basés sur l'IA ouvrent principalement la voie à l'innovation et aux solutions aux problèmes les plus difficiles dans le domaine de la science et de la technologie.
La version actuelle des scientifiques en IA a montré l'extraordinaire capacité d'innover sur la base de technologies matures telles que les modèles de diffusion et les transformateurs. Cependant, il faut encore du temps pour vérifier si de tels systèmes peuvent réellement proposer de nouvelles idées révolutionnaires.
Source : Sakana AI