Le mie informazioni di contatto
Posta[email protected]
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
cose intelligenti
Autore Li Shuiqing
Redattore Yunpeng
Ogni volta che l’intelligenza artificiale fa progressi significativi, i ricercatori spesso scherzano: “Quando permetteremo all’intelligenza artificiale di scrivere articoli per noi?”
Ora,L’intelligenza artificiale crea documenti di ricerca scientificaè diventata una realtà e il costo di scrittura è di soli ca.$ 15。
Wisdom News il 14 agosto, il 13 agosto, il team giapponese Sakana AI ha collaborato con ricercatori dell'Università di Oxford e dell'Università della British Columbia per lanciare unLo scienziato dell'intelligenza artificiale, che è un agente di ricerca scientifica automatizzato (Agente) basato su un modello di grandi dimensioni.
Dategli un ampio campo di ricerca e potrà creare un articolo nel campo dell'intelligenza artificiale proprio come un essere umano.
“Programmatore AI"Le competenze di programmazione sono solo una parte delle capacità degli scienziati dell'intelligenza artificiale.Brainstorming, esecuzione del codice, riepilogo dei risultati sperimentali, visualizzazione, revisione automaticaNon è un grosso problema.
Ad esempio, il seguente articolo intitolato "Dualscale Diffusion: Adaptive feature Balancing for low-dimensional generative models" è stato scritto da scienziati dell'intelligenza artificiale. Negli esperimenti completati in modo indipendente dagli scienziati dell’intelligenza artificiale e revisionati da colleghi, gli articoli completati hanno ottenuto eccellenti risultati empirici e sono stati in grado di raggiungereL'apprendimento automatico soddisfa il criterio di "accettazione debole".。
Indirizzo del documento: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Il team ha citato vari modelli all'avanguardia nel progetto dello scienziato AI, come ad esempioGPT-4o e Sonettoecc. modelli closed source eDeepSeek e Lama 3e altri modelli open source.
È stato riferito che gli scienziati dell'IA hanno principalmente i seguenti punti salienti:
1. Questo è aCompletamente alimentato dall'intelligenza artificialesistema di ricerca scientifica automatizzato, concentrandosi suCampo dell'apprendimento automaticoricerca.
2. Si realizzaStudiare l'automazione dell'intera catena, dall'ispirazione, alla scrittura e all'esecuzione del codice, al riepilogo e alla visualizzazione dei risultati sperimentali, fino alla scrittura di un articolo scientifico completo.
3. Presenta in modo innovativoMeccanismo automatizzato di peer review, utilizzato per valutare i documenti in uscita, fornire feedback e ottimizzare continuamente i risultati,L’accuratezza della valutazione è vicina al livello umano。
4. Questo processo di ricerca scientifica automatizzatoCiclo continuo, aprire e accumulare continuamente conoscenza e simulare il modello operativo della comunità scientifica umana.
5. Nei test preliminari è stato coinvolto nell'apprendimento automaticoOttieni risultati in più campi, come inModello di diffusione, architettura del trasformatore e GrokkingContributi sono stati forniti in altri campi.
Indirizzo del documento dello scienziato sull'intelligenza artificiale: https://arxiv.org/abs/2408.06292/
Codice open source dello scienziato AI e indirizzo dei risultati sperimentali: https://github.com/SakanaAI/AI-Scientist
▲L'articolo "Scienziato dell'intelligenza artificiale: verso una scoperta scientifica aperta e completamente automatizzata"
1. Completa il documento di ricerca scientifica in 4 passaggi e soddisfa gli standard di accettazione dell'AI Summit
Ho sentito parlare di poeti dell’intelligenza artificiale, pittori dell’intelligenza artificiale, programmatori dell’intelligenza artificiale e ora sono comparsi anche scienziati dell’intelligenza artificiale.
AI Scientist è un sistema di generazione di carta completamente automatizzato che sfrutta appieno modelli di grandi dimensioni all'avanguardia.
EssoInizia con una base di codice iniziale di base, come il codice di ricerca open source già pronto su GitHub, purchédato unAmpi ambiti di ricerca, gli scienziati dell'intelligenza artificiale possono completare l'attività daConcezione creativa, ricerca bibliografica, progettazione sperimentale, iterazione sperimentale, produzione di grafici, stesura di un articolo fino alla revisione preliminareL'intero processo di lavoro viene svolto per produrre articoli accademici ricchi di approfondimenti profondi.
Ciò che è ancora più sorprendente è che gli scienziati dell’intelligenza artificiale possono farloFunzionamento continuo in ciclo aperto, apprende continuamente idee e feedback precedenti per ottimizzare le idee di ricerca successive. Questo processo è altamenteSimula il modello operativo della comunità scientifica umana。
▲Diagramma del modello dello scienziato dell'intelligenza artificiale
Il flusso di lavoro di uno scienziato dell'intelligenza artificiale include principalmenteQuattro collegamenti principali:
La creatività germoglia:Partendo dal modello di partenza fornito, gli scienziati dell'intelligenza artificiale avvieranno la modalità "brainstorming" e scopriranno una serie di nuove direzioni di ricerca su argomenti esistenti. Questo modello non contiene solo la struttura del codice di base, ma viene fornito anche con una cartella LaTeX contenente file di stile e preimpostazioni dei titoli dei capitoli, ponendo le basi per la successiva scrittura dell'articolo. Nel processo di esplorazione libera, gli scienziati dell’IA utilizzeranno anche il motore di ricerca accademico Semantic Scholar per garantire l’originalità delle idee proposte.
Iterazione dell'esperimento:Una volta determinata la direzione della ricerca, gli scienziati dell’IA entrano nella fase sperimentale. Esegue automaticamente piani sperimentali, raccoglie dati e genera grafici per visualizzare visivamente i risultati sperimentali. Allo stesso tempo, gli scienziati dell’intelligenza artificiale registreranno in dettaglio il contenuto di ciascun grafico per garantire che le note sperimentali e i materiali grafici possano fornire un supporto completo per la successiva stesura della carta.
Scrittura cartacea:Una volta completato l'esperimento, lo scienziato AI utilizzerà il formato LaTeX per scrivere un articolo con una struttura chiara e contenuti dettagliati per mostrare ai lettori i risultati della ricerca. Durante il processo di scrittura, utilizzerà anche Semantic Scholar per cercare e citare automaticamente la letteratura in campi correlati per migliorare la natura accademica e autorevole dell'articolo.
Revisione automatica:Per migliorare la qualità degli articoli, il team ha sviluppato appositamente un sistema di revisione automatizzato basato su un ampio modello linguistico. Il sistema è in grado di valutare oggettivamente i documenti generati con un giudizio quasi umano e fornire suggerimenti per il miglioramento. Questo feedback non solo aiuta gli scienziati dell’intelligenza artificiale a ottimizzare i progetti attuali, ma fornisce anche un prezioso riferimento per la ricerca futura. Attraverso questo ciclo di feedback continuo, gli scienziati dell’intelligenza artificiale possono migliorare e potenziare continuamente in modo iterativo il livello e l’impatto dei risultati della ricerca.
Se combinati con la tecnologia LLM all'avanguardia, gli scienziati dell'intelligenza artificiale sono persino in grado di scrivereCriteri di "accettazione debole" per le principali conferenze sul machine learningtesi e superatoIl sistema di revisione automatizzata ottiene il riconoscimento。
2. Presentazione di articoli da parte di scienziati dell'IA: riguardanti modelli di diffusione, modellizzazione del linguaggio e altri campi
Nell'annuncio, il team ha presentato una serie di documenti nel campo dell'apprendimento automatico generato dagli scienziati dell'intelligenza artificiale, dimostrando le sue capacità di ricerca scientifica in campi come i modelli di diffusione, la modellazione del linguaggio e Grokking.
1. Modello di diffusione: "DualScale Diffusion: bilanciamento delle caratteristiche adattive di modelli generativi a bassa dimensione"
Indirizzo del documento: https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
Indirizzo del codice: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising
2. Modellazione del linguaggio: "StyleFusion: generazione multi-stile adattiva in modelli linguistici a livello di carattere"
Indirizzo del documento: https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
Indirizzo del codice: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter
Modellazione del linguaggio: "Implementazione del tasso di apprendimento adattivo di Transformer attraverso Q-Learning"
Indirizzo del documento: https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
Indirizzo del codice: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation
3. Grokking: "Sbloccare Grokking: uno studio comparativo delle strategie di inizializzazione del peso nei modelli di trasformatori"
Indirizzo del documento: https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
Indirizzo del codice: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking
3. Insufficiente capacità di “disegno” e difficoltà nel confrontare accuratamente le dimensioni di due numeri
Limitati dall’attuale livello di sviluppo di modelli di grandi dimensioni, gli scienziati dell’IA presentano ancora dei limiti.
Attualmente, gli scienziati dell’IA sono fermiNessuna capacità di elaborazione visiva, pertanto non può correggere automaticamente gli elementi visivi o i problemi di layout del diagramma nel documento.
Ad esempio, i grafici generati a volte mancano di chiarezza, le tabelle possono superare i limiti della pagina e il layout generale della pagina è spesso disordinato. Si prevede che l’introduzione di modelli di base multimodali risolva radicalmente questo problema.
Inoltre, quando gli scienziati dell’IA implementano idee o conducono confronti di base, possono farloRisultati fuorvianti dovuti a un funzionamento improprio。
Allo stesso tempo, può occasionalmente commettere errori più gravi durante la scrittura e la valutazione dei risultati, come ad esempioDifficoltà nel confrontare accuratamente due numeri, che è un difetto noto dei modelli di grandi dimensioni. Per mitigare questo problema, il team ha assicurato che tutti i risultati sperimentali fossero riproducibili e che tutti i file di esecuzione fossero stati salvati correttamente.
Nel rapporto, il team ha fornito un’analisi approfondita degli attuali limiti degli scienziati dell’intelligenza artificiale e delle sfide che potrebbero affrontare in futuro.
4. Gli scienziati dell’IA stanno “giocando in modo intelligente”: modificando gli script da soli, causando rischi per la sicurezza dell’IA
Il team ha anche osservato che gli scienziati dell'intelligenza artificiale a volte cercano di aumentare le possibilità di successo attraverso qualche "piccola intelligenza", ad esempioModifica ed esegui tu stesso lo script. Nel documento, il team ha discusso approfonditamente dei rischi per la sicurezza dell’IA che questo comportamento potrebbe comportare.
Ad esempio, durante un'esecuzione, in realtàModificato il codice, facendosi girare in un loop infinito attraverso le chiamate di sistema.
Un'altra volta, un esperimento ha richiesto troppo tempo e stava per superare il limite di timeout stabilito dal team. Tuttavia, invece di ottimizzare il codice per migliorare l'efficienza, ha tentato di superarloModificare il codice per estendere il timeout。
Ecco alcuni esempi specifici dei suoi tentativi di modificare il codice:
Questi problemi possono essere alleviati rendendo sandboxing l’ambiente operativo degli scienziati dell’IA. Nel rapporto completo, il team discute in modo approfondito dell’esecuzione sicura del codice e del sandboxing.
Conclusione: gli scienziati dell’intelligenza artificiale fanno il loro debutto e le loro capacità di innovazione sovversiva devono essere verificate
Guardando al futuro, Sakana AI ha affermato che il suo obiettivo è applicare gli scienziati dell’IA a sistemi a circuito chiuso con modelli aperti per promuovere il continuo auto-miglioramento dell’IA. Gli scienziati dell’intelligenza artificiale porteranno un nuovo mondo della scienza che sarà completamente guidato dall’intelligenza artificiale. Non ci sono solo ricercatori potenziati da grandi modelli linguistici, ma anche revisori, presidenti sul campo e persino l’intero sistema di conferenze accademiche.
Ma Sakana AI non crede che lo status degli scienziati umani ne verrà indebolito. Al contrario, con l’emergere delle nuove tecnologie, i ruoli degli scienziati diventeranno più diversificati e si sposteranno a livelli più alti nel campo della ricerca scientifica. L’automazione del processo di scoperta della ricerca scientifica e l’integrazione di meccanismi di revisione guidati dall’intelligenza artificiale aprono principalmente la strada all’innovazione e alle soluzioni ai problemi più difficili nel campo della scienza e della tecnologia.
L’attuale versione degli scienziati dell’IA ha dimostrato la straordinaria capacità di innovare sulla base di tecnologie mature come modelli di diffusione e Transformers. Tuttavia, ci vuole ancora tempo per verificare se tali sistemi possono davvero produrre nuove idee dirompenti.
Fonte: Sakana AI