notizia

Visita alla Nuova Produttività di Pechino·Fuori dal Laboratorio|Grande modello invisibile, produttività visibile

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nel 2017, l'intelligenza artificiale è stata inclusa per la prima volta nel rapporto di lavoro del governo cinese ed è diventata una strategia nazionale. Nel 2018, l'Istituto di ricerca sull'intelligenza artificiale di Pechino Zhiyuan (di seguito denominato "Zhiyuan") è nato in un piccolo ufficio all'avanguardia. spazio di innovazione. A quel tempo, il modello GPT di prima generazione lanciato da OpenAI non aveva ancora catturato i titoli dei media.

Nel 2023, Zhiyuan ha aggiornato il primo modello intelligente su larga scala del mio paese, "Wudao", alla versione 3.0, diventando una delle tre istituzioni di intelligenza artificiale più all'avanguardia al mondo nella mente del presidente di Microsoft Brad Smith. Nel campo dei modelli di grandi dimensioni, Zhiyuan è l’unico istituto di ricerca non aziendale al mondo a non essere supportato da un grande produttore. È anche il primo nuovo istituto di ricerca in Cina a organizzare sistematicamente e apertamente la ricerca e lo sviluppo di tecnologie per modelli di grandi dimensioni fonte di costruzione ecologica, formazione dei talenti e coltivazione delle imprese.

"La parità di diritti nella scienza e nella tecnologia ha sempre dato origine a grandi opportunità industriali in passato." Wang Zhongyuan, il nuovo presidente di Zhiyuan, che ha sia esperienza aziendale che un background in istituti di ricerca, ha una comprensione più profonda delle industrie basate sulla tecnologia. . Anche la definizione di intelligenza artificiale del Paese è più specifica: l’intelligenza artificiale è un motore importante per lo sviluppo di nuove forze produttive.


Lavora duro per stare al passo con la tempesta

Una o due volte, il CEO di Dark Side of the Moon Yang Zhilin è stato circondato dai partecipanti almeno tre volte alla Conferenza Zhiyuan di Pechino del 2024. Quando il fondatore di OpenAI Sam Altman ha tenuto un discorso video alla Conferenza Zhiyuan un anno fa, l'irrequietezza era altrettanto evidente. .

Dal 2023 al 2024, scienziati dell’intelligenza artificiale, amministratori delegati di importanti aziende tecnologiche e fondatori di start-up stellari si riuniranno in varie sedi per predicare sui grandi modelli, che siano esperti tecnici o meno, tutti sul palco ne hanno più o meno sentito parlare il nome Zhiyuan Molti di loro all’epoca erano direttamente coinvolti nei progetti di ricerca sui modelli su larga scala di Zhiyuan. Il CTO di Baidu Wang Haifeng una volta è stato direttore di Zhiyuan, Tang Jie, fondatore di Zhipu AI, è stato vicepresidente di Zhiyuan e Yang Zhilin ha partecipato alla ricerca e allo sviluppo di Wu Dao.

Questi trend setter dell’intelligenza artificiale non sono stati coinvolti in Zhiyuan proprio ora, e Zhiyuan non è stato coinvolto in modelli di grandi dimensioni solo dopo che sono diventati popolari.

Nel 2019, Zhiyuan ha iniziato a predisporre modelli di grandi dimensioni. Nel 2020, ha istituito un gruppo di ricerca Wudao e ha avviato la ricerca e lo sviluppo di modelli di grandi dimensioni. Nel marzo 2021 è stato lanciato per la prima volta il modello grande Wu Dao 1.0 e a giugno è stato lanciato Wu Dao 2.0. Wisdom ha utilizzato 1,75 trilioni di parametri per creare il record per il modello grande "più grande del mondo" all'epoca era il più avanzato di OpenAI modello di grandi dimensioni GPT-3 all'epoca 10 volte il numero di parametri.

La ricerca scientifica presta attenzione all'aspetto somatosensoriale, ponendo domande ed esprimendo giudizi. Il giudizio secondo cui "l'era dei grandi modelli di intelligenza artificiale sta arrivando" ha dato a Zhiyuan un coraggio senza riserve. Anche il termine cinese "grande modello" è stato proposto per primo da Zhiyuan.

Cos'è un modello grande? Huang Tiejun, presidente dello Zhiyuan Research Institute, ritiene che debbano essere soddisfatte tre condizioni: ampia scala, con parametri emergenti che superano le decine di miliardi, in grado di produrre nuove capacità inaspettate, versatili, non limitate a problemi o campi specializzati, in grado di gestire; Molti compiti diversi.

Nel 2023, i modelli di grandi dimensioni diventeranno visibili al pubblico. I modelli della serie Wudao sono stati aggiornati alla versione 3.0, coprendo modelli di grandi dimensioni di base come linguaggio, visione e multimodalità e sono completamente open source. Nella discussione sui modelli di base dell’epoca all’Università di Stanford, Intelligent Source fu classificata accanto a giganti della tecnologia come Google, Microsoft e Facebook (ora Meta), diventando l’istituzione rappresentativa per la ricerca di modelli di grandi dimensioni nel mondo.

"L'emergere della maggior parte dei risultati della ricerca nella storia è stato casuale e nessuno poteva pianificarlo. Tutti gli sforzi sono volti a migliorare la probabilità, a riunire ricercatori eccezionali e fornire loro un ambiente comunitario in cui possano scontrarsi idee, scoprire problemi e trovare partner collaborativi. "La prefazione scritta da Zhang Hongjiang, presidente fondatore dello Zhiyuan Research Institute, all'autobiografia del vincitore del Premio Turing Yann LeCun è più simile al motivo per cui Zhiyuan è arrivato primo.

Fai ingegneria di sistema

All’inizio del 2018, Pechino ha emanato le “Misure di attuazione di Pechino per sostenere la costruzione di nuove istituzioni di ricerca e sviluppo di livello mondiale” per realizzare una riforma radicale del sistema scientifico e tecnologico. A dicembre, con la guida e il sostegno del Ministero della Scienza e della Tecnologia e del Comitato del Partito e del Governo Municipale di Pechino, Zhiyuan è stata ufficialmente fondata.

In precedenza, il processo di gestione della ricerca scientifica era complesso, con lunghi cicli dalla proposta di progetto alla guida del rilascio alla richiesta di finanziamento e alla revisione, rendendo difficile l’adattamento alle mutevoli esigenze della ricerca scientifica in un ambiente altamente competitivo. Secondo questo sistema, l’istituto di ricerca presenta proposte di progetti nell’ottobre 2020 e la ricerca su modelli su larga scala non potrà essere lanciata ufficialmente prima del 2022. Il modello Zhiyuan ha impiegato meno di 5 mesi dalla definizione del progetto al lancio dei modelli di grandi dimensioni.

Si tratta di un nuovo tipo di istituto di ricerca e sviluppo tra università e imprese. Xin Zai non utilizza documenti come indice di valutazione finale, né utilizza prodotti come indice di valutazione, ma per costruire sistemi innovativi Xin Zai riunisce studiosi di diverse istituzioni e aziende come l'Università di Tsinghua, l'Università di Pechino, Facebook Artificial Intelligence Laboratory,; Baidu, ecc. Grandi cose: la novità è puntare su grandi problemi, mantenere uno sguardo attento sulle principali questioni scientifiche e fare piani lungimiranti.

"Il modello universitario è in vigore da decenni ed è difficile condurre una ricerca e sviluppo sistematica in modo organizzato, su larga scala e tra team. Anche le imprese investiranno in ricerca e sviluppo, ma sono più propense a fare attività di ricerca e sviluppo strettamente correlate legati agli affari. Zhiyuan ne farà 3 per Un progetto di ricerca che richiederà 5 anni o più per vedere i risultati", ha detto Wang Zhongyuan in un'intervista esclusiva con un giornalista del Beijing Business Daily.

Al momento, la fiducia di Zhiyuan risiede ancora nella determinazione del Paese nel campo dell’intelligenza artificiale. Nel marzo 2024, Li Qiang, membro del Comitato permanente dell’Ufficio politico del Comitato centrale del PCC e Premier del Consiglio di Stato, ha chiarito durante un’indagine a Pechino: L’intelligenza artificiale è un motore importante per lo sviluppo di nuove forze produttive .

La nuova produttività è uno stato di produttività avanzata in cui l’innovazione gioca un ruolo di primo piano, si allontana dalla tradizionale modalità di crescita economica e dal percorso di sviluppo della produttività, ha le caratteristiche di alta tecnologia, alta efficienza e alta qualità ed è conforme al nuovo concetto di sviluppo. È nato da scoperte tecnologiche rivoluzionarie, da un'allocazione innovativa dei fattori di produzione e da una profonda trasformazione e ammodernamento industriale. "La parità di diritti nella scienza e nella tecnologia ha creato ogni volta grandi opportunità industriali in passato, e modelli di grandi dimensioni possono portare una nuova uguaglianza nella scienza e nella tecnologia", crede fermamente Wang Zhongyuan.

Ad esempio, i modelli di grandi dimensioni sono portatori di "intelligenza", l'onda incentrata sull'intelligenza artificiale rappresenta le operazioni di intelligence, lo strato inferiore sono i sistemi software e hardware tecnici, lo strato superiore sono le applicazioni IA e i modelli di grandi dimensioni sono nel mezzo dei due, interpretando il ruolo di "tronco". L’importanza del modello di grandi dimensioni è trasformare l’”intelligenza” in servizi pubblici come acqua, elettricità e Internet e fornire servizi di intelligenza artificiale a un gran numero di imprese o individui attraverso il cloud computing.

Questo è un progetto sistematico. "Richiede investimenti concentrati di risorse e manodopera. Non può essere fatto da molte persone ma ognuno lo fa separatamente, ma deve essere formato un sistema tecnico." Huang Tiejun ha fatto un esempio: "Lo sviluppo dell'intelligenza artificiale lo è come la produzione dell'acciaio e la produzione di energia. È necessario un set completo di sistemi tecnici per garantire la produzione di acciaio di alta qualità e una produzione di energia stabile a un costo relativamente basso", ha affermato Huang Tiejun.

Andare oltre l'industria

Il sistema tecnico costruito da Zhiyuan comprende: secchio per famiglie di modelli di grandi dimensioni, sistema operativo di modelli di grandi dimensioni, set di dati, struttura di formazione, libreria di operatori, ecc. Questi risultati, la visione e gli obiettivi di Chi Yuan sono appesi al muro al primo piano del Chi Yuan Building.

La visione e gli obiettivi sono divisi in cinque sezioni principali, inclusi i meccanismi e lo sviluppo industriale, che possono essere riassunti come innovazione. "Zhiyuan vuole sviluppare la tecnologia di intelligenza artificiale più all'avanguardia, guidare e prevedere lo sviluppo dell'intelligenza artificiale e andare oltre l'industria." Wang Zhongyuan ha spiegato in dettaglio: "Zhiyuan farà cose che le università non possono fare e le aziende non sono disposte ricerca e sviluppo, progetti di ricerca che richiedono dai 3 ai 5 anni o anche di più per vedere i risultati."

A suo avviso, quando le capacità tecniche dei modelli di grandi dimensioni raggiungeranno un certo livello, ci saranno due direzioni principali: "Una direzione è quella di integrarsi con i prodotti, promuovere le applicazioni ed esercitare valore commerciale. D'altra parte, ce ne sono un numero limitato delle istituzioni che continuano a fare iterazione e ottimizzazione dei principali modelli di grandi dimensioni, siano esse imprese o istituti di ricerca, dovrebbero continuare ad affrontare le tecnologie chiave."

Ad esempio, nella multimodalità, la maggior parte delle aziende nazionali sceglie l’architettura DiT per la ricerca e lo sviluppo. "Questo perché DiT è un percorso collaudato. Zhiyuan spera di inserire diverse modalità di informazione, come testo, immagini, video e voci, in un unico modello per l'allenamento fin dall'inizio." Wang Zhongyuan ha utilizzato l'analogia del cervello umano, "Questo tipo di grande modello multimodale può vedere il mondo, comprendere e ragionare. In futuro, modelli di grandi dimensioni combinati con l'hardware, cioè l'intelligenza incarnata, potranno entrare nel mondo fisico per servire gli esseri umani. "

Le imprese restano vicine al mercato e cercano scenari verso l’alto, mentre le istituzioni di ricerca e sviluppo si concentrano sulle scoperte tecnologiche di base e forniscono supporto verso il basso. Wisdom Source appartiene al secondo tipo, che è lontano da applicazioni e scenari, ma utilizza l’open source come supporto. l'industria.

"L'intelligenza artificiale non è equivalente a modelli di grandi dimensioni, è solo un genere di intelligenza artificiale", ha spiegato Wang Zhongyuan a un giornalista del Beijing Business Daily. Oggi Intelligent Source si sta impegnando al massimo anche su altre tecnologie di intelligenza artificiale come la ricerca simile al cervello e il cuore digitale, il che significa che non esiste un limite superiore all'immaginazione dell'intelligenza artificiale in altri settori.

Wei Wei, giornalista del Beijing Business Daily