notizia

La nuova prefazione di Zhu Jiaming: L'intelligenza artificiale e l'intelligenza umana iniziano a "condividere l'intelligenza" in otto tendenze principali | Fiera del libro di Shanghai 2024①

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"L'era del dialogo: la strada verso un paese forte forgiando nuova produttività" di Zhu Jiaming, Tao Hu, Shen Yang, ecc., pubblicato dalla Peking University Press nell'agosto 2024, al prezzo di 78 yuan
[Introduzione] La Fiera del Libro di Shanghai è in pieno svolgimento, con folle di persone all'interno e all'esterno della sala espositiva, e informazioni e spiriti a tutti i livelli fluiscono e contagiano.
Il nuovo libro "The Era of Dialogue: The Road to a Strong Country by Forging New Productivity", pubblicato dalla Peking University Press e compilato dai relatori della Wenhui Lecture Hall, è stato presentato alla fiera del libro e si è tenuto in Chang'an Street Reading Club il 14 agosto. Scopri l'elenco dei nuovi libri. Il libro è diviso in tre capitoli principali: l '"emergere" dell'intelligenza artificiale, lo sviluppo integrato dei mondi virtuale e reale e l'infrastruttura della tecnologia dell'intelligenza digitale. Si concentra principalmente sull'intelligenza artificiale, sui grandi modelli, sui chip, sulle interfacce cervello-computer , Web3, Internet via satellite, ecologia digitale e meta- L'universo, etica dell'IA e altri argomenti.
Quattordici conferenze, 41 esperti, studiosi ed élite del settore, tra cui Zhu Jiaming, Lin Baojun, Wang Jianyu, Shen Yang, Li Miao, Cai Hengjin, Lu Yong, Lin Longnian, Lin Yonghua, Tao Hu, Yang Guang, Wei Hui e Gli ospiti della conferenza He Liang, tra cui Ji Weidong, Feng Xiang, Jiang Xiaoyuan, Yu Hai, He Jing, Fu Changzhen, Li Quanmin, ecc., hanno fornito un'analisi approfondita dell'innovazione tecnologica e dell'innovazione tecnologica nei campi della tecnologia informatica di nuova generazione, artificiale intelligenza, aerospaziale, biomedicina, tecnologia quantistica, ecc. Lo sviluppo industriale, esplorando le frontiere, le tendenze e le sfide dello sviluppo globale dell'intelligenza artificiale, nonché questioni come la governance etica dell'intelligenza artificiale, aiuterà i lettori a comprendere il concetto e la connotazione di nuove forze produttive e il loro importante ruolo nel promuovere lo sviluppo della modernizzazione cinese. Questo libro incarna il dialogo tra scienza e tecnologia e discipline umanistiche e il collegamento tra sviluppo tecnologico e cambiamento sociale. È allo stesso tempo all'avanguardia e aiuta a comprendere il concetto e la connotazione della nuova produttività di qualità e il suo importante ruolo nel promuovere lo sviluppo della modernizzazione cinese.
Vale la pena ricordare in particolare che la prefazione di questo libro è lunga 17.000 parole ed è stata scritta personalmente da uno degli autori, l'economista Zhu Jiaming. Si concentra sulle frontiere, le tendenze e le sfide dello sviluppo dell'intelligenza artificiale dal 2022 al 2024, oltre ad approfondirle. on Le ultime informazioni contenute in questa prefazione sull’impatto dell’intelligenza artificiale sulla macroeconomia risalgono all’inizio di luglio 2024. In questa sezione vengono estratti dalla prefazione le frontiere, le tendenze e le sfide dello sviluppo dell’intelligenza artificiale.
Durante la fiera del libro, i lettori possono recarsi alla Peking University Press situata in E1-07, East Hall 1 per acquistare (con uno sconto del 40%) o ordinare su piattaforme online come Dangdang, JD.com e Taobao.
"The Age of Dialogue" alla Fiera del Libro di Shanghai, Peking University Press (Stand E1-07, East Hall 1)
L’intelligenza artificiale e l’intelligenza umana hanno iniziato a entrare negli otto principali trend della “co-intelligenza”
L’intelligenza artificiale è una parte importante della nuova produttività. L’intelligenza artificiale è una tecnologia globale che coinvolge pensiero, tecnologia, economia e società. La tecnologia dell'intelligenza artificiale è diversa dalla tecnologia agricola, dalla tecnologia industriale e dalla tecnologia dell'informazione nella storia umana. Ha avuto origine da una convinzione, un concetto e uno spirito dell'élite intellettuale dall'antica Grecia ai tempi moderni, ovvero l'intelligenza non è solo per gli esseri umani. esseri umani. Le macchine create possono anche produrre intelligenza, perché l’intelligenza alla fine può essere calcolata. La nascita della macchina di Turing nel 1936 è senza dubbio un evento fondamentale nella storia dell’intelligenza artificiale. Per più di 80 anni, per la società umana, l’intelligenza artificiale non ha significato solo una sorta di scienza e tecnologia, ma ha anche significato cambiamenti dirompenti nel pensiero, nell’economia e nella società. Dopo continue iterazioni ed evoluzioni, l’intelligenza artificiale ha e continuerà a dimostrare il significato storico dell’interazione tra lungimiranza e accelerazionismo. Questo articolo discute le frontiere, le tendenze e le sfide dello sviluppo globale dell’intelligenza artificiale dal 2022.
1. Modello linguistico grande (o modello grande)
Grande svolta a giugno: gli errori di "apprendimento per rinforzo" possono essere trovati e corretti
La storia dello sviluppo dell’intelligenza artificiale può essere suddivisa in diverse fasi. Nel novembre 2022, OpenAI ha rilasciato ChatGPT e l'intelligenza artificiale generativa (Generative Artificial Intelligence, GenAI) ha iniziato a fiorire. L’intelligenza artificiale generativa si basa sulla tecnologia di apprendimento automatico che imita le reti neurali umane per creare nuovi contenuti attraverso testo, immagini, musica, video, ecc.
Il rappresentante centralizzato di GenAI è il Large Language Model (LLM). Il cosiddetto modello linguistico di grandi dimensioni è un modello di deep learning addestrato sulla base di una grande quantità di dati di testo, che può generare testo in linguaggio naturale o comprendere il significato del testo in lingua. Si può anche dire che i grandi modelli linguistici si basano sull’apprendimento profondo e utilizzano reti neurali multistrato per identificare modelli complessi nei dati simulando il modo in cui il cervello umano elabora le informazioni.
In questa fase, il nucleo dell’intelligenza artificiale è il grande modello linguistico. I principali paesi e le principali aziende del mondo hanno guidato lo sviluppo di grandi modelli linguistici, mostrando una crescita esplosiva e formando un gruppo in continua espansione di grandi modelli linguistici. Le principali variabili che influenzano le prestazioni di modelli linguistici di grandi dimensioni sono i dati di addestramento, la dimensione del modello (ovvero il numero di parametri), gli algoritmi di generazione e le tecniche di ottimizzazione. Le caratteristiche dei modelli linguistici di grandi dimensioni includono: (1) Parametri di grandi dimensioni. Il numero di parametri per modelli linguistici di grandi dimensioni può spesso raggiungere miliardi o addirittura centinaia di miliardi. (2) Avere capacità di riconoscimento delle immagini e di analisi predittiva. (3) Avere la capacità di comprendere e generalizzare i dati. Può apprendere ed eseguire una serie di compiti complessi e ottenere traduzioni automatiche accurate ed efficienti, analisi del sentiment e domande e risposte intelligenti nell'elaborazione del linguaggio naturale (NLP).
ChatGPT, Gopher di Google, LaMDA e Llama di Meta sono rappresentanti globali di grandi modelli linguistici. Tra questi, GPT-4 rilasciato da OpenAI nel 2023 è il nome generale di una serie di modelli, non di un singolo modello. Nel maggio 2024, il modello GPT-4o lanciato da OpenAI ha dimostrato eccellenti capacità nell'elaborazione di centinaia di lingue in termini di comprensione di testo, parlato e immagini ed è stato in grado di condurre conversazioni vocali in tempo reale e catturare ed esprimere con precisione le emozioni umane . Nel giugno dello stesso anno, Anthropic lanciò ufficialmente il modello Claude 3.5 Sonnet, che superò Claude 3 Opus e GPT-4o in termini di capacità di codifica, capacità visive e nuove modalità di interazione. La cosa ancora più interessante è che Claude 3.5 Sonnet introduce l'innovativa funzionalità "Artifacts", che consente agli utenti di modificare e creare contenuti generati dall'intelligenza artificiale in tempo reale in uno spazio di lavoro dinamico, trasformando l'intelligenza artificiale conversazionale in un partner di collaborazione perfettamente integrato negli utenti. progetti e flusso di lavoro. In particolare, Claude 3.5 Sonnet ridefinisce anche il rapporto costo-prestazioni dei modelli intelligenti con una velocità doppia rispetto alla generazione precedente e un costo pari a 1/5.
Sempre a giugno è avvenuta una svolta nel campo dei modelli linguistici di grandi dimensioni: OpenAI ha rilasciato CriticGPT basato sul modello GPT-4, che viene utilizzato per rilevare errori nell'output del codice ChatGPT. In altre parole, CriticGPT è un modello che utilizza GPT-4 per trovare errori GPT-4. Non solo può scrivere i commenti degli utenti sui risultati della risposta ChatGPT, ma anche aiutare i formatori umani a comprendere e soddisfare meglio le intenzioni umane, a scoprirle e correggerle. Gli errori nell’apprendimento per rinforzo con feedback umano (RLHF) rappresentano un passo fondamentale verso l’obiettivo di valutare l’output di sistemi di intelligenza artificiale avanzati.
piattaforma 2.AI
Esistono nove piattaforme principali nel mondo e la tendenza è quella della verticalizzazione e della specializzazione.
Poiché l’intelligenza artificiale copre tutti gli aspetti della produzione e della vita umana, la costruzione di una piattaforma di intelligenza artificiale è diventata una tendenza generale. La piattaforma AI fornisce le tecnologie di intelligenza artificiale multimodali leader a livello mondiale come voce, immagine e PNL, nonché un sistema ed un ecosistema di intelligenza artificiale conversazionale aperti. Attualmente, ci sono nove principali piattaforme AI nel mondo fornite da Google, TensorFlow, Microsoft Azure, OpenAI, NVIDIA, H2O.ai, Amazon Web Services (AWS), DataRobot e Fotor. Tra questi, NVIDIA Omniverse è una piattaforma aperta progettata per la collaborazione virtuale e la simulazione realistica in tempo reale. Con l'aiuto di un potente ecosistema come GPU e software AI CUDAX, fornisce soluzioni leader del settore, tra cui machine learning e deep learning. e analisi dei dati.
Il trend di sviluppo delle piattaforme AI è principalmente la verticalizzazione e la specializzazione. Ad esempio, la piattaforma artistica AI è una piattaforma per l'elaborazione e la creazione di immagini attraverso la tecnologia dell'intelligenza artificiale, che aiuta artisti e non professionisti a generare rapidamente dipinti interessanti ed esteticamente preziosi sotto forma di dipinti di intelligenza artificiale, da cui possono formare quadri creativi ispirazione ed esperienza artistica, donando arte. Portando più innovazione e possibilità al mondo. Midjourney e Stable Diffusion sono piattaforme artistiche basate sull'intelligenza artificiale la cui influenza continua ad espandersi. Per fare un altro esempio, Suno v3.5 è uno strumento di generazione musicale AI. La durata della musica generata è stata modificata dai 2 minuti originali a 4 minuti e la struttura della musica è stata notevolmente ottimizzata. La piattaforma di generazione musicale AI è esperta nell'arte uditiva difficile da descrivere chiaramente a parole, dimostrando il suo potenziale creativo oltre quello umano. Suno ha annunciato che lancerà anche una nuova funzionalità che consentirà agli utenti di comporre canzoni con qualsiasi voce. Questa nuova funzionalità può trasformare vari suoni della vita quotidiana in musica, offrendo nuove possibilità per la creazione musicale.
3.Pila AI
I pilastri fondamentali includono: dati, calcoli e modelli
Dal punto di vista hardware, la base dello stack AI è GPU, CPU e TPU. La cosa più importante nello stack AI generativo è la GPU. Tuttavia, lo stack AI include anche un sistema software AI e lo stack AI finale costruito è un sistema ed un ecosistema.
Un’analisi approfondita mostra che lo stack AI è un quadro strutturato che contiene vari livelli e componenti necessari per sviluppare e implementare sistemi di intelligenza artificiale. I componenti chiave dello stack AI includono la gestione dei dati, le risorse informatiche, i framework di machine learning e le piattaforme di operazioni di machine learning (MLOps). Lo stack dell'IA generativa è composto da tre livelli: superiore, centrale e inferiore. Lo strato superiore coinvolge conoscenze e competenze in campi specifici, lo strato intermedio fornisce dati e infrastrutture che possono essere utilizzati per costruire modelli di intelligenza artificiale e lo strato inferiore è costituito da risorse e servizi di cloud computing. Fare progressi a ogni livello è fondamentale per far progredire l’IA. I pilastri fondamentali dello stack AI includono: dati, calcolo e modelli. Tra questi, l’intelligenza artificiale generativa richiede una grande quantità di risorse informatiche e grandi set di dati, che vengono elaborati e archiviati in data center ad alte prestazioni promuove la rimodellazione dell’intero stack.
In generale, sulla base dello stack AI, è possibile creare applicazioni di intelligenza artificiale con funzionalità come ricerca veloce, traduzione veloce, riconoscimento intelligente e controllo intelligente.
4.Simulatore del mondo fisico
Il terzo è il mondo fisico dell’AI: oltre la percezione spazio-temporale umana
Per gli esseri umani contemporanei, ci sono tre mondi: il mondo reale dell’esperienza, il mondo virtuale e il mondo fisico oltre la percezione umana del tempo e dello spazio. L’intelligenza artificiale influenza direttamente la relazione tra gli esseri umani e i tre mondi sopra menzionati. Nel mondo reale dell'esperienza, il parallelismo e l'interazione dell'intelligenza artificiale e dell'intelligenza naturale hanno cambiato il modo in cui esiste il mondo reale; nel mondo virtuale, l'intelligenza artificiale e la tecnologia della realtà virtuale possono guidare gli esseri umani in uno stato irreale di esperienza immersiva, tra cui il metaverso è un modo; nel mondo fisico che trascende la percezione umana del tempo e dello spazio, l'intelligenza artificiale può aiutare gli esseri umani a superare i limiti dei sensi e comprendere l'universo con decine di miliardi di anni luce come scala e scene microscopiche con nanometri come unità di misura. Nel campo degli esperimenti scientifici, la tecnologia dell’intelligenza artificiale non è più solo uno strumento, ma un prerequisito.
Il significato fondamentale dell'apparizione di Sora all'inizio del 2024 è che, attraverso la sua funzione di simulatore del mondo fisico, mostra un mondo fisico che gli esseri umani potrebbero non percepire, un mondo fisico che probabilmente è più reale di quello che gli occhi umani possono vedere. Una volta che gli esseri umani percepiranno e si integreranno nel mondo creato dal motore fisico dell’intelligenza artificiale, sperimenteranno regole fisiche più diverse.
Quando Sora esegue compiti di generazione video, basandosi sul supporto di moduli di percezione, memoria e controllo, i video generati possono seguire in una certa misura le leggi fisiche del mondo reale, il che lo rende più capace di simulare persone, animali, ambienti, ecc. nel mondo reale. L'ampio spazio dell'immaginazione realizza fondamentalmente la coerenza spaziale, la coerenza temporale e la coerenza causale. Sora è un modello mondiale leggibile. Quanto bene sta andando in questa fase non è l’essenza del problema. Dopo il rilascio di Open-Sora 1.1, la qualità e la durata della generazione dei video sono state notevolmente migliorate. L'architettura VAE Causal Video ottimizzata migliora notevolmente le prestazioni di Sora e l'efficienza dell'inferenza.
Uno degli importanti contributi di NVIDIA è il completamento del modello terrestre gemello digitale Earth-2. Earth-2 combina il modello AI generativo CorrDiff ed è addestrato sulla base della simulazione numerica WRF, che può prevedere con precisione le informazioni meteorologiche con una risoluzione 12 volte maggiore (aumentata da 25 chilometri a 2 chilometri). Il prossimo passo per Terra-2 è migliorare la precisione della previsione da 2 chilometri a decine di metri. La risoluzione è più elevata, la velocità di funzionamento è 1000 volte superiore a quella della simulazione fisica e l'efficienza energetica è 3000 volte superiore, il che significa che è possibile prevederla in tempo reale.
La visione è molto chiara: gli esseri umani costruiscono come complessi di percezione/memoria/controllo, con la capacità di costruire "modelli del mondo" realistici e fisicamente corretti. È in questo senso che lo scienziato Microsoft Sébastien Bubeck ha proposto il concetto e la direzione della ricerca della “fisica dell’intelligenza artificiale”. Il CEO di NVIDIA Jensen Huang ha anche proposto che la prossima ondata di intelligenza artificiale sarà quella fisica. Pertanto, il gemello digitale di Nvidia prende di mira non solo la terra, ma anche l’intero mondo fisico.
5. Intelligenza incarnata e robot intelligenti
L'applicazione definitiva: lasciare che l'intelligenza artificiale diventi "umana"
Lo sviluppo dell’intelligenza artificiale porterà inevitabilmente alla formazione di un ecosistema di intelligenza artificiale. L'intelligenza artificiale incorporata (EAI) o robot intelligenti sono diventati il ​​corpo principale dell'ecosistema dell'intelligenza artificiale.
L'intelligenza incarnata è un'ulteriore estensione dell'intelligenza artificiale nel mondo fisico. È un sistema intelligente in grado di comprendere, ragionare e interagire con il mondo fisico. Ha la capacità di interazione uomo-computer e di comprensione del linguaggio naturale per realizzare il pensiero, la percezione e azione. Inoltre, i robot intelligenti impareranno simulando i percorsi di pensiero umani e forniranno feedback comportamentali attesi dagli esseri umani. Guidati dall’intelligenza artificiale multimodale, potranno apprendere da soli, percepire il mondo, comprendere ed eseguire istruzioni umane e completare compiti personalizzati e requisiti di collaborazione. Evoluzione continua. Cioè, eseguire una varietà di compiti che possono essere ispezionati e misurati in un ambiente fisico reale. In breve, la caratteristica dell'intelligenza incarnata è la capacità di percepire autonomamente il mondo fisico dal punto di vista del protagonista.
Per quanto riguarda le varie forme di robot intelligenti, si tratta di forme fisiche di intelligenza incarnata. La loro architettura complessiva è costituita da uno strato di percezione, uno strato di interazione e uno strato di movimento. Il robot umanoide di Tesla "Optimus Prime" si è sviluppato dalla prima alla seconda generazione, la startup americana di robot umanoidi Figure AI ha ricevuto un enorme investimento nel febbraio di quest'anno e NVIDIA ha esposto 25 robot umanoidi alla Global Technology Conference (GTC) del 2024. Tutti mostrano il rapido sviluppo del campo dei robot umanoidi.
Nel marzo 2024, NVIDIA ha lanciato il primo modello base universale al mondo di robot umanoide, il Progetto GR00T. Il robot basato su modello è in grado di comprendere il linguaggio naturale e imitare le azioni osservando il comportamento umano e gli utenti possono insegnargli a imparare rapidamente a coordinare varie abilità per adattarsi e interagire con il mondo reale. L’emergere del Progetto GR00T indica che la vera era dei robot potrebbe essere alle porte. Questa è anche l’applicazione definitiva dell’intelligenza artificiale: rendere l’intelligenza artificiale un “umano”.
L’ascesa dell’intelligenza incarnata segna il passaggio dalla tradizionale tecnologia robotica basata sul controllo a un nuovo paradigma di apprendimento e funzionamento. L’esplosione della tecnologia dei grandi modelli e la riduzione dei costi dell’hardware hanno portato alla nascita di società di intelligenza artificiale che mirano a sviluppare robot intelligenti in grado di interagire con il mondo fisico.
Nel maggio 2024 si terrà a Yokohama, in Giappone, la Conferenza internazionale sulla robotica e l'automazione (IEEE ICRA), una delle conferenze accademiche internazionali più influenti nel campo della robotica. Il tema della conferenza di quest'anno "CONNECT+" non solo mette in mostra gli ultimi progressi nella tecnologia robotica, ma anche una rivoluzione nell'"intelligenza incarnata" e nell'"apprendimento". Nel lungo termine, l’intelligenza incarnata è di grande importanza per lo sviluppo del settore dell’intelligenza artificiale e ha un valore che non può essere ignorato per l’intelligenza generale artificiale (AGI).
6. Intelligenza spaziale
Più che una semplice versione meccanica dell'occhio umano, rivela il mondo da un'angolazione mai immaginata
Esistono due tipi di intelligenza spaziale: una è l'intelligenza spaziale formata dall'evoluzione naturale. La natura ha impiegato milioni di anni perché gli esseri umani evolvessero l’intelligenza spaziale. Gli occhi catturano la luce e proiettano immagini 2D sulla retina, mentre il cervello converte questi dati in informazioni 3D. L’altra è l’intelligenza spaziale basata sulla tecnologia dell’intelligenza artificiale, in cui le macchine simulano il ragionamento e le azioni visive complesse umane e comprendono e gestiscono direttamente il mondo 3D attraverso informazioni visive con l’assistenza di più sensori.
Confrontando l'intelligenza spaziale formata dall'evoluzione naturale e l'intelligenza spaziale basata sulla tecnologia dell'intelligenza artificiale, la differenza è significativa: l'intelligenza spaziale formata dall'evoluzione naturale è limitata nella dimensione spaziale ed è difficile o addirittura impossibile sfondare lo spazio 3D . Tuttavia, l’intelligenza spaziale basata sulla tecnologia dell’intelligenza artificiale può sfondare la dimensione spaziale. Tale spazio rompe i confini geografici e si trova in uno stato fluido, illimitato, libero e aperto. Non solo, tale spazio non è più soggetto ai vincoli temporali di Newton, ottenendo tempestività e ottimizzazione del tempo. Ad esempio, i ricercatori di Google hanno sviluppato un algoritmo in grado di trasformare i dati in forme o scene 3D utilizzando solo una serie di foto.
A questo proposito, Li Feifei, direttore dello Human-Centered AI Research Institute dell'Università di Stanford (accademico della National Academy of Engineering), ha le seguenti profonde riflessioni: "Combinare l'acuità visiva con la profondità della conoscenza enciclopedica può portare alla nascita di un marchio nuova capacità. Non si sa ancora quali saranno le nuove capacità, ma credo che sarà più di una semplice versione meccanica dell'occhio umano. Sarà un nuovo tipo di esistenza, una prospettiva più profonda e raffinata. in grado di vedere da angolazioni che non avremmo mai immaginato. Rivelando il mondo. "Vale a dire, l'intelligenza spaziale basata sulla tecnologia dell'intelligenza artificiale sfondarà l'intelligenza spaziale formata dall'evoluzione naturale e rivelerà uno stato spaziale per il quale gli esseri umani non possono fare affidamento sul loro cervello. immaginare. Ad esempio, lo spazio quantistico descritto dalla meccanica quantistica si riferisce ad uno spazio con caratteristiche topologiche composto da alcuni stati discreti o continui. È impossibile per l’intelligenza spaziale che gli esseri umani hanno evoluto naturalmente percepire e riconoscere lo spazio quantistico, ma è possibile per l’intelligenza spaziale supportata dalla tecnologia dell’intelligenza artificiale.
In breve, l’intelligenza spaziale basata su grandi modelli di intelligenza artificiale conduce gli esseri umani in “una nuova esistenza”, e l’intelligenza incarnata è probabilmente quella “aborigena”.
7. Evoluzione profonda dell'intelligenza artificiale
La legge di Moore può essere infranta, la metacognizione porta al fallimento della legge di scala
L’intelligenza artificiale è in un momento storico di profonda evoluzione. La legge di Moore e la legge di scala stanno gradualmente giocando un ruolo sempre più importante.
La legge di Moore è una regola riassunta dal cofondatore di Intel Gordon Moore sulla base dell'esperienza, ovvero il numero di transistor che possono essere alloggiati su un circuito integrato raddoppierà all'incirca ogni 18-24 mesi. In altre parole, le prestazioni del processore raddoppiano circa ogni due anni. Il problema è che quando i chip arrivarono a 28 nanometri (nm), si verificò una crisi dovuta alla Legge di Moore. Quando il chip entra nel chip di processo da 1 nanometro, significa raggiungere il limite della Legge di Moore. Ora l'intera base hardware dell'intelligenza artificiale con i chip come nucleo si trova ad affrontare una crisi della Legge di Moore o un limite della Legge di Moore. Nel giugno 2024, al Taipei International Computer Show 2024 (Computex 2024), il CEO di Nvidia Jen-Hsun Huang ha annunciato che la frequenza di aggiornamento della sua architettura GPU aumenterà da ogni due anni a una volta all'anno, ma la crescita della potenza di calcolo non è diminuita. stagnante, e la sua intelligenza artificiale La potenza di calcolo dei chip ha raggiunto un sorprendente aumento di 1.000 volte negli ultimi otto anni, il che dimostra che esiste una possibilità tecnologica per superare la crisi della Legge di Moore e i limiti della Legge di Moore.
La legge di scala coinvolge principalmente lo studio dei fenomeni critici. La sua idea centrale è che all'aumentare della dimensione dei parametri del modello, della dimensione del set di dati e della quantità di calcoli in virgola mobile utilizzati per l'addestramento, le prestazioni del modello miglioreranno. . Per prestazioni ottimali, i tre fattori precedenti devono essere amplificati simultaneamente. Quando non è vincolata dagli altri due fattori, la prestazione del modello ha una relazione di legge di potenza con ogni singolo fattore.
Nello specifico del campo dell'intelligenza artificiale, la previsione delle prestazioni di GPT-4 su problemi specifici può essere prevista da un modello 1.000 volte più piccolo di GPT-4. In altre parole, GPT-4 non ha ancora iniziato l'addestramento e le sue prestazioni su questo problema sono già note. Pertanto, le leggi di scala sono importanti per l'addestramento di modelli di grandi dimensioni. Si può dire che la legge di scala è un’altra legge potenziale per l’evoluzione profonda dell’intelligenza artificiale.
Non molto tempo fa, Bill Gates espresse una visione profonda sulla legge di scala in un episodio del podcast The Next Big Idea: "La legge di scala continuerà sicuramente ad essere valida. Ma allo stesso tempo, da quello che sappiamo oggi Ci sarà essere un passaggio da semplici algoritmi ad azioni metacognitive più simili a quelle umane, che è una frontiera più grande "Perché la coscienza può essere correlata alla metacognizione, e la metacognizione non è un fenomeno misurabile". In altre parole, la metacognizione fa fallire la legge di scala.
8. Tendenze a breve e medio termine
La fase generale dell'IA sta accelerando ed è apparsa "l'alba" della super IA
Giunti al 2024, possiamo generalmente vedere le tendenze a breve e medio termine dell’intelligenza artificiale:
(1) La fase dell’intelligenza artificiale ristretta (ANI) sta giungendo al termine. In questa fase, l’intelligenza artificiale è un sistema di intelligenza artificiale in grado di eseguire compiti specifici, come il riconoscimento delle immagini o il riconoscimento vocale. Il culmine di questa fase è l’emergere di grandi modelli che supportano l’intelligenza artificiale generativa e la divulgazione delle macchine intelligenti.
(2) La fase dell’intelligenza artificiale generale sta accelerando.
(3) L'alba della Super Intelligenza Artificiale (ASI) è apparsa all'orizzonte. La super intelligenza artificiale ha la capacità di superare la "mente umana", raggiungere e superare rapidamente l'intelligenza collettiva di tutta l'umanità ed è un sistema di intelligenza artificiale più potente dell'intelligenza umana.
L'intelligenza artificiale è già in un periodo storico in cui l'immaginazione delle persone si rinnova ogni giorno. Durante questo periodo, i soggetti e i sistemi di riferimento del mondo cambieranno finora, il sistema della conoscenza sarà ricostruito, l'intelligenza umana e l'intelligenza artificiale inizieranno ad entrare in uno stato di "co-intelligenza", e le organizzazioni economiche tradizionali, i sistemi nazionali e i sistemi giuridici Si verificheranno anche dei cambiamenti e la civiltà umana verrà addirittura riorganizzata in futuro.
Zhu Jiaming
6 luglio 2024
(Titolo e sottotitolo della prefazione originale sono stati integrati e perfezionati dal curatore)
Autore: Zhu Jiaming
Testo: Zhu Jiaming Immagini: Zhu Meiquan Redattore: Li Nian Redattore: Li Nian
Si prega di indicare la fonte quando si ristampa questo articolo.
Segnalazione/feedback