notizia

Meta rilascia Llama 3.1, il modello open source più forte, Zuckerberg: diventerà un punto di svolta per il settore

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

La sera del 23 luglio, ora di Pechino, Meta ha rilasciato ufficialmente l'ultimo modello open source della serie Llama 3.1, riducendo ulteriormente il divario tra i modelli open source e i modelli closed source. Llama 3.1 include 3 dimensioni dei parametri di 8B, 70B e 450B. Il modello di parametri 450B ha superato il GPT-4o di OpenAI in numerosi test benchmark ed è paragonabile ai principali modelli closed-source come Claude 3.5 Sonnet.


Il fondatore e CEO di Meta, Zuckerberg, ha pubblicato contemporaneamente un blog sul sito ufficiale per creare slancio per questa versione. Ha affermato che la versione Llama 3.1 diventerà un punto di svolta nel settore. La maggior parte degli sviluppatori inizierà a utilizzare principalmente open source l'intelligenza artificiale di origine è la direzione dello sviluppo.

Jim Fan, ricercatore senior di Nvidia, ha pubblicato un messaggio su X per congratularsi con il team Meta, affermando: "Il potere di GPT-4 è nelle nostre mani. (Questo è) un momento davvero storico".

In termini di dettagli specifici, la finestra di contesto del modello delle tre versioni di Llama 3.1 è aumentata da 8k a 128K, ampliata 16 volte e supporta 8 lingue contemporaneamente. Il modello Llama 3.1 -405B ha utilizzato più di 15 trilioni di token per l'addestramento e, per raggiungere questa scala di addestramento, il team ha utilizzato 16.000 GPU H100. Ufficialmente, il modello 405B è il primo modello di lama addestrato su questa scala.

I modelli linguistici di grandi dimensioni open source sono per lo più in ritardo rispetto ai modelli closed source in termini di funzionalità e prestazioni, “ma ora stiamo entrando in una nuova era guidata dall’open source”.

Nel blog ufficiale, Meta ha valutato le prestazioni di oltre 150 set di dati di riferimento e ha confrontato le prestazioni di Llama 3.1 con altri modelli. Il modello di punta Llama 3.1 -405B può competere con GPT in una serie di compiti come buon senso, operabilità, ecc. e matematica. -4, GPT-4o è paragonabile a Claude 3.5 Sonetto. Inoltre, i modelli piccoli 8B e 70B sono competitivi con i modelli closed source e open source con un numero simile di parametri.


Negli scenari di vita reale, Llama 3.1 405B è stato confrontato con la valutazione umana e le sue prestazioni complessive sono state migliori di GPT-4o e Claude 3.5 Sonnet.


Questa volta Meta ha aggiornato anche la licenza open source, consentendo agli sviluppatori di utilizzare per la prima volta l'output del modello Llama (incluso 405B) per migliorare altri modelli. Confrontando GPT-4o, i funzionari hanno affermato che utilizzeranno anche un metodo combinato per integrare le funzioni di immagine, video e voce in Llama 3, in modo che il modello possa riconoscere immagini e video e supportare l'interazione attraverso la voce. Tuttavia, questa funzionalità è ancora in fase di sviluppo e non è ancora pronta per il rilascio.

Nel blog ufficiale, Meta ha affermato che il totale dei download di tutte le versioni di Llama finora ha superato i 300 milioni di volte.

Oltre a questo modello di rilascio, Zuckerberg ha anche pubblicato un lungo articolo "Open Source AI Is the Path Forward" sul sito ufficiale, in cui menziona l'importanza dell'open source. Crede che l'open source sia vantaggioso per tutti gli sviluppatori, per Meta e al mondo.


Zuckerberg ha citato come esempio la vittoria del sistema open source Linux sul sistema closed source Unix e ritiene che l'intelligenza artificiale si svilupperà in modo simile. "Ci sono diverse aziende tecnologiche che sviluppano modelli chiusi leader, ma l'open source sta rapidamente colmando il divario." Ha affermato che l'anno scorso Llama 2 poteva essere paragonato solo al modello della generazione precedente. E quest'anno il Llama 3 è competitivo in alcune aree e addirittura davanti ai modelli più avanzati in alcune aree.

Zuckerberg ritiene che l'open source possa promuovere l'innovazione, ridurre i costi e migliorare la sicurezza. Per gli sviluppatori, l'utilizzo dell'open source consente di addestrare, perfezionare e distillare i propri modelli. Ogni organizzazione ha esigenze diverse e tali esigenze vengono soddisfatte al meglio utilizzando modelli di dimensioni diverse addestrati o ottimizzati su dati specifici. Di.

Allo stesso tempo, gli sviluppatori non sono vincolati a fornitori chiusi per proteggere la sicurezza dei dati. "Il software open source tende ad essere più sicuro perché il suo sviluppo è più trasparente e può essere ampiamente rivisto", ritiene Zuckerberg.

Zuckerberg ha anche affermato che il modello open source è più economico ed efficiente. Gli sviluppatori possono eseguire l'inferenza su Llama 3.1 405B sulla propria infrastruttura ad un costo di circa il 50% rispetto all'utilizzo di un modello chiuso come GPT-4o %, adatto all'interfaccia utente e attività di inferenza offline.

"L'intelligenza artificiale open source rappresenta la migliore opportunità al mondo." Secondo Zuckerberg, l'utilizzo di questa tecnologia può creare le maggiori opportunità economiche e di sicurezza.