Meta julkaisee tehokkaimman avoimen lähdekoodin mallin Llama 3.1, Zuckerberg: Siitä tulee käännekohta teollisuus

Meta julkaisee Llama 3.1:n, vahvimman avoimen lähdekoodin mallin, Zuckerberg: Siitä tulee käännekohta teollisuudelle

2024-07-24

Heinäkuun 23. päivän iltana Pekingin aikaa Meta julkaisi virallisesti uusimman avoimen lähdekoodin suuren mallin Llama 3.1 -sarjan, mikä kaventaa entisestään avoimen lähdekoodin mallien ja suljetun lähdekoodin mallien välistä kuilua. Llama 3.1 sisältää kolme parametrikokoa: 8B, 70B ja 450B. 450B-parametrimalli on ylittänyt OpenAI:n GPT-4o:n useissa vertailutesteissä ja on verrattavissa johtaviin suljetun lähdekoodin malleihin, kuten Claude 3.5 Sonnetiin.

Metan perustaja ja toimitusjohtaja Zuckerberg julkaisi samalla blogin virallisille verkkosivuille. Hän sanoi, että Llama 3.1 -versiosta tulee käännekohta alalla lähde-AI on tulevaisuuden suunta.

Nvidian vanhempi tutkija Jim Fan lähetti viestin X:ään onnitellakseen Meta-tiimiä. Hän mainitsi: "GPT-4:n voima on käsissämme. (Tämä on) todella historiallinen hetki."

Tarkemmin sanottuna Llama 3.1:n kolmen version mallikontekstiikkuna on kasvanut 8 000:sta 128 000:aan, laajennettu 16 kertaa ja tukee 8 kieltä samanaikaisesti. Llama 3.1 -405B -mallissa käytettiin koulutukseen yli 15 biljoonaa tokenia, ja tämän koulutusasteikon saavuttamiseksi tiimi käytti 16 000 H100 GPU:ta. Virallisesti 405B-malli on ensimmäinen Llama-malli, joka on koulutettu tässä mittakaavassa.

Avoimen lähdekoodin suuret kielimallit jäävät toiminnallisuudeltaan ja suorituskyvyltään enimmäkseen jälkeen suljetun lähdekoodin malleista, "mutta nyt astumme uuteen aikakauteen avoimen lähdekoodin johdolla."

Virallisessa blogissa Meta arvioi yli 150 vertailutietojoukon suorituskykyä ja vertasi Llama 3.1:n suorituskykyä muihin malleihin Lippulaivamalli Llama 3.1 -405B voi kilpailla GPT:n kanssa useissa tehtävissä, kuten terve järki, käytettävyys, ja matematiikka -4, GPT-4o on verrattavissa Claude 3.5 Sonnetiin. Lisäksi pienet 8B- ja 70B-mallit ovat kilpailukykyisiä suljetun lähdekoodin ja avoimen lähdekoodin mallien kanssa, joilla on sama määrä parametreja.

Tosielämän skenaarioissa Llama 3.1 405B:tä verrattiin ihmisen arviointiin ja sen kokonaissuorituskyky oli parempi kuin GPT-4o ja Claude 3.5 Sonnet.

Tällä kertaa Meta päivitti myös avoimen lähdekoodin lisenssin, jolloin kehittäjät voivat käyttää Llama-mallin (mukaan lukien 405B) lähtöä ensimmäistä kertaa muiden mallien parantamiseen. Vertailussa GPT-4o:ta virkamiehet sanoivat, että he käyttävät myös yhdistelmämenetelmää integroidakseen kuva-, video- ja äänitoimintoja Llama 3:een, jotta malli tunnistaa kuvat ja videot ja tukee vuorovaikutusta äänen avulla. Tämä ominaisuus on kuitenkin vielä kehitteillä, eikä se ole vielä valmis julkaistavaksi.

Virallisessa blogissa Meta kertoi, että kaikkien Llama-versioiden kokonaislataukset ovat tähän mennessä ylittäneet 300 miljoonaa kertaa.

Tämän mallijulkaisun lisäksi Zuckerberg julkaisi virallisella verkkosivustolla pitkän artikkelin "Open Source AI Is the Path Forward", jossa mainittiin avoimen lähdekoodin merkitys. Hän uskoo avoimen lähdekoodin hyödyttävän kaikkia kehittäjiä, Metalle ja maailmalle on hyvä asia.

Zuckerberg mainitsi avoimen lähdekoodin järjestelmän Linuxin voiton suljetun lähdekoodin Unixista esimerkkinä ja uskoi tekoälyn kehittyvän samalla tavalla. "On olemassa useita teknologiayrityksiä, jotka kehittävät johtavia suljettuja malleja, mutta avoimen lähdekoodin umpeen umpeen hän mainitsi, että viime vuonna Llama 2:ta voitiin verrata vain vanhemman sukupolven malliin. Ja tänä vuonna Llama 3 on kilpailukykyinen joillakin alueilla ja jopa edistyneimmät mallit joillakin alueilla.

Zuckerberg uskoo, että avoin lähdekoodi voi edistää innovaatioita, vähentää kustannuksia ja parantaa turvallisuutta. Kehittäjille avoimen lähdekoodin avulla voit kouluttaa, hienosäätää ja tislata omia mallejasi Jokaisella organisaatiolla on erilaiset tarpeet, ja nämä tarpeet tyydytetään parhaiten käyttämällä erikokoisia malleja, jotka on koulutettu tai hienosäädetty tietyn datan perusteella. /.

Samaan aikaan kehittäjiä ei ole lukittu suljettuihin toimittajiin tietoturvan suojelemiseksi. "Avoimen lähdekoodin ohjelmistot ovat yleensä turvallisempia, koska niiden kehitys on läpinäkyvämpää ja sitä voidaan arvioida laajasti."

Zuckerberg mainitsi myös, että avoimen lähdekoodin malli on halvempi ja tehokkaampi Kehittäjät voivat tehdä päätelmiä Llama 3.1 405B:stä omassa infrastruktuurissaan noin 50 %:n hinnalla verrattuna käyttöliittymään sopivaan suljetun mallin käyttöön ja offline-johtotehtäviä.

"Avoimen lähdekoodin tekoäly edustaa maailman parasta mahdollisuutta."

uutiset

Meta julkaisee Llama 3.1:n, vahvimman avoimen lähdekoodin mallin, Zuckerberg: Siitä tulee käännekohta teollisuudelle

Johdanto

yhteystietoni