Llamasta tulee huippumalli suurten mallien joukossa, Zuckerberg aloittaa keskustelun: Avoimen lähdekoodin pelaaminen, ajat ovat muuttuneet

Lamasta tulee huippumalli suurten mallien joukossa, Zuckerberg aloittaa keskustelun: Avoimen lähdekoodin pelaaminen, ajat ovat muuttuneet

2024-07-24

Koneen sydänraportti

Toimittaja: Asia Oriole, Big Pan Chicken, Du Wei

Kiista avoimen lähdekoodin ja suljetun lähdekoodin välillä on jatkunut jo pitkään, ja nyt se on saattanut saavuttaa uuden huippunsa.

Mitä tulee avoimen lähdekoodin suuriin malleihin, Llama-sarja on ollut tyypillinen edustaja syntymästään lähtien. Sen erinomainen suorituskyky ja avoimen lähdekoodin ominaisuudet ovat parantaneet tekoälyteknologian käytettävyyttä ja saavutettavuutta. Jokainen tutkija ja kehittäjä voi hyötyä siitä ja laajentaa tutkimusta ja sovelluksia.

Nyt Meta Llama 3.1 405B on virallisesti julkaistu. Virallisessa blogissa Meta sanoi: "Tähän päivään asti avoimen lähdekoodin suuret kielimallit ovat toiminnallisuudeltaan ja suorituskyvyltään enimmäkseen jääneet suljetuista malleista. Nyt aloitamme uuden aikakauden avoimen lähdekoodin johdolla."

Samaan aikaan Metan perustaja ja toimitusjohtaja Zuckerberg kirjoitti henkilökohtaisesti pitkän artikkelin, jossa selitti avoimen lähdekoodin merkitystä kaikille kehittäjille, Metalle ja maailmalle. Hän sanoi, että avoin lähdekoodi on välttämätön edellytys tekoälyn myönteiselle kehitykselle. Unixin ja Linuxin kehitys esimerkkinä, avoimen lähdekoodin tekoäly edistää innovaatiota, tietosuojaa ja kustannustehokkuutta.

Hän uskoo myös, että avoimen lähdekoodin Llama-malli voi luoda täydellisen ekosysteemin, joka varmistaa teknologisen kehityksen eikä menetä etuja kilpailun vuoksi. Metalla on menestyksekäs avoimen lähdekoodin historia Avoimen lähdekoodin tekoälymallien avulla Zuckerberg edistää tasa-arvoa ja globaalin teknologian turvallista soveltamista.

Alkuperäinen linkki: https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

Alkuperäinen sisältö on seuraava:

Zuckerberg ruiskuttaa avoimen lähdekoodin geenejä Metaan

Tehokkaan tietojenkäsittelyn alkuaikoina suuret teknologiayritykset investoivat voimakkaasti omien Unixin suljetun lähdekoodin versioiden kehittämiseen. Tuolloin oli vaikea kuvitella mitään muuta tapaa kehittää näin kehittyneitä ohjelmistoja.

Avoimen lähdekoodin Linuxista tuli kuitenkin vähitellen suosittu: alun perin koska se antoi kehittäjille mahdollisuuden muokata koodia vapaasti ja se oli edullisempi, mutta myöhemmin siitä tuli edistyneempi, turvallisempi ja sillä oli laajempi ekosysteemi kuin millään suljetun lähdekoodin Unixilla, ja se tuki useampia toimintoja. Nykyään Linux on alan standardipohjainen pilvilaskenta ja useimpia mobiililaitteita käyttävä käyttöjärjestelmä, ja kaikki hyötyvät sen ylivoimaisista tuotteista.

Uskon, että tekoälyn kehitys kulkee samaa rataa.Nykyään jotkin teknologiayritykset kehittävät johtavia suljetun lähdekoodin malleja, mutta avoin lähdekoodi umpeutuu nopeasti.

Viime vuonna Llama 2 oli verrattavissa vain sukupolven vanhempaan malliin. Ja tänä vuonna Llama 3 kilpailee jo alan johtavien mallien kanssa tai jopa edellä niitä joillakin alueilla. Ensi vuodesta alkaen odotamme tulevien Llama-mallien olevan alan edistyksellisimpiä suuria malleja. Llama on ollut edelläkävijä myös avoimuudessa, muunneltavuudessa ja kustannustehokkuudessa.

Tänään otamme seuraavan askeleen – teemme avoimen lähdekoodin tekoälystä alan standardin. Julkaisimme ensimmäisen huippuluokan avoimen lähdekoodin tekoälymallin Llama 3.1 405B sekä parannetut versiot Llama 3.1 70B- ja 8B -malleista. Verrattuna suljetun lähdekoodin malleihin nämä avoimen lähdekoodin mallit ovat huomattavasti kustannustehokkaampia, erityisesti 405B-mallin avoimen lähdekoodin luonne, joten se on paras valinta pienten mallien hienosäätöön ja tislaamiseen.

Näiden mallien julkaisemisen lisäksi teemme yhteistyötä useiden yritysten kanssa laajentaaksemme laajempaa ekosysteemiä. Amazon, Databricks ja Nvidia lanseeraavat täyden valikoiman palveluita, joiden avulla kehittäjät voivat hienosäätää ja tislata omia mallejaan. Innovaattorit, kuten Groq, ovat rakentaneet alhaisen latenssin ja edulliset päättelypalvelut kaikille uusille malleille.

Nämä mallit ovat saatavilla kaikille tärkeimmille pilvialustoille, mukaan lukien AWS, Azure, Google, Oracle ja muut. Scale.AI, Dell, Deloitte ja muut ovat jo valmiita auttamaan yrityksiä ottamaan käyttöön Llaman ja kouluttamaan mukautettuja malleja omien tietojensa avulla. Yhteisön kasvaessa ja yhä useammat yritykset kehittävät uusia palveluita, voimme yhdessä tehdä Llamasta alan standardin ja tuoda tekoälyn edut kaikkien ulottuville.

Meta on sitoutunut avoimen lähdekoodin tekoälyyn Tässä ovat syyt, miksi mielestäni avoin lähdekoodi on paras kehitysalusta, miksi avoimen lähdekoodin Llama on hyvä Metalle ja miksi avoimen lähdekoodin tekoäly on hyvä maailmalle ja tulee olemaan olemassa vielä pitkään. .

Avoimen lähdekoodin tekoäly kehittäjille

Kun puhun kehittäjien, toimitusjohtajien ja valtion virkamiesten kanssa ympäri maailmaa, kuulen yleensä muutaman aiheen:

Meidän täytyy kouluttaa, hienosäätää ja tislata omia mallejamme. Jokaisella organisaatiolla on erilaiset tarpeet, joihin parhaiten vastataan käyttämällä malleja, jotka on koulutettu tai hienosäädetty eri mittakaavassa ja tietyillä tiedoilla. Laitteessa tehtävät ja luokitustehtävät vaativat pieniä malleja, kun taas monimutkaisemmat tehtävät vaativat suuria malleja. Nyt voit ottaa huippuluokan Llama-malleja, jatkaa niiden harjoittelua omilla tiedoillasi ja sitten tislata ne tarpeitasi parhaiten vastaavaan mallikokoon ilman, että me tai kukaan muu näkee tietojasi.
Meidän täytyy hallita omaa kohtaloamme, emmekä saa olla "lukittuina" suljetun lähdekoodin toimittajiin. Monet organisaatiot eivät halua luottaa malliin, jota he eivät voi johtaa ja hallita itse. He eivät halua, että suljetun lähdekoodin mallien myyjät voivat muuttaa mallia, muuttaa käyttöehtoja tai jopa lopettaa palvelun kokonaan. He eivät myöskään halua olla lukittuina yhteen pilvialustaan, jolla on yksinoikeudet malleihinsa. Avoin lähdekoodi mahdollistaa laajan yhteensopivien työkaluketjujen ekosysteemin, joiden välillä voit vaihtaa helposti.
Meidän on suojeltava tietojamme. Monet organisaatiot käsittelevät arkaluontoisia tietoja, jotka on suojattava ja joita ei voida lähettää suljetun lähdekoodin malliin pilvisovellusliittymien kautta. Jotkut organisaatiot eivät yksinkertaisesti luota tietojaan suljetun lähdekoodin mallien toimittajiin. Avoin lähdekoodi ratkaisee nämä ongelmat, koska sen avulla voit käyttää mallia missä tahansa. On tunnettua, että avoimen lähdekoodin ohjelmistot ovat turvallisempia, koska kehitysprosessi on läpinäkyvämpi.
Tarvitsemme mallin, joka on tehokas ja taloudellinen.Kehittäjät voivat käyttää Llama 3.1 405B:tä omassa infrastruktuurissaan tehdäkseen päätelmiä noin 50 %:lla suljetun lähdekoodin mallien (kuten GPT-4) kustannuksista, jotka soveltuvat käyttäjäpuolen ja offline-päättelytehtäviin.
Haluamme investoida ekosysteemeihin, joista tulee pitkällä aikavälillä standardi.Monet näkevät avoimen lähdekoodin kehittyvän nopeammin kuin suljetut mallit, ja he haluavat rakentaa järjestelmänsä arkkitehtuurille, joka tarjoaa suurimmat edut pitkällä aikavälillä.

Avoimen lähdekoodin tekoäly metalle

Metan liiketoimintamallina on rakentaa ihmisille parhaita kokemuksia ja palveluita. Tämän saavuttamiseksi meidän on varmistettava, että meillä on aina pääsy parhaimpaan teknologiaan, emmekä joudu sulkeutumaan kilpailijoiden suljettuun ekosysteemiin, jotta he eivät voi rajoittaa sitä, mitä kehitämme.

Haluan jakaa tärkeän kokemuksen: Vaikka Apple sallii meidän rakentaa sisältöä sen alustalle, olemme silti rajallisia rakennuspalveluiden suhteen. Olipa kyse veroista, joita he määräävät kehittäjille, mielivaltaisista säännöistä, joita he asettavat, tai kaikkea estämäänsä tuoteinnovaatiota, on selvää, että jos pystymme rakentamaan parhaat versiot tuotteistamme, eivätkä kilpailijat voi rajoittaa sitä, mitä rakennamme, Meta ja monet muut. yritykset voivat tarjota parempia palveluja ihmisille. Filosofisella tasolla tämä on suuri syy, miksi uskon niin vahvasti avoimen ekosysteemin rakentamiseen seuraavan sukupolven tietokoneille tekoälyn ja AR/VR:n aloilla.

Ihmiset kysyvät minulta usein, olenko huolissani teknisen edun menettämisestä avoimen Llaman kautta, mutta mielestäni tämä jättää huomiotta suuremman kuvan useista syistä:

Ensinnäkin varmistaaksemme, että pystymme säilyttämään teknologiajohtajuuden pitkällä aikavälillä emmekä joutuisi lukittumaan suljetun lähdekoodin ekosysteemiin, Llaman on kehitettävä täydellinen ekosysteemi, joka sisältää työkalut, tehokkuuden parannukset, laitteiston optimoinnit ja muut integraatiot. Jos yrityksemme olisi ainoa Llamaa käyttävä yritys, ekosysteemi ei kasvaisi, emmekä voisi paremmin kuin Unixin suljetun lähdekoodin versioilla.

Toiseksi odotan tekoälykehityksen jatkuvan erittäin kilpailukykyisenä, mikä tarkoittaa, että mallin avoin hankinta ei kulloinkin maksa meille valtavaa etua kilpailussa seuraavaksi parasta mallia vastaan.Llaman tie alan standardiksi on pysyä kilpailukykyisenä, tehokkaana ja avoimena sukupolvesta toiseen.

Kolmanneksi keskeinen ero Meta- ja suljetun lähdekoodin mallien tarjoajien välillä on se, että tekoälymallien käyttöoikeuden myyminen ei ole liiketoimintamallimme. Tämä tarkoittaa, että Llaman julkistaminen ei heikennä tulojamme, kestävyyttämme tai kykyämme investoida tutkimukseen, kun taas suljetun lähdekoodin tarjoajat tekisivät. (Tämä on yksi syy siihen, miksi jotkut suljetun lähdekoodin palveluntarjoajat ovat lobbannut julkisia ylläpitäjiä avointa lähdekoodia vastaan.)

Lopuksi Metalla on runsaasti onnistunutta kokemusta avoimen lähdekoodin projekteista. Olemme säästäneet miljardeja dollareita jakamalla palvelin-, verkko- ja datakeskussuunnittelumme Open Compute Projectin kanssa ja standardoimalla toimitusketjun. Avoimen lähdekoodin johtavien työkalujen, kuten PyTorchin, Reactin ja muiden, avulla hyödymme suuresti ekosysteemin innovaatioista. Tämä lähestymistapa on ollut erittäin tehokas jo pitkään.

Avoimen lähdekoodin tekoäly maailmalle

Uskon, että avoin lähdekoodi on välttämätön tekoälyn tulevaisuudelle. Tekoälyllä on potentiaalia lisätä ihmisten tuottavuutta, luovuutta ja elämänlaatua enemmän kuin mikään muu moderni teknologia ja edistää lääketieteellistä ja tieteellistä tutkimusta samalla, kun se kiihdyttää talouskasvua.Avoimen lähdekoodin avulla varmistetaan, että yhä useammat ihmiset ympäri maailmaa voivat hyötyä tekoälyn kehityksestä, että valtaa ei keskitetä muutaman yrityksen käsiin ja että teknologiaa voidaan levittää tasaisemmin ja turvallisemmin yhteiskunnassa.

Avoimen lähdekoodin tekoälymallien turvallisuudesta käydään jatkuvaa keskustelua. Pointtini on, että avoimen lähdekoodin tekoäly on turvallisempi kuin vaihtoehdot. Uskon, että hallitukset tulevat lopulta siihen tulokseen, että ne tukevat avointa lähdekoodia, koska se tekee maailmasta vauraamman ja turvallisemman.

Ymmärtääkseni turvallisuuskehyksessä meidän on suojauduttava kahdelta vahingolta: tahattomalta ja tahalliselta vahingolta.

Tahaton vahinko viittaa mahdollisuuteen, että tekoälyjärjestelmä voi tahattomasti aiheuttaa vahinkoa toimiessaan. Esimerkiksi nykyaikaiset tekoälymallit voivat vahingossa antaa vääriä terveysneuvoja. Tai tulevissa skenaarioissa ollaan huolissaan siitä, että mallit voivat vahingossa toistaa itseään tai liiallisesti optimoida tavoitteita ihmisten vahingoksi.
Tahallinen vahinko on sitä, kun pahat toimijat käyttävät tekoälymallia tarkoituksenaan aiheuttaa vahinkoa.

On syytä huomata, että tahattomat vahingot kattavat suurimman osan ihmisten tekoälyyn liittyvistä huolenaiheista – tekoälyjärjestelmien vaikutuksista miljardeihin käyttäjiin kaikkein todella katastrofaalisiin tieteiskirjallisuuden skenaarioihin. Tässä suhteessa avoimen lähdekoodin tarjoama tietoturva on vieläkin merkittävämpi, koska järjestelmä on läpinäkyvämpi ja sitä voidaan tarkastella laajasti.

Historiallisesti avoimen lähdekoodin ohjelmistot ovat olleet turvallisempia tästä syystä. Samoin Llaman ja sen turvajärjestelmien, kuten Llama Guard, käyttö voi olla turvallisempaa ja luotettavampaa kuin suljetun lähdekoodin malli. Tämän seurauksena useimmat avoimen lähdekoodin tekoälyn turvallisuudesta käytävät keskustelut keskittyvät tahalliseen vahingoittamiseen.

Turvaprosessimme sisältää tiukat testaukset ja punaisen tiimin arvioinnit varmistaaksemme, voivatko mallimme aiheuttaa aineellista haittaa. Tavoitteena on vähentää riskejä ennen julkaisua. Koska nämä mallit ovat avoimen lähdekoodin, kuka tahansa voi testata niitä itse. On muistettava, että nämä mallit on koulutettu Internetissä jo saatavilla olevalla tiedolla, joten haittoja pohdittaessa tulee lähtökohtana olla, voiko malli aiheuttaa enemmän haittaa kuin Googlesta tai muista hakutuloksista nopeasti saatu tieto.

Tarkoituksenmukaisen vahingoittamisen perusteleminen auttaisi erottamalla sen, mitä yksittäiset tai pienimuotoiset toimijat voivat tehdä, ja mitä suuret toimijat, joilla on suuria resursseja, kuten valtiot, voivat tehdä.

Jossain vaiheessa tulevaisuudessa yksittäiset pahantahtoiset toimijat voivat hyödyntää tekoälymallien älykkyyttä luodakseen uudenlaisia haittoja Internetissä jo saatavilla olevista tiedoista. Tässä vaiheessa voimatasapaino on kriittinen tekoälyn turvallisuudelle.

Mielestäni olisi parempi elää maailmassa, jossa tekoäly on laajalti käytössä, jolloin suuret toimijat voivat tasapainottaa pieniä haitallisia toimijoita. Näin hallitsemme myös sosiaalisten verkostojen turvallisuutta tehokkaammilla tekoälyjärjestelmillä, jotka tunnistavat ja estävät vähemmän kehittyneet toimijat, jotka käyttävät usein pienempiä tekoälyjärjestelmiä.

Laajemmin suuret instituutiot edistävät yhteiskunnan turvallisuutta ja vakautta, kun ne ottavat käyttöön tekoälyn laajassa mittakaavassa. Niin kauan kuin kaikilla on pääsy sukupolven kaltaiseen malliin, hallitukset ja instituutiot, joilla on enemmän laskentaresursseja, pystyvät tasapainottamaan haitalliset toimijat, joilla on vähemmän laskentaresursseja.

Kun mietit tulevaisuuden mahdollisuuksia, muista, että suurin osa nykypäivän johtavista teknologiayrityksistä ja tieteellisestä tutkimuksesta on rakennettu avoimen lähdekoodin ohjelmistoille. Jos investoimme yhdessä avoimen lähdekoodin tekoälyyn, seuraavan sukupolven yritykset ja tutkimus pääsevät käyttämään sitä. Tämä koskee aloittelevia yrityksiä, kuten myös ihmisiä yliopistoissa ja maissa, joilla ei ehkä ole resursseja kehittää SOTA AI:ta tyhjästä.

Kaiken kaikkiaan avoimen lähdekoodin tekoäly edustaa tämän tekniikan suurinta mahdollista maailmanlaajuista käyttöä taloudellisten mahdollisuuksien ja turvallisuuden luomiseksi kaikille.

Yhteistyö on vakaata, avoin lähdekoodi on kauaskantoinen

Aiemmissa Llama-malleissa Meta on julkaissut nämä mallit omaan kehittämiseen keskittymättä laajemman ekosysteemin rakentamiseen. Tätä julkaisua varten valitsimme toisenlaisen lähestymistavan. Rakennamme sisäisesti tiimejä tuodaksemme Llaman mahdollisimman monen kehittäjän ja kumppanin saataville ja rakennamme aktiivisesti kumppanuuksia, jotta useammat ekosysteemin yritykset voivat tarjota ainutlaatuisia ominaisuuksia asiakkailleen.

Uskon, että Llama 3.1:n julkaisu tulee olemaan käännekohta alalla, ja useimmat kehittäjät alkavat käyttää avoimen lähdekoodin teknologiaa, ja ennustan, että tämä lähestymistapa alkaa avoimesta lähdekoodistamme.

Toivon, että voimme työskennellä yhdessä tuodaksemme tekoälyn edut maailmalle.

Voit käyttää näitä malleja nyt osoitteessa llama.meta.com.

Mark Zuckerberg

uutiset

Lamasta tulee huippumalli suurten mallien joukossa, Zuckerberg aloittaa keskustelun: Avoimen lähdekoodin pelaaminen, ajat ovat muuttuneet

Johdanto

yhteystietoni