uutiset

yksi artikkeli meta connect 2024:n ymmärtämiseksi: llama 3.2 on täällä, ar-lasit orian paljastettiin

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


tencent technology -kirjailija wu bin hao boyang

toimittaja zheng kejun

klo 1.00 26. syyskuuta pekingin aikaa vuotuinen meta connect 2024 pidettiin menlo parkissa, kaliforniassa. zuckerberg aloitti odotetulla uudella tuotteella quest 3s:llä ja ilmoitti, että metan unelma metaversumista on alkanut levitä lähtötason kuluttajamarkkinoille.

samaan aikaan meta julkisti myös uusimman 3.2-version suuresta tekoälymallistaan ​​llamasta, joka tarjoaa visuaalisia multimodaalisia ominaisuuksia yhdistettynä uusimpaan tekoälypuheenvuoropuheluominaisuuteen ai voice. näiden mallien julkaisun suurin merkitys on, että meta on saanut valmiiksi kaikki valtavirran multimodaaliset mallit, mikä luo vankan pohjan sen ai- ja xr-laitteistojen integraatiolle. samaan aikaan useat metan ilmoittamat tekoälysovellukset, kuten tekoälyn reaaliaikainen käännös ja "her 2.0:aan verrattavissa oleva reaaliaikainen tekoälyn digitaalinen ihminen", ovat myös ottaneet askeleen pidemmälle teollisuuden ratkaisuissa ja niistä voi tulla tappavia sovelluksia. .

lisäksi xiao zha kutsuu orionin tällä kertaa julkaisemia ar-laseja pinnan tehokkaimmiksi ar-laseiksi. vaikka se ei vieläkään ole täydellinen, se on myös tuote, joka kantaa ai-tilalaskentalaitteiden lopullisen muodon kunnianhimoa. ulkomaisten tiedotusvälineiden mukaan tämän tuotteen hinta ylittää 10 000 dollaria.

mate vaatii edelleen etenemistä metaversumien ja tekoälyn kahdella tiellä ja pyrkii yhdistämään virtuaalitodellisuuden ja tekoälyn integroimalla tuotteita.

vuonna 2024 pidetyssä connect-konferenssissa zuckerberg esitteli jälleen maailmalle suunnittelemansa virtuaalitodellisuusmaailman sisääntulomuodon. näimme virtuaalisuuden ja todellisuuden yhdistämisen, autonomisen ohjattavuuden ja tekoälyn yhdistämisen sekä todellisen muodon. tuotteet ja tulevaisuuden käyttökokemuksen integrointi.

zuckerberg tiivistää lehdistötilaisuuden: meta lanseeraa 5 uutta tuotetta ja tekee lujasti töitä rakentaakseen avoimempaa tulevaisuutta

meta quest 3s on täällä, hintaa alennettu, mutta ei materiaaleja

meta quest 3s ilmestyi ensimmäisenä, ja tällä kertaa oli harvinaista julkaista tuotteen hintaa parametreja ja uusia ominaisuuksia aikaisemmin.

zuckerberg haluaa kertoa kaikille, että nämä uudet vr-lasit myydään vain 299,99 dollarilla, mikä on täydet 200 dollaria halvempi kuin viime vuoden vastaavana aikana julkaistussa quest 3:ssa. lisäksi siinä ei ole liikaa ominaisuuksia verrattuna quest 3:een.

meta quest 3s:ssä on sama qualcomm snapdragon xr2 gen 2 -siru ja 8 gt käyttömuistia kuin sen "isoveljessä" quest 3, mikä tarkoittaa, että niillä on täsmälleen sama prosessointiteho tietojen laskemiseen.

samaan aikaan quest 3s käyttää samaa touch plus -ohjainta kuin quest 3 ja tukee silmän ja käden liikkeen sieppaustekniikkaa.

jopa quest 3s:ssä on pidempi akunkesto. metan antamien virallisten tietojen mukaan quest 3s sisäänrakennetulla 4324mah akulla voi saavuttaa 2,5 tunnin akunkeston, kun taas quest 3 suuremmalla akkukapasiteetilla (5060 mah) voi toimia vain enintään 2,2 tuntia.

halvana virtuaalitodellisuuslasituotteena quest 3s:n valitettavana on, että se ei käytä samaa fresnel-objektiivia kuin quest 1- ja 2-sarja. se on suhteellisen tyylikkäämpi ja edullinen, mutta se tarkoittaa myös, että sen koko ja paino ovat suurempia kuin quest 3:n.

mutta todellinen ero näiden kahden tuotteen välillä on ero näyttötehosteissa: quest 3s käyttää 1832 x 1920 (20 ppd pikseliä per aste) nopeasti vaihtavaa lcd-näyttöä, jonka virkistystaajuus on 90/120 hz.

sen vaaka- ja pystysuuntainen näkökenttä on vain 96 ja 90 astetta verrattuna quest 3:n 2064 x 2208 (25 ppd pikseliä per aste) ja 110 asteen vaaka- ja 96 asteen pystysuuntaiseen näkökenttään.

on selvää, että quest 3s osoittaa metan kunnianhimoa metaversummaisen unelman alla. se käyttää virtuaalitodellisuuslaseja, joiden ydinkokoonpanot ovat lähellä valtavirtatuotteita, mutta halvempia edistääkseen vr-lasien suosimista laajemman käyttäjäkunnan keskuudessa.

toinen liikkeellepaneva voima, joka ajaa metan luomaan tällaisen tuotteen, on sen virtuaalitodellisuusekosysteemi, joka kehittyy edelleen vähitellen.

lehdistötilaisuudessa zuckerberg sanoi, että quest 3s tukee dolby vision -tekniikkaa ja lisää näytöntunnistustoiminnon, joka tunnistaa käytetyn tietokoneen ja lähettää näytön yhdellä napsautuksella. tämä laajentaa virtuaalitodellisuuden päähän kiinnitettävien tuotteiden, kuten quest 3s:n, laajempia käyttöskenaarioita.

meta kuitenkin sotki tämän tekniikan live-esittelyn aikana, mikä aiheutti yleisön hurrauksen.

myöhemmin zuckerberg esitteli horizon worldsin uusimman version. vaikka se näyttää edelleen "pelattavalta" peliltä, ​​se paranee hitaasti: tänä vuonna lanseerattiin avantarin moninpelitoiminto. toivon, että tämä houkuttelee lisää youtube-käyttäjiä.

kolmannen osapuolen sovellusten osalta suurin yllätys tulee "batman: arkham shadowista", joka julkaistaan ​​22. lokakuuta ja joka toimitetaan uusien quest 3:n ja 3s:n mukana ja on voimassa ensi vuoden huhtikuuhun asti. quest-alustalle julkaistaan ​​myös aiemmin julkistettu "alien: rogue invasion" ja zombiepeli "arizona sunshine". lisäksi meta ilmoitti myös julkaisevansa wordlen (new york timesin päivittäin julkaisema sanapeli) questille.

muuten, jotta voit ostaa uuden quest 3s:n, meta on tehnyt aloitteen quest 2:n ja quest pron tuotannon lopettamisesta myytyään loppuun näiden kahden tuotteen varastot, joista voit valita ovat halvemmat quest 3s tai halvemmat quest 3s. se on quest 3 korkeammalla kokoonpanolla.

xiao zha sanoi, että tehokkain päätymalli llama 3.2 on täällä

meta lanseeraa llama 3.2 -multimodaalisen suuren mallin, kevyt versio toimii matkapuhelimissa

kuten edellisessä connect-konferenssissa, myös tämän konferenssin päähenkilö on välttämätön: tekoäly.

zuckerberg julkisti perusmallinsa llaman 3.2-päivityksen. sen suuri malli on saatavana 90b- ja 11b-versioina, ja päätymalli on saatavana 1b- ja 3b-kokoisina.

xiao zha esitteli uuden tuoteominaisuuden, joka on kehitetty llama 3.2:lle: lataamalla kuvia, voit paitsi tyhjentää ja lisätä taikasivellintoimintoja, myös muuttaa suoraan hahmon vaatteita tekstikuvauksen perusteella ja jopa korvata nykyisen taustan sateenkaarella.

matan toimittaman teknisen dokumentaation mukaan llama 3.2 voidaan ymmärtää suoraan llama 3.1:n versiona, joka tukee multimodaalisuutta. koska meta ei päivitä kielimallinsa parametreja kuvantunnistuksen koulutusprosessin aikana.

harjoitusmenetelmän suhteen meta käyttää tavanomaista menetelmää. se lisää kuvasovittimen ja kooderin llama3.1:een, käyttää diffusion-mallia vastaavan tekstin ja kuvien kouluttamiseen ja suorittaa sitten verkkoalueen sisällön hienosäädön.

lopuksi mallin säätämisen harjoittelun jälkeisessä vaiheessa llama 3.2 käyttää myös useita valvottuja hienosäätökierroksia, hylkäysnäytteistys (käyttäen apujakaumaa näytteiden luomiseen ja näytteiden hyväksymistä tai hylkäämistä tietyn todennäköisyyden mukaan) ja suoraa etusijaa. optimointi.

mielenkiintoista on, että tämän prosessin aikana meta käytti llama 3.1:tä luodakseen useita kuvatekstisarjoja optimoidakseen mallin kuvan kuvauksen.

meta käyttää llama 3.1:tä useiden kuvien tekstityssarjojen luomiseen optimoidakseen mallin kuvan kuvauksen.

metan antamissa testituloksissa llama 3.2:n 90b-version graafinen päättelykyky on useissa testeissä edellä gpt 4o-miniä. 11b-versio ylittää kattavasti haiku-version, claude 3:n pienemmän version.

zuckerberg sanoi, että llama 3.2:n asiakaspuolen versiot 1b ja 3b ovat tehokkain asiakaspuolen tekoäly.

se hyväksyy tällä hetkellä tekstinsyötön ja -tulostuksen ja tukee 128 000 tokenin enimmäiskontekstin pituutta. nämä kaksi päätymallia koulutettiin karsimalla (parametrien karsiminen pienellä käyttöasteella suuressa mallissa) ja tislaamalla (käyttäen suurta mallia opettajana ja pienten mallien oppimisen ydinparametrien koulutustilaa) llama 3.1 8b:ssä ja 70b. harjoitteluprosessin hienosäätöprosessin aikana lisättiin myös llama 3.1 405b:n tarjoamaa synteettistä dataa sen suorituskyvyn optimoimiseksi useissa toiminnoissa, kuten yhteenvedossa, uudelleenkirjoituksessa, ohjeiden seuraamisessa, kielen päättelyssä ja työkalujen käytössä.

lehdistötilaisuus osoitti, että llama 3.2:n 3b-versio ylitti googlen kesäkuussa julkaiseman gemma 2 2b -mallin ja microsoftin elokuussa julkaiseman phi 3.5 3.8b -mallin monissa mittareissa, etenkin mitä tulee yleisesti käytettyihin päätepuolen toimintoihin, kuten tiivistelmänä, komennon seuraajana ja pisteiden etu on ilmeinen uudelleenkirjoitustehtävässä.

esimerkiksi testisarjassa ifeval, joka testaa kykyä noudattaa käyttäjän ohjeita, llama 3.2 3b -versio paranee yli 20 % verrattuna samankokoiseen phi 3.5:een. kahdessa vertailussa, jotka testaavat kykyä kutsua työkaluja, llama 3.2:lla on myös ilmeisiä etuja.

tämän ansiosta llama 3.2 on xiao zhan mukaan tällä hetkellä "vahvin" laitteen käytännön sovelluskokemuksen kannalta. kuitenkin peruskykyjen, kuten päättelyn ja matematiikan, suhteen llama 3.2 3b on enimmäkseen jäljessä phi 3.5 miniä.

lisäksi nämä mallit tukevat qualcomm- ja mediatek-laitteistoja julkaisupäivänä, ja ne on optimoitu arm-prosessoreille.

llama 3.2:n lisäksi, joka tukee kuvien multimodaalista ymmärtämistä, meta lanseerasi tällä kertaa myös meta ai voicen connectissa. täyttää kaikki yleiset multimodaaliset toiminnot kerralla. live-esittelyissä, kuten gpt-4o, se voi tukea dialogin keskeyttämistä ja ääni on hyvin luonnollinen, mutta valitettavasti se ei osoita, että sillä on gpt-4o:n rikas intonaatio ja tunneilmaisu.

vaikka suorituskyky vastaa vain gpt-4o:ta, meta ai voice on löytänyt uuden myyntipisteen: se tarjoaa äänivaihtoehtoja viidelle julkkikselle, kuten judi denchille kylmänaamaisesta naispomosta vuonna 007 ja crazy rich asiansin sankaritarlle. päähenkilön lin jiazhenin ääni.

verrattuna openai:han, joka haastattiin oikeuteen scarlett johanssonin äänen varastamisesta, meta on tässä suhteessa selvästi luotettavampi. wall street journalin mukaan meta on maksanut "miljoonia dollareita" jokaisen julkkiksen äänestä. jotkut julkkikset haluavat rajoittaa äänensä käyttöä ja varmistaa, että heitä ei aseteta vastuuseen, jos meta ai:ta käytetään.

reutersin mukaan celebrity voice lanseerataan tällä viikolla yhdysvalloissa ja muilla englanninkielisillä markkinoilla metan sovellusperheen kautta, mukaan lukien facebook, instagram ja whatsapp.

mallin perusominaisuuksien täydentämisen lisäksi meta esitteli myös uusia ominaisuuksia tekoälysovelluksissa. nykyiset tekoälyratkaisut tukevat suurelta osin näitä ominaisuuksia, mutta meta menee askeleen pidemmälle. se sopii myös paremmin sosiaalisen median tai ai-lasien käyttöskenaarioihin.

esimerkiksi meta ai studio tukee nyt suoraa tekoälyn digitaalisten ihmisjärjestelmien rakentamista. live-esittelyissä digitaalisten ihmisten kanssa käytyjen keskustelujen latenssi oli hyvin alhainen, ja liikeefektit ja äänet olivat aitoja ja luonnollisia.

meta ai studio tukee suoraa tekoälyn digitaalisten ihmisjärjestelmien rakentamista

kuvittele, että sinulla on tekoäly, joka puhuu sinulle niin aidolla äänellä ja kasvoilla kuin tunnekumppanisi. haluaisin kutsua sitä "näkyväksi" her 2.0:ksi.

käyttäjien tulee testata vielä, aloittaako se tekoälytuotteiden kulta-ajan.

toinen erittäin hämmästyttävä tuote on meta live -käännös meta ai:n uusien multimodaalisten ominaisuuksien avulla se voi tunnistaa ja korvata suoraan alkuperäisen kielen suun muodon kohdekielen suumuodolla. tämän ominaisuuden ovat itse asiassa ottaneet käyttöön yritykset, kuten heygen, mutta meta-sovellusten kattavuuden perusteella siitä voi tulla ensimmäinen täysin suosittu liittyvä tuote.

vaikka llama 3.1 on jo nyt kehittäjien eniten käyttämä avoimen lähdekoodin malli, meta julkaisi connect-konferenssissa myös ensimmäisen virallisen llama-tuotekehitystyökalun llama stack -version, joka voi yksinkertaistaa työnkulkua huomattavasti llama-malleja eri ympäristöissä käyttävistä kehittäjistä, ja ne voivat myös mahdollistaa työkalupohjaisten sovellusten, kuten rag (retrieval enhanced generation) ja integroitujen suojaustoimintojen, käyttöönoton yhdellä napsautuksella.

llama 3.2:n julkaisulla on suuri merkitys metalle. se täydentää llaman ydinpuutteita huippuluokan multimodaalisissa malleissa ja tarjoaa myös perustan sen myöhempien tekoälylaitteistojen, kuten tekoälyä tukevien ray-ban-lasien, multimodaalisille toiminnoille.

suosittu tuote "ray-ban lasit" iskee raudan kuumana ja lanseeraa uusia tuotteita

viime vuoden meta connect -konferenssissa kukaan ei ehkä osannut odottaa, että suosituin tuote ei ollut quest 3, vaan metan ja lasivalmistaja ray-banin lanseeraama toisen sukupolven tekoälylasituote.

vaikka ensimmäinen sukupolvi on tuntematon, se ei estä teknologian harrastajia euroopassa ja yhdysvalloissa kiirehtimästä ostamaan toisen sukupolven ray-ban-älylaseja idc:n tilastojen mukaan meta on toimittanut yli 700 000 paria ray-ban-laseja. , erityisesti tämän vuoden toisen neljänneksen tilausmäärä, joka on korkeampi kuin ensimmäisen sukupolven tilausmäärä yli kaksinkertaistui vuosineljänneksestä. ray-ban meta -lasien koko elinkaaren aikana, toukokuussa 2024, sen maailmanlaajuinen myynti on ylittänyt miljoonan kappaleen, ja markkinat odottavat koko vuoden toimitusten vuonna 2024 ylittävän 1,5 miljoonaa yksikköä.

meta löi raudan kuumana ja lanseerasi heti uuden tuotteensa tänä vuonna.

sen sijaan, että sanoisi sen olevan uusi tuote, on parempi sanoa, että tämä on upouusi läpikuultava tyyli, koska sen kokonaismuotoilu on täsmälleen sama kuin viime vuonna.

mutta siinä on läpinäkyvä lasirunko, jossa on vahvempi tunne teknologiasta - kuten odotettiin, laitteistoyrityksillä kaikkialla maailmassa on sama käsitys "teknologian tunteesta", jonka on oltava läpikuultava.

meta on lisännyt tämän sukupolven laseihin lisää tekoälytoimintoja. suurin parannus on reaaliaikainen tekoälyn kuvantunnistustoiminto, jonka avulla käyttäjät voivat kysyä ray-ban meta -laseilta näkemästään kohtauksesta tai kohteesta. käyttäjät voivat myös skannata qr-koodeja suoraan lasien läpi ja soittaa näköpiirissä oleviin puhelinnumeroihin.

lisäksi aurinkolasit tukevat älypuhelimen kaltaisia ​​muistutustoimintoja, reaaliaikaista käännöstä, mukaan lukien englannista ranskaksi, italiaksi tai espanjaksi, ja integrointia musiikin suoratoistosovelluksiin, kuten amazon music, audible ja iheart radio.

orian, ar-lasien perimmäinen muoto metan mukaan?

orianin olisi pitänyt olla massatuotantona jo kauan sitten, mutta epidemian aiheuttaman metan yleisen budjetin kiristämisen vuoksi zuckerberg päätti hyllyttää julkaisun, minkä seurauksena meta julkaisi ensimmäisen ar-lasituotteensa vasta 2024.

nämä ovat vain 98 grammaa painavat ar-lasit, mikä ei ole erityisen kevyttä ar-lasituotteiden joukossa.

orianin kehykset on valmistettu magnesiumseoksesta, joka on alumiinia kevyempää ja pystyy haihduttamaan lämpöä helpommin. linssit on valmistettu piikarbidista, joka on kestävä, kevyt ja korkea taitekerroin, mikä mahdollistaa projektorin laseille säteilemän valon laajenemisen laajemmalle katselualueelle.

mutta orianin kutsuminen ar-laseiksi ei näytä olevan tiukkaa. jos se haluaa toimia kunnolla, sen on toimittava yhteistyössä rannekkeen ja laskentarungon kanssa.

laskennallinen runko antaa enemmän prosessointitehoa, eikä lasit voi toimia yksin sen ulkopuolella.

ranneke tekee mielenkiintoisempaa työtä, se on valmistettu korkean suorituskyvyn tekstiilimateriaaleista ja käyttää elektromyografiaa (emg) ymmärtääkseen eleisiin liittyviä hermosignaaleja. muutamassa millisekunnissa nämä signaalit muunnetaan tulosignaaleiksi ja välitetään laskenta-agentille, vähän kuin tieteiskirjallisuuselokuvassa.

mitä tulee näyttöön, orionissa on 70 asteen näkökenttä ja sen kehyksessä on micro led -projektori, joka voi heijastaa kuvia linssin silikonisubstraatille. tämä on samanlainen kuin kaikkien nykyisten ar-lasien toimintaperiaate .

zuckerberg sanoi toivovansa ihmisten käyttävän orionia kahteen päätarkoitukseen: kommunikointiin todellisen maailman päällä olevan digitaalisen tiedon kanssa ja vuorovaikutukseen tekoälyn kanssa.

jälkimmäinen on helpompi ymmärtää orionilla on samat tekoälyominaisuudet kuin ray-ban meta -laseissa, mukaan lukien äskettäin lisätyt kuvantunnistusominaisuudet ja kielivuorovaikutusominaisuudet.

edellinen on abstraktimpi. kohtauksessa meta esitteli kohtauksen, jossa holografiset kuvat yhdistetään todelliseen maailmaan. meta kehitti näille laseille ar-version messenger-sovelluksesta, joka voi toteuttaa reaaliaikaisia ​​holografisia videopuheluita, ikään kuin toinen osapuoli seisoisi vieressä. sinä.

mainostaakseen ar-laseja meta toi esiin myös huang renxunin ensimmäisenä orionin kokeneena käyttäjänä zuckerberg sanoi: "huang on kokeillut sitä ja sanoi, että se on hyvä".

zuckerbergin näkemyksen mukaan ar-lasien kypsyminen tulee olemaan asteittainen prosessi. toisaalta näyttöttömät tekoälylasit, kuten ray-ban meta, yleistyvät nopeammin.

toisaalta sen suosituksi tulevat piennäytölliset lasit, kuten metan tuleva hypernova, joka voi tarjota helpompaa kosketusvuorovaikutusta, kuten vuorovaikutusta meta ai:n kanssa tai kommunikointia ystävien kanssa.

xiao zha sanoi, että orion edustaa ar-lasien lopullista muotoa: kypsissä ar-laseissa on tarpeeksi laskentatehoa, jotta voit jättää älypuhelimen kotiin.

todettakoon, että vaikka olemme erillään matkapuhelimesta, meidän on silti otettava laskentarunko mukaamme, kun lähdemme ulos, mikä on vielä kaukana kuvittelemastamme lopullisesta muodosta.

lisäksi siellä on myös ajoissa kaadettu allas kylmää vettä: orionin akun kesto on vain 2 tuntia. yksinkertaisemmin sanottuna orion voi antaa sinun olla supersankari virtuaalimaailmassa vain 2 tuntia.

ja ar-lasien äärimmäisen vapauden ymmärtäminen ei ehkä ole liian halpaa. ulkomaisten tiedotusvälineiden, kuten the vergen ja techcrunchin, mukaan metan henkilökunta sanoi testikonetta esitellessään, että orionin nykyiset laitteistokustannukset ylittävät 10 000 dollaria. tämä tarkoittaa, että tämän tuotteen hinta on paljon korkeampi kuin applen vision pron.

johtopäätös

metaversen epäonnistumisesta vuonna 2022 ja monien osapuolten pilkaksi tulemisesta avoimen lähdekoodin tekoälyn kuninkaaksi vuonna 2023 ja sitten älylasien käyttämiseen tänä vuonna oven avaamiseen uuden sukupolven tekoälylaitteistolle. zuckerberg suoritti lähes mahdoton vastahyökkäys viimeisen kolmen vuoden aikana.

tänä aikana hänen kaksi tärkeää päätöstään: avoimen lähdekoodin tekoäly ja kevyiden älylasien kehittäminen toteutuivat connectissa tänään.

tekoälytoiminnoilla varustettujen ray-ban-lasien näytöstä olemme todellakin nähneet lasien edut tekoälyn aikakauden kantajana: se ei voi käyttää vain ääntä suurten mallien soittamiseen, vaan se pystyy myös hyödyntämään potentiaalia suorimmin. multimodaalista tekoälyä. suora "katselu" on paljon luonnollisempi käyttökokemus kuin matkapuhelimella "skannaaminen". ja tämä suoruus määrää todennäköisesti seuraavan sukupolven älylaitteiden siirron.

viimeksi julkaistu orion on tulevaisuuden teos, joka kantaa kunnianhimoa tekoälyn spatiaalisen laskentalaitteiston lopullisesta muodosta. raskaaseen ja epämukavaan vision pro:hon verrattuna xiao zhan kevyt mr-näkemys on enemmän kuin spatiaalisen laskennan tulevaisuus. ja nyt tämä visio on muotoutunut. jos älylaitteiden siirtyminen ai-aikakaudella on tarkoitus tapahtua, meta on lähimpänä kynnystään verrattuna pieniin yrityksiin, kuten ai pin.

jos puhut ihmiselle vuonna 2022 kaikesta tästä, hän ei varmasti usko sitä.zuckerberg, hieman hämärältä vaikuttava tekniikkanörtti, todella pitää lupauksensa ja vie meidät yhä lähemmäs metaversumien sisäänkäyntiä.