2024-10-04
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
uusi viisausraportti
liityn google deepmindiin työskentelemään videoiden luomisen ja maailman simulaattoreiden parissa! en malta odottaa, että pääsen työskentelemään niin lahjakkaan tiimin kanssa.
olen täälläopenaisoran luomiseen kuluneet kaksi vuotta ovat olleet uskomatonta aikaa. kiitos kaikille intohimoisille ja ystävällisille ihmisille, joiden kanssa työskentelen. innolla seuraavaan vaiheeseen!
paina kurpitsaa ja aloita kauha. vaikuttaa siltä, että julkaisupäivän virallisesta eroilmoituksesta voi tulla openai:n perinne.
googlen pomot juhlivat kommenttialueella, mukaan lukien deepmindin ja google researchin johtava tutkija jeff dean ja google ai studion tuotejohtaja logan kilpatrick.
denny zhou, deepmind-johtopäätöstiimin perustaja ja johtaja...
vaikka alexis conneau, "her"-projektin johtaja, joka erosi ennen gpt-4o:n täyttä julkaisua, ei liittynyt googleen, hän alkoi myös tehdä vitsejä verkossa - tervetuloa entiseksi openai-työntekijäksi.
näyttää siltä, että googlen oman videosukupolven mallin veo odotetaan ohittavan soran.
tällä hetkellä bill peebles, soran toinen pääjohtaja, työskentelee edelleen openai:ssa.
vaikka se julkaistiin tämän vuoden helmikuussa, sora on edelleen "futures-malli" ja on avoin vain pienelle ryhmälle punaisen tiimin testaajia ja taiteilijoita.
openai ei ole antanut selkeää määräaikaa, milloin se tulee verkkoon, toisin kuin "her"-projektissa, jolla on "tämä syksy" -lippu.
, ja kohtasi cto:n ja vastuuhenkilön lähtevän peräkkäin, soran tulevaisuus oli jälleen epävarma.
henkilökohtainen kokemus
tim brooks johtaa sora-projektia openai:ssa, jossa hänen tutkimuksensa keskittyy kehittämään laajamittaisia generatiivisia malleja, jotka voivat simuloida todellista maailmaa.
tämä kaveri suoritti tohtorin tutkinnon berkeley ai research centeristä, ja hänen tohtorintutkintonsa oli alyosha efros. tohtorintutkinnon aikana hän ehdotti instructpix2pix-nimistä tekniikkaa.
ennen openai:han tuloaan hän osallistui googlen pixel-mobiilikameroiden tekoälyteknologian kehittämiseen ja myösnvidiatyöskenteli videoiden sukupolven malleissa.
samalla hän on myös dall·e 3:n päätutkija.
toinen hänen ansioluettelonsa osa on todella jännittävää - hänen valokuvateoksensa ovat voittaneet "national geographicin", "nature's best photography"- ja "national wildlife federation" -palkintoja.
hänen eläinkuvansa:
hän on myös esiintynyt beacon theaterissä broadwaylla new yorkissa ja voittanut palkintoja kansainvälisissä a cappella vatsapuhujakilpailuissa.
netizens ilmaisi kateutta, että hänellä on tällainen vapaus.
lisäksi tim brooks totesi myös ansioluettelossaan "versailles": "olen intohimoinen tekoälyyn, ja onneksi tämä intohimo sulautuu täydellisesti harrastuksiini valokuvauksessa, elokuvissa ja musiikissa."
liityttyäni deepmindiin sanoin, että jatkan edelleen videoiden luomiseen ja maailman simulaattoreihin liittyvää työtä ja jatkan intohimon tekoälyyn yhdistämistä valokuvaus- ja elokuvaharrastuksiini.
videoiden sukupolvelta simuloituun maailmaan
tämän vuoden huhtikuussa, vain kaksi kuukautta sora-mallin julkaisun jälkeen, johtajat tim brooks ja bill peebles osallistuivat agi housen järjestämään pääpuheeseen ja ilmaisivat näkemyksensä videontuotantoteknologiasta - "se simuloi kaikkea. agi:n käyttöönotto ".
vincentin videomallit, kuten soran osoittama kyky luoda monimutkaisia kohtauksia, paljastavat vähitellen yksityiskohtaisen ymmärryksen ihmisten vuorovaikutuksesta ja fyysisestä kontaktista, mikä on tärkeä askel agi:lle.
realistisen sisällön ja realististen kuvien videoiden luomiseen tarvitaan sisäinen malli, joka ymmärtää, miten kaikki esineet ja ihmiset liikkuvat ja ovat vuorovaikutuksessa ympäristössä. siksi he uskovat, että sora edistää yleisen tekoälyn kehitystä.
metodologian suhteen sekä tim brooks että bill peebles korostivat erityisesti mallin skaalautuvuutta. he uskovat, että syy siihen, miksi kielimalli on niin onnistunut, on sen kyky laajentua, ja lainasivat näkemyksiä "the bitter lessonissa".
pitkällä aikavälillä menetelmät, jotka parantavat suorituskykyä skaalautuessaan, voittavat lopulta laskentatehon kasvaessa.
luomalla transformer-pohjaisen viitekehyksen ja vertaamalla eri sora-malleja he osoittivat mallikoulutuksen lisääntyneen laskennan vaikutuksen suorituskyvyn parannuksiin.
perusmallista malliin, jossa on 32-kertainen laskutoimitus, näet asteittaisen paranemisen kohtausten ja kohteiden ymmärtämisessä.
olemme aina pyrkineet pitämään lähestymistapamme yksinkertaisena, vaikka joskus todellisuus on haastavampaa kuin miltä se kuulostaa.
päätavoitteemme on tehdä jotain mahdollisimman yksinkertaista ja sitten skaalata sitä massiivisesti.