le mie informazioni di contatto
posta[email protected]
2024-10-04
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
nuovo rapporto sulla saggezza
mi unirò a google deepmind per lavorare sulla generazione di video e sui simulatori del mondo! non vedo l'ora di lavorare con un team così talentuoso.
io sono quiopenaii due anni necessari per creare sora sono stati meravigliosi. grazie a tutte le persone appassionate e gentili con cui lavoro. entusiasta per la fase successiva!
premi la zucca e inizia lo scoop sembra che l'annuncio ufficiale delle dimissioni il giorno del rilascio possa diventare la tradizione di openai.
i capi di google hanno festeggiato nell'area commenti, tra cui jeff dean, capo scienziato di deepmind e google research, e logan kilpatrick, product leader di google ai studio.
denny zhou, fondatore e leader del team di inferenza di deepmind——
sebbene alexis conneau, il capo del progetto "her" che si è dimesso prima del rilascio completo di gpt-4o, non si sia unito a google, ha anche iniziato a fare battute online: benvenuto a diventare un ex dipendente di openai.
sembra che il modello di generazione video di google, veo, dovrebbe superare sora.
attualmente, bill peebles, l’altro co-responsabile di sora, sta ancora lavorando presso openai.
sebbene sia stato rilasciato nel febbraio di quest'anno, sora è ancora un "modello del futuro" ed è aperto solo a un piccolo gruppo di tester e artisti della squadra rossa.
openai non ha dato una scadenza chiara per quando andrà online, a differenza del progetto "her" che ha una bandiera "questo autunno".
, e incontrando il cto e il responsabile che se ne andavano uno dopo l'altro, il futuro di sora era ancora una volta incerto.
esperienza personale
tim brooks è co-direttore del progetto sora presso openai, dove la sua ricerca si concentra sullo sviluppo di modelli generativi su larga scala in grado di simulare il mondo reale.
questo ragazzo ha conseguito il dottorato di ricerca presso il berkeley ai research center e il suo tutor di dottorato era alyosha efros. durante il suo dottorato, ha proposto una tecnologia chiamata instructpix2pix.
prima di entrare in openai, ha partecipato allo sviluppo della tecnologia ai per le fotocamere mobili pixel presso google e anchenvidiaha lavorato su modelli di generazione video.
allo stesso tempo è anche il ricercatore principale di dall·e 3.
un'altra parte del suo curriculum è davvero entusiasmante: i suoi lavori fotografici hanno vinto premi da "national geographic", "nature's best photography" e "national wildlife federation".
le sue foto di animali:
si è esibito anche al beacon theatre di broadway a new york e ha vinto premi in concorsi internazionali a cappella.
i netizen hanno espresso la loro invidia per il fatto che abbia questo tipo di libertà.
inoltre, tim brooks ha detto nel suo curriculum in modo un po' "versailles": "sono appassionato di intelligenza artificiale e, fortunatamente, questa passione si fonde perfettamente con i miei hobby: fotografia, film e musica".
dopo essermi unito a deepmind, ho detto che sarò ancora impegnato nel lavoro relativo alla generazione di video e ai simulatori del mondo e continuerò a integrare la mia passione per l'intelligenza artificiale con i miei hobby per la fotografia e i film.
dalla generazione video al mondo simulato
nell'aprile di quest'anno, appena due mesi dopo il rilascio del modello sora, i co-responsabili tim brooks e bill peebles hanno partecipato a un discorso organizzato da agi house e hanno espresso le loro opinioni sulla tecnologia di generazione video: "simulerà tutto. implementazione agi ".
le complesse capacità di generazione di scene dimostrate dai modelli video vincenziani come sora, che rivelano gradualmente una comprensione dettagliata dell’interazione umana e del contatto fisico, rappresentano un passo importante verso l’agi.
per generare video con contenuti realistici e immagini realistiche, è necessario un modello interno per comprendere come tutti gli oggetti e gli esseri umani si muovono e interagiscono nell'ambiente. pertanto, credono che sora contribuirà allo sviluppo dell'intelligenza artificiale generale.
in termini di metodologia, sia tim brooks che bill peebles hanno sottolineato in particolare la scalabilità del modello. credono che il motivo per cui il modello linguistico abbia così tanto successo sia la sua capacità di espandersi e hanno citato le opinioni di "the bitter lesson":
nel lungo termine, i metodi che migliorano le prestazioni man mano che crescono, alla fine prevarranno con l’aumento della potenza di calcolo.
creando una struttura basata su transformer e confrontando diversi modelli sora, hanno dimostrato l'impatto di un aumento dei calcoli nell'addestramento dei modelli sui miglioramenti delle prestazioni.
dal modello base a un modello con calcoli aumentati di 32 volte, si può notare un graduale miglioramento nella comprensione delle scene e degli oggetti.
abbiamo sempre cercato di mantenere il nostro approccio semplice, anche se a volte la realtà è più impegnativa di quanto sembri.
il nostro obiettivo principale è rendere qualcosa il più semplice possibile e poi ridimensionarlo in modo massiccio.