notizia

sora è obsoleto? il "modello video più potente" di meta non utilizza dit, ma utilizza llama per fare miracoli

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autore|wang zhaoyang

a questo punto, quando il principale leader tecnico di openai sora si è rivolto a google e diversi rapporti hanno sottolineato che openai sora stava avendo difficoltà con problemi di qualità interna, meta ha rilasciato senza tante cerimonie il suo modello video "movie gen" e ha utilizzato direttamente un modello completo. il sistema di valutazione ha dichiarato che aveva sconfitto sora.

la cosa ancora più crudele è che anche meta sta "uccidendo persone". sebbene questo modello non sia aperto al pubblico come sora, ha realizzato una relazione tecnica di 95 pagine del nuovo modello (non open source, ma contiene molti dettagli). ) pubblico e disse a tutti:

questo modello non solo ha sconfitto sora in effetti, ma ha anche utilizzato un nuovo percorso tecnico, il che ha dimostrato che il percorso tecnico di sora non è più il più avanzato oggi.

cari lettori di vincent video, per favore non “copiate” sora.

1

"modello piedistallo multimediale"

per la precisione, meta ha rilasciato una serie di modelli, una combinazione creata per ottenere "contenuti multimediali generati dall'intelligenza artificiale". questo è anche il significato del titolo di questo articolo tecnico: movie gen: a cast of media foundation models

questo set include:

il più grande modello di generazione gen video di base, movie gen video, ha 30 miliardi di parametri.

il più grande modello audio di generazione video di base, movie gen audio, ha 13 miliardi di parametri.

il video movie gen personalizzato ottenuto mediante un ulteriore post-addestramento del modello movie gen video viene utilizzato per generare video personalizzati basati sui singoli volti. e un nuovo processo di post-formazione che genera movie gen edit per un editing video preciso.