nachricht

ist sora veraltet? metas „stärkstes videomodell“ nutzt nicht dit, sondern llama, um wunder zu bewirken

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor|wang zhaoyang

zu diesem zeitpunkt, als der technische hauptleiter von openai sora zu google ging und mehrere berichte darauf hinwiesen, dass openai sora probleme mit internen qualitätsproblemen hatte, veröffentlichte meta kurzerhand sein videomodell „movie gen“ und verwendete direkt ein vollständiges bewertungssystem es hatte sora besiegt.

was noch grausamer ist, ist, dass meta auch „menschen tötet“. obwohl dieses modell nicht wie sora für die öffentlichkeit zugänglich ist, hat es den 95-seitigen technischen bericht des neuen modells erstellt (nicht open source, enthält aber viele details). ) öffentlich und sagte allen:

dieses modell besiegte sora nicht nur praktisch, sondern nutzte auch eine neue technische route – was bewies, dass soras technische route heute nicht mehr die fortschrittlichste ist.

liebe vincent video-spieler, bitte „kopiert“ sora nicht.

1

„mediensockelmodell“

um genau zu sein, hat meta eine reihe von modellen veröffentlicht, eine kombination, die geschaffen wurde, um „ki-generierte medieninhalte“ zu erreichen. das bedeutet auch der titel dieses fachartikels: movie gen: a cast of media foundation models

dieses set beinhaltet:

das größte grundlegende gen-video-generierungsmodell, movie gen video, verfügt über 30 milliarden parameter.

das größte grundlegende audiomodell der videogeneration, movie gen audio, verfügt über 13 milliarden parameter.

das personalisierte movie-gen-video, das durch weiteres nachtraining des movie-gen-video-modells erhalten wird, wird verwendet, um personalisierte videos basierend auf einzelnen gesichtern zu generieren. und ein neuer post-training-prozess, der movie gen edit für eine präzise videobearbeitung generiert.