2024-10-05
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
autor|wang zhaoyang
zu diesem zeitpunkt, als der technische hauptleiter von openai sora zu google ging und mehrere berichte darauf hinwiesen, dass openai sora probleme mit internen qualitätsproblemen hatte, veröffentlichte meta kurzerhand sein videomodell „movie gen“ und verwendete direkt ein vollständiges bewertungssystem es hatte sora besiegt.
was noch grausamer ist, ist, dass meta auch „menschen tötet“. obwohl dieses modell nicht wie sora für die öffentlichkeit zugänglich ist, hat es den 95-seitigen technischen bericht des neuen modells erstellt (nicht open source, enthält aber viele details). ) öffentlich und sagte allen:
dieses modell besiegte sora nicht nur praktisch, sondern nutzte auch eine neue technische route – was bewies, dass soras technische route heute nicht mehr die fortschrittlichste ist.
liebe vincent video-spieler, bitte „kopiert“ sora nicht.
1
„mediensockelmodell“
um genau zu sein, hat meta eine reihe von modellen veröffentlicht, eine kombination, die geschaffen wurde, um „ki-generierte medieninhalte“ zu erreichen. das bedeutet auch der titel dieses fachartikels: movie gen: a cast of media foundation models
dieses set beinhaltet:
das größte grundlegende gen-video-generierungsmodell, movie gen video, verfügt über 30 milliarden parameter.
das größte grundlegende audiomodell der videogeneration, movie gen audio, verfügt über 13 milliarden parameter.
das personalisierte movie-gen-video, das durch weiteres nachtraining des movie-gen-video-modells erhalten wird, wird verwendet, um personalisierte videos basierend auf einzelnen gesichtern zu generieren. und ein neuer post-training-prozess, der movie gen edit für eine präzise videobearbeitung generiert.