nouvelles

sora est-il obsolète ? le "modèle vidéo le plus puissant" de meta n'utilise pas dit, mais utilise llama pour faire des miracles

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

auteur|wang zhaoyang

à ce stade, lorsque le principal responsable technique d'openai sora s'est adressé à google et que plusieurs rapports ont souligné qu'openai sora rencontrait des difficultés avec des problèmes de qualité interne, meta a publié sans cérémonie son modèle vidéo "movie gen" et a directement utilisé un système d'évaluation complet. il avait vaincu sora.

ce qui est encore plus cruel, c'est que meta "tue aussi des gens". bien que ce modèle ne soit pas ouvert au public comme sora, il a réalisé le rapport technique de 95 pages du nouveau modèle (pas open source, mais contient beaucoup de détails). ) en public et a dit à tout le monde :

ce modèle a non seulement vaincu sora dans les faits, mais a également utilisé une nouvelle voie technique, ce qui a prouvé que la voie technique de sora n'est plus la plus avancée aujourd'hui.

chers lecteurs vidéo vincent, ne « copiez » pas sora.

1

"modèle de piédestal médiatique"

pour être précis, meta a publié une série de modèles, une combinaison créée pour obtenir un « contenu multimédia généré par l'ia ». c'est également ce que signifie le titre de ce document technique : movie gen : a cast of media foundation models

cet ensemble comprend :

le plus grand modèle de génération de base de gen video, movie gen video, comporte 30 milliards de paramètres.

le plus grand modèle audio de génération vidéo de base, movie gen audio, comporte 13 milliards de paramètres.

la vidéo movie gen personnalisée obtenue par post-formation supplémentaire du modèle movie gen video est utilisée pour générer des vidéos personnalisées basées sur des visages individuels. et un nouveau processus post-formation qui génère movie gen edit pour un montage vidéo précis.