ニュース

ソラは時代遅れですか? meta の「最強のビデオ モデル」は dit を使用せず、llama を使用して奇跡を起こす

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

著者|王昭陽

openai sora の主要な技術リーダーが google に行き、openai sora が内部品質の問題で困難を抱えていると複数の報道が指摘したこの時点で、meta は無礼にもビデオ モデル「movie gen」をリリースし、完全な評価システムを直接使用したと宣言しました。ソラを倒したのだ。

さらに残酷なのは、meta も「人を殺している」ということです。このモデルは sora のように一般公開されていませんが、新しいモデルの 95 ページの技術レポートが作成されています (オープンソースではありませんが、多くの詳細が含まれています)。 )公開してみんなに伝えました:

このモデルは事実上ソラを破っただけでなく、新たなテクニカルルートを採用しており、ソラのテクニカルルートがもはや今日の最先端ではないことが証明された。

vincent video プレイヤーの皆様、sora を「コピー」しないでください。

1

「メディアペデスタルモデル」

正確に言うと、meta は「ai 生成のメディア コンテンツ」を実現するために作成された組み合わせである一連のモデルをリリースしました。これは、この技術文書のタイトルの意味でもあります: movie gen: a cast of media foundation models

このセットには以下が含まれます:

最大の基本的な gen video 生成モデルである movie gen video には、300 億のパラメータがあります。

最大の基本的なビデオ生成オーディオ モデルである movie gen audio には、130 億のパラメータがあります。

movie gen video モデルをさらにポストトレーニングして取得したパーソナライズされた movie gen video は、個々の顔に基づいてパーソナライズされたビデオを生成するために使用されます。そして、正確なビデオ編集のための movie gen edit を生成する新しいポストトレーニング プロセス。