私の国の自主開発ビデオモデルが世界的に開始される

私の国が独自に開発したビデオモデルが世界的に発売される

2024-08-02

テキストの説明を入力するか、画像をアップロードして、リアルなビデオを生成します。最近、我が国が独自に開発した汎用ビデオモデルである Vidu (www.vidu.studio) が世界的に正式に発売されました。この大規模なビデオモデルは、Wensheng Video と Tusheng Video の 2 つのコア機能を開き、4 秒と 8 秒の 2 つの継続時間オプションを提供し、最大 1080P の解像度で、4 秒のビデオを生成するのにわずか 30 秒しかかからないと報告されています。実際の測定に従ってクリップします。

写真は、テキストの説明に基づいて Vidu によって生成されたビデオ画面を示しています。（写真提供：取材対象者）

Viduは清華大学とBeijing Shengshu Technology Co., Ltd.が共同開発し、今年4月の2024年中関村フォーラム年次総会で初公開された。清華大学人工知能研究所の副所長であり、北京盛樹技術の主任研究員であるZhu Jun氏は、Viduには「長時間、高一貫性、高ダイナミックス」という特徴があり、それに基づいて高解像度のビデオを生成できると述べました。テキストと画像を高い滑らかさを維持し、非常にダイナミックな画像効果を実現します。現時点では、Vidu は一度に最大 32 秒のビデオの生成をサポートできます。

「Vidu は現実の物理世界をシミュレートし、複雑な詳細を備えたシーンを生成し、合理的な光と影の効果、繊細なキャラクター表現などの物理法則に準拠することができ、深みと複雑さを備えた超現実的なコンテンツも作成できます。」と Zhu Jun 氏は述べています。 SF、西部劇、ロマンス、アニメーションなどのさまざまなタイプの映画に対して、Vidu は対応するスタイルに一致する画像クリップを生成でき、煙、グレア、煙などの映画やテレビレベルの特殊効果も生成できます。その他の効果。

画像は、テキストの説明に基づいて Vidu によって生成された特殊効果画面を示しています。（写真提供：取材対象者）

レポートによると、ダイナミクスの点では、Vidu は複雑なダイナミックショットを生成でき、大規模かつ正確なアクション生成をサポートし、画面内で遠景ショット、近景ショット、中間ショット、クローズアップなどの異なるショットを切り替えることができます。ロングショット、トラッキングショットなど、フォーカス、トランジション、その他のエフェクトを直接生成できます。

記者はBeijing Shengshu Technology Co., Ltd.から、Vidu VideoとTu Sheng Videoの2つの基本機能に加えて、より多様でパーソナライズされたビデオ作成体験をユーザーに提供するために、Viduは「アニメーションスタイル」も開始したことを知りました。「キャラクターの一貫性」という 2 つの新機能。「土生ビデオ」セクションでは、「キャラクターの一貫性」機能を使用して、ユーザーはポートレートまたはカスタマイズしたキャラクターの写真をアップロードし、テキストの説明を通じて写真内のキャラクターを指定して、任意のシーンで任意のアクションを実行できます。この機能により、ビデオ制作プロセスが簡素化され、クリエイティブな自由度が高まります。

Vidu を操作するためにアプリケーションは必要ないと報告されており、ユーザーは電子メールアドレスで直接登録して開始できます。 Vidu の技術的進歩は、研究開発チームの機械学習とマルチモーダル大規模モデルにおける長期的な蓄積から生まれており、そのコア技術アーキテクチャは 2022 年にチームによって提案され、独立した研究開発を継続しています。

出典: 新華社通信

記者：魏夢佳

編集者：張子清

校正：秦大新

ニュース

私の国が独自に開発したビデオモデルが世界的に発売される

導入

私の連絡先情報