ニュース

同じ画像が異なるシーンに表示されることもあります。大型ビデオモデル vidu がメジャーアップデートを歓迎

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9月11日、shengshu technologyと清華大学が共同開発した自社開発のオリジナルビデオモデルviduは、「subject consistency」機能を備えた大幅なアップデートを受けました。この機能は、あらゆる主題の一貫した生成を実現し、ビデオの生成を可能にします。より安定して制御可能になります。この機能は現在、ユーザーに無料で公開されています。
役割の一貫性の問題を解決するために、サブジェクト参照機能をオンラインで起動します
現在、vincent ピクチャ機能でも、vincent ビデオ機能でも、広く批判されている問題は、写真またはビデオ内の画像の主題の一貫性です。同じプロンプトワードと同じ大きなモデルが 2 回生成され、生成される内容が異なるため、芸術作品では主人公のイメージに一貫性がなくなり、ai 生成との大きな違いの 1 つにもなります。仕事も人間も一つ。
この問題を解決するために、業界は「まず ai が写真を生成し、次に写真がビデオを生成する」という方法を採用しようとしました。midjourney などの ai 描画ツールを使用してスプリットショット写真を生成し、まず写真で被写体の一貫性を保ちます。レベルを調整し、これらの写真をビデオに変換して編集します。
しかし問題は、ai 描画の一貫性が完全ではなく、修正や部分的な再描画を繰り返すことで解決する必要があることが多いことです。さらに重要なことは、実際のビデオ制作プロセスには多くのシーンとレンズが含まれることです。この方法で複数のコンポーネントからなるレンズ シーンを処理する場合、描画の作業負荷は膨大であり、プロセス全体の半分以上を占める可能性があり、最終的なビデオ コンテンツも完成します。スプリットショットに依存しすぎるため、創造性と柔軟性が欠けています。
shengshu technology が 9 月 11 日に開催したメディアオープンデーイベントで、shengshu technology は「被写体参照」機能をデモンストレーションしました。この機能により、ユーザーは任意の被写体の写真をアップロードでき、vidu は被写体の画像をロックして、それを説明することができます。シーンを任意に切り替えて同じ被写体の映像を出力できます。
この機能は、単一のオブジェクトに限定されるものではなく、人物、動物、商品、アニメキャラクター、架空の被写体など、「あらゆる被写体」を対象として、映像生成における一貫性と制御性を確保することができます。ビデオ 発電分野における大きな革新。 vidu は、この機能をサポートする世界初の大型ビデオ モデルでもあります。
たとえば、登場人物に「主題参照」を使用する場合、それが実在の人物であろうと架空の人物であろうと、vidu は異なる環境や異なるレンズの下でもイメージの一貫性を保つことができます。 rushengshu technologyの会長兼最高経営責任者(ceo)のtang jiayu氏は、陳暁徐が演じる林大宇の画像をさまざまなシーンや服装で提供することで、「林大宇がコーヒーを飲んでいる」シーンが「コーヒーを飲んでいる」シーンに見えることを現場で示した。同じ林大宇」。
shengshu technology の会長兼 ceo である tang jiayu 氏は、現場で「主題参照」機能をデモンストレーションしました。写真提供:北京ニュースシェルファイナンス記者、ルオ・イーダン
ai ビデオ作成の一貫性により、完全な ai ナラティブの時代が大幅に改善されます。
この機能に基づいて、中国中央ラジオテレビ局のディレクターでaigcアーティストのshi yuxiang氏(senhai fluorescent)は、アニメーション短編映画「summer gift」を作成した際に、基本的なtushengビデオ機能と比較したと述べました。 「被写体参照」機能により、静止画の制約が取り除かれ、生成される画像はより魅力的かつ自由になり、制作の一貫性が大幅に向上します。同時に、絵制作の作業負荷が約 70% 軽減され、効率が大幅に向上したため、絵素材の作成よりもストーリーの内容を磨き上げることに集中できるようになりました。同時に、一貫性により事後編集が容易になります。
中国中央ラジオテレビ局のディレクターでaigcのアーティストであるshi yuxiang氏は、「主題参照」機能を通じて作成されたアニメーションを現場で実演し、アニメーション内の主人公のイメージが安定していることがわかりました。写真提供:北京ニュースシェルファイナンス記者、ルオ・イーダン
tang jiayu氏は、「主題参照」の新機能の開始は完全なai物語の始まりを表しており、aiビデオ作成もより効率的で柔軟な段階に進むだろうと述べた。短編ビデオ、アニメーション、コマーシャルのいずれを作成する場合でも、物語の芸術において、完全な物語システムは、「一貫した主題、一貫したシーン、一貫したスタイル」などの要素の有機的な組み合わせです。
したがって、ビデオ モデルが物語の完全性を実現するには、これらのコア要素が完全に制御可能である必要があります。 「body reference」機能は vidu にとって一貫性への重要なステップですが、それは始まりにすぎません。今後も vidu は、より高いレベルの物語のニーズを満たすために、複数の被験者のインタラクション、統一されたスタイル、変化するシーンの安定した切り替えなどの複雑な要素を正確に制御する方法を引き続き模索していきます。
同氏は、長期的な観点から、包括的な制御可能性が実現されれば、ビデオ制作業界は破壊的な変化を迎えるだろうと述べた。それまでに、キャラクター、シーン、スタイル、さらにはレンズの使用、光と影の効果などの要素が、柔軟に調整可能なパラメーターに変換されます。ユーザーは指を動かしてパラメーターを調整するだけで映像作品の制作が完了し、それぞれの作品の背後にはaiによるユーザー独自の世界観と自己表現が存在します。
北京ニュースシェルファイナンスの記者、羅宜丹編集者の王晋宇氏が校正する楊立氏
レポート/フィードバック