ニュース

ビデオ生成モデルの一貫性の問題を解決するために、中国版「sora」viduは「1枚の写真で被写体をロックする」機能をリリース

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

shengshu technologyは9月11日、メディアオープンデーイベントを開催し、あらゆる被写体の一貫した生成を実現し、ビデオ生成をより安定して制御しやすくする「subject consistency」機能をリリースした。この機能は現在無料でユーザーに公開されていることがわかります。

以前、4月末に、shengshu technologyと清華大学が共同開発したオリジナルの大規模ビデオモデルであるviduが世界にリリースされ、7月末に正式にリリースされ、完全に使用可能になりました。

shengshu technologyの最高経営責任者(ceo)tang jiayu氏は、一般公開日に「日刊経済ニュース」の記者を含むメディア記者に対し、「主題参照」機能はビデオモデルの「制御不能な」制限を解決することを目的としていると語った。現在、ビデオ モデルには弱い連続性やランダムな出力などの制限があります。連続性が弱いとは、特に複雑なインタラクションが含まれる場合、ビデオが生成されるたびに、主題、シーン、スタイルなどの一貫性が保証できないことを意味します。ランダム出力とは、出力結果が比較的ランダムであり、ミラーの動きや光の効果などの詳細を細かく正確に制御することを継続的に試行する必要があることを意味します。

shengshu technology ceo、tang jiayu氏の写真出典: daily記者li shaotingによる写真

以前、業界は「まず ai が写真を生成し、次に写真がビデオを生成する」という方法を採用しようとしました。ai 描画ツールを使用してスプリットショット写真を生成し、最初に写真レベルで被写体の一貫性を保ち、次に写真をビデオに変換しました。クリップを編集し、合成します。

「被写体参照」機能では、任意の被写体の写真をアップロードして被写体の画像をロックしたり、ディスクリプタを通じて任意にシーンを切り替えたり、同じ被写体の動画を出力したりすることができます。この機能は単一のオブジェクトに限定されず、キャラクター、動物、商品、アニメのキャラクター、架空の被写体など「あらゆる被写体」に対応します。

毎日の経済ニュース

レポート/フィードバック