ニュース

shengshu technology ceo、tang jiayu 氏: ビデオ生成はまだ初期段階にあり、克服すべき技術的なボトルネックがあります。

2024-09-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

00:04
「ai を使用して物語映画を作成すると、廃棄された映画の比率は 50:1 になる可能性があります。つまり、50 枚の写真が生成され、そのうちの 1 枚だけがこの種の物語の作成に適している可能性があります。」 9 月 11 日、北京盛舟にて。 technology co., ltd.(以下、shengshu technology)はメディアオープンデーイベントを開催し、映画やテレビのクリエイターが共有時に上記の声明を発表しました。
大規模モデル生成テクノロジーの発展により、ますます多くの映画やテレビのクリエイターが作品に ai テクノロジーを使用しようと試み始めていますが、現時点ではまだ多くの問題点があります。
「ai が生成したビデオは制御できず、要素が多すぎると、複数のキャラクターや空間シーンを理解できなくなります」と、ai 映画およびテレビのクリエイターであるヴィッキー氏は述べています。国内外の多くの ai 映画やテレビのクリエイターは、実際の制作プロセスにおいて、特に複雑なシーンやインタラクティブなシーンが含まれる場合、共通の中心的な問題は制御性の不足や一貫性の欠如であると述べています。
ai ビデオ モデルは指示に従ってうまく機能しますが、出力結果はまだ不確実で、満足のいく画像を生成するには複数回の試行が必要になる場合があります。さらに、ai で生成されたモデルには、カメラの動き、光と影の効果、細部の処理の点で依然として制限があり、完全かつ微細な制御を実現することが困難です。
shengshu technologyは、今年7月30日にai生成ビデオモデルを正式にリリースし、クリエイターの効率向上を支援するために、同社はこのほどビデオモデルviduの機能をアップグレードし、「主題参照」機能をリリースしました。一貫性の問題に対処すると、あらゆる被写体の一貫した生成が実現され、ビデオ生成がより安定して制御可能になります。
「被写体参照」機能により、ユーザーは任意の被写体の写真をアップロードし、その被写体の画像をロックし、記述子を通じて任意にシーンを切り替え、同じ被写体のビデオを出力できます。
9 月 11 日、the paper technology (www.thepaper.cn) の記者は shengshu technology の公式 web サイトの vidu プラットフォームにログインし、ビデオ生成を試しました。アメリカの映画スター、レオナルド・ディカプリオの立体写真をアップロードし、「青空」「ワイングラス」「乾杯」などのキーワードを入力。
入力単語:「青空」「ワイングラス」「乾杯」など
vidu で生成された画像は次のとおりです。
00:04
日本のアニメ「青春」のヒロインの2dスクリーンショットをアップロードし、「ランニング」「遅刻」「朝」などのキーワードを入力します。
vidu で生成された画像は次のとおりです。
00:04
shengshu technology の共同創設者兼 ceo である tang jiayu 氏はインタビューで、vidu の「主題参照」機能は現在、一貫した生成機能を備えた世界初のテクノロジーであると述べました。 shengshu technology の中核的なタスクは、マルチモーダルな大規模モデルを構築することです。ai ビデオ生成はまだ初期段階にあり、将来的にはさらに多くの技術的なボトルネックを克服する必要があります。同氏は、aiビデオ技術は必ずしも一部の人々のためのツールではないと考えており、今年末までにaiビデオ技術が一般に普及し、ユーザーが簡単に利用できるようになるだろうと予測している。
shengshu technology は 2023 年 3 月に設立されました。コアチームのメンバーは清華大学人工知能研究所の出身であり、主任研究員の zhu jun は清華大学の教授であり、共同創設者兼 ceo の tang jiayu は自然科学の修士号を取得しています。清華大学言語処理研究所、ruilai intelligence 副社長、tencent youtu lab シニア プロダクト マネージャーの元従業員。
the paperの記者ユウ・ヤンさんとインターンのワン・チュンさん
(この記事はthe paperからのものです。よりオリジナルの情報については、「the paper」アプリをダウンロードしてください)
レポート/フィードバック