ニュース

国内のAIビデオ大型モデルの展開における実践経験の点でSoraを超えることができるのは誰でしょうか?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

カバーニュース記者のシオン・インイン
今年の初め、アメリカのOpenAI社は、地に落ちる雷のようなAIビデオ生成モデルSoraをリリースし、人工知能アプリケーションに新たな可能性をもたらしました。当時、多くのネチズンは外国のAI技術との差がますます広がっていると嘆いていた。
しかし、わずか半年の間にKeling、PixVerse V2、Qingying、Viduといった「国産Sora」が次々とリリースされ、ユーザーに無料で公開されています。
国内のビデオモデルはどれが一番いいのでしょうか?テクノロジーが進歩を続ける中、商業化の先頭に立つことができるのは誰でしょうか?
今月中に「国産SORA」4商品を発売
記者の実体験
国内大手メーカーと大型モデルとの価格競争が熾烈を極める中、AI動画生成の分野に注力し、暗躍する企業もある。不完全な統計によると、現時点で国内には大規模なAIビデオモデルが10以上あり、今年7月だけでも4つの「国産Sora」モデルがオンラインで発売された。
7月6日、Kuaishou Keling AIウェブページが正式に公開され、最大10秒のビデオを生成できる文生ビデオ機能と土生ビデオ機能が提供され、カメラの動きの制御や最初と最後のフレームのカスタマイズなどの機能も追加されました。
7月24日、アイシテクノロジーはPixVerse V2を正式リリースし、全世界同時公開となる。このモデルは一度に複数のビデオクリップを生成でき、単一クリップで 8 秒、複数クリップで 40 秒のビデオ生成を実現します。
その後、Zhipu AI Companyが作成したQingying、Shengshu Technologyが独自に開発したViduも次々とリリースされました。その中で、Qingying は 30 秒以内の迅速な生成に重点を置いており、Vidu は一般的なリアルなスタイルに加えて、アニメーション スタイルのビデオ クリップ生成を追加しています。
上記4社の大規模動画生成モデルは現在、電話やメールなどで早速登録し、記者も実際に体験してみた。
「写真ビデオ」機能をテストするために、記者はまだ開花していないバラの同じ写真を 4 つの大きなモデル Web サイトにアップロードし、「花が咲く」というプロンプトの単語を入力すると、Qingying と Vidu は両方ともバラのアニメーションを生成することに成功しました。花が咲いている動画。 PixVerse と Keling によって生成されたビデオでは、花が揺れているのが見えますが、「咲く」というダイナミックな効果はありません。しかし、記者がプロンプトの言葉を「ゆっくりと咲く花」に変えると、ケリング氏はバラが咲くビデオの生成にも成功した。言語を処理して理解する能力には、大規模なモデルごとに違いがあることがわかります。
国内大型モデル4台のスクリーンショット動画
ビデオの生成速度から判断すると、Vidu が最も速く、1 分未満で 3 秒のビデオを生成しました。他の 3 つの大きなモデルはすべて 5 分以内にビデオ生成を完了しました。 Qingying は「30 秒で高速生成」を宣伝していますが、試している人が多すぎるためか、生成ページには「3 分間のキューが予想されます」と表示されています。
ソーシャルプラットフォーム上のネチズンからの経験フィードバックから判断すると、すべての主要モデルには多かれ少なかれ文字の歪みや画像の欠落などの問題があります。
「様子見する人は多いが、行動を起こす人は少ない。」
大型モデル分野への投資は慎重になりがち
ソラが生まれた年初当時、ネット上ではまだ中国はAI分野で米国に大きく遅れをとっているとの悲観的な声があった。わずか半年の間に、Sora と競合する大規模な AI ビデオ モデルが中国で多数登場しました。
Tianyancha 氏は、2019 年に設立された Zhipu AI がシリーズ C 資金調達を完了し、現在評価額が 100 億ドルを超えていることを示しています。 Aishi TechnologyとShenshu Technologyは2023年に設立されたばかりだが、それぞれ3ラウンドと4ラウンドの資金調達を完了している。ということは、投資界は依然として大型モデルのサーキットへの投資に非常に熱心だということなのでしょうか?
「基本的に、私たちは依然として多くのことを見て、投資はほとんどありません。」 エンジェル投資家で人工知能分野の専門家であるグオ・タオ氏は、現時点で最大の投資家は複数の大規模モデルに大規模な投資を行っている大手インターネット企業数社であると述べた。プロジェクト。大手メーカーは、既存のビジネスで大規模なビデオ モデルのいくつかのアプリケーション シナリオを見つけることができる一方で、これらの大規模なモデルが自社のビジネスとある程度重複する場合は、それらを補完として使用できます。これらの大手モデル企業は、既存の生態資源を通じて、ある程度の力を得ることができます。
Zhipu AI社は複数回の資金調達ラウンドで1億元以上を調達
全体として、国内の投資機関は、Vincent Video や Tush Video などの大型モデルに対して依然として保守的かつ慎重な姿勢を保っています。その主な理由は、それらの商品化が多くの課題に直面していることです。
Guo Tao 氏の見解では、Sora であろうと国内の大型モデルであろうと、生成されたビデオには依然として一定の欠陥があります。たとえば、AI によって生成されたキャラクターには指が余分にある場合や、射撃時にバスケットに当たらない場合などがあります。これは、大規模モデルではオブジェクト間の空間関係の理解が不十分であることを示しており、アルゴリズム モデルもさらに改善する必要があります。
依然として克服する必要がある技術的問題に加えて、大規模な AI ビデオ モデルの商用化における最大の問題点は、成熟したアプリケーション シナリオが欠如していることです。
「たとえば、Kuaishou 自体にはプラットフォームとコンテンツがあり、比較的言えば、特定のアプリケーション シナリオがあります。多くのセルフメディア企業がこれを使用する可能性がありますが、一部の純粋な技術企業にとっては、それらを見つけるのはまだ困難です。」 . ユーザーが喜んで支払う、特に優れた厳格な需要シナリオ。
プラットフォームが商業化の探求を加速する
マイクロショートドラマ市場は先行して上陸すると予想される
商業化には課題はあるものの、国内外の大型モデルプラットフォームは商業化に向けた模索と試みを積極的に行っている。
記者は現在、国内のAIビデオモデルも消費者側で支払いを開始していることに気づきました。 7月24日、Keling AIのWeChat公式投稿では、許可を申請したユーザーの数が100万人を超えたと明らかにし、同日、ゴールド、プラチナ、ダイヤモンドの3つの会員カテゴリーを含む有料会員システムを同時に開始した。年会費は500元以上から5,000元以上まであります。
PixVerseはサブスクリプション支払いモデルを採用しており、基本バージョン、標準バージョン、無制限バージョンがあり、単価は5元から60元の範囲です。
しかし、多くの業界関係者は、現在、大規模なAIモデルは計算能力コストが非常に高く、ユーザーの支払い習慣がまだ形成されておらず、市場競争のみに依存して収益性を達成するのは簡単ではないと述べています。 C側の支払いで。
メディアの報道によると、今年6月、世界的に有名な子供向け玩具ブランド「トイザらス」がOpenAIと協力し、ソラが制作した1分間のコマーシャルフィルム「トイザらスの起源」の使用を許可した。実行可能な商業広告を生成します。
7月には、国内初のAIGCオリジナルファンタジーマイクロ短編ドラマ「山と海の奇妙な鏡:波を打ち破る」が正式にスタートした。ドラマは5話構成で、ドラマでは鋭いエッジの少年が主人公。 、幻想的なクンペンや奇妙な獣などはすべて AI によって生成されます。
ますます多くの制作会社やプラットフォームが「AI + マイクロ短編ドラマ」の統合の道を模索し始めているため、AIビデオの大型モデルがマイクロ短編ドラマ市場で最初に商品化される可能性があります。
レポート/フィードバック