ニュース

ソラを待ちきれない老人はクアイショウケリンへ急ぐ

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Kuaishou が AI ビデオを発売した最初の大手メーカーであるのはなぜですか? ‍♀️‍♀️‍♀️

テキスト | チェン・メイシー

編集者 | ディレクター

Open AI が大型モデルの分野で世界を席巻した初期の頃、Kuaishou はそれほど輝かしい人物ではありませんでした。当時、BaiduはWenxinyiyanを、AlibabaはTongyi Qianwenを、TencentはHunyuanのビッグモデルを考え出し、互いに追いつき、研究開発とオープンのスピードは非常に速かったです。

Kuaishou は最初の候補リストには含まれておらず、現在でも Kuaishou の大きな言語モデルである Ruyi の名前を挙げることができる人はほとんどいません。

戦況が変わったのは今年 6 月 6 日で、Kuaishou のビデオで生成された大型モデル Keling がパブリック ベータの申請を開始しました。その日は Kuaishou の 13 周年でもありました。メディアはよく Keling を Open AI の Sora と比較しますが、2 月に爆発的にデビューして以来、Sora は一般公開されていません。その結果、好奇心旺盛な中国人ユーザーがケリングに集まり始めました。

10日後、Keling社は「数万件の申請を受け取った」という。このデータは、その日知源会議に出席したWan Pengfei氏からのものである。講演当時の肩書きはKuaishou Visual Generation and Interaction Center所長であり、Kelingの実際の責任者でもあった。 7月19日時点で応募者数は100万人を突破した。 Keling 氏は、アプリケーション数を数万から 100 万に増やすのにわずか 1 か月以上かかりました。これは、今年上半期の大型モデルの進歩の中で最も目を引くパフォーマンスです。


精霊が生み出した絵、発せられる言葉:花の中の蜂

逆転の物語は常に大衆の間で人気があります。しかし、ケリングとその背後にあるクアイショウの大型モデル事業を注意深く調べてみると、これが眠っていて突然現れるクールなドラマではないし、才能のある若者が小さなチームを率いて攻撃を仕掛ける英雄的な物語でもないことがわかるだろう。戻る。

Keling によって生成された画像に基づいて、「ミツバチが飛び回っている」というプロンプト ワードを含むビデオがさらに生成されます。

Kuaishou が AI ビデオを発売した最初の大手メーカーであるのはなぜですか?強い動機と高い優先順位をもたらすのはビジネス ニーズであり、反復速度をもたらすのは製品形式でのデータとテクノロジーの蓄積であり、実際の顧客をもたらすのはビジネス シナリオのマッチングです。

柯玲の出現は偶然の出来事ではありません。国内では、AIビデオ分野におけるKuaishouの最大のライバルはByteDanceである可能性が高い。


需要があればモチベーションも生まれる

クリエイターは、Kuaishou コンテンツ エコシステムにおける最も重要なリンクの 1 つです。 Kuaishou が発表した公式データによると、2023 年には Kuaishou でショートビデオを初めてリリースしたクリエイターは 1 億 3,800 万人となり、年間を通じてリリースされたビデオはプラットフォーム上で 1 兆件以上の「いいね!」を獲得すると予想されています。

多数のコンテンツ クリエイターがいるということは、Kuaishou がコンテンツ ツールに対するニーズを引き継ぐ必要があることを意味します。そうでないと、新たな生産性を追い求めているクリエイターはすぐに他のツール、さらには他のプラットフォームに殺到するでしょう。これは、Kuaiying to Kuaishou および Cut to Byte の価値でもあります。

したがって、Kuaishou の大規模言語モデルへのこれまでの投資は過激なものではありませんでしたが、マルチモーダル大規模モデルの競争で上位を目指して努力する必要があります。

Keling が登場する前は、Kuaishou が自社開発した Wenshengtu の大規模モデル機能が Kuaishou に統合されていました。内部テストの結果、ユーザーは毎月平均 5 億以上の AI 画像を生成しました。


Keling が生成した画像、プロンプトワード: 長江のほとりに立つ外国人

需要によってもたらされる強い動機は確かにケリンの出現に必要な条件であるが、これらの条件を備えているのはクアイショウだけではない。柯玲の出現に影響を与えた他の重要な要素があるとすれば、それは決意かもしれません。

その決意はまずKuaishouのトップマネジメントから発せられる。

以前は、大型モデルでの Kuaishou の動きは常に半歩遅く見えました。国内の大規模言語モデルに関して言えば、誰もがまず Wen Xin Yi Yan と Tong Yi Qian Wen を思い浮かべるでしょう。大規模言語モデル アプリケーションに関して言えば、市場で最も人気があるのは Kim と Doubao です。 Vincentian グラフィックスの分野では、SenseTime の Ririxin 5.0 が国内市場で最初にブレイクし、リリースの翌朝には SenseTime Technology の株価が 30% 以上上昇し、取引が一時停止されました。

これまでの一連の物語では、クアイショウは一見限界的な立場にありました。ビデオ大規模モデルとそのア​​プリケーションは、競争において最も重要なノードであり、大規模モデル全体のレイアウトの最も重要な部分です。

テクノロジーメディアのSilicon Starによる以前のレポートでは、Kelingチームの技術者は「Gai Kunがよく言っているのは、会社のカードはすべてあなたが使うためのものであり、会社はYu Gai Kunを全面的にサポートしているということだ」と述べた。 Kuaishou の上級副社長であり、ステーションライン事業の責任者であり、社会科学ラインの責任者でもあります。元CTOのChen Dingjia氏が辞任した後、Gai Kun氏はKuaishouのテクノロジーラインのトップリーダーの1人となった。

万鵬飛と彼のチームはさらに大きな決意を抱くかもしれない。1つの詳細は、Kelingプロジェクトを引き継ぐことを決定した後、Wan Pengfeiがすべての関係者のビジネスニーズを引き受けるという本来の仕事を、Zhang Diのチームの同じレベルを担当する他の人々に引き継いだことです。これに対応して、Keling チームの他のメンバーも元の業務を引き継ぎ、Keling の研究開発に専念しており、進捗状況を追いつくために週末は残業するのが普通です。

Keling が生成した写真に基づいてさらに生成されたビデオ、プロンプト メッセージ: 水の中を歩くエイリアン、ハイタッチする 2 人のエイリアン

「実際、正式リリースの1か月以上前に、柯玲のテスト結果はあまり良くありませんでした。」大手模型業界の関係者はヘッジホッグコミューンに、「ラオ・ワンと他の人たちは困難と戦っています。以下は次のとおりです。」まさに「大きな力を伴う奇跡的な結果」でした。多くの人は、最終的にこれほどの効果を期待していませんでした。」

したがって、決意が最後の変数になりました。


積み重ねがスピードにつながる

Kuaishou または主要なショートビデオ プラットフォームは、コンテンツとテクノロジーの 2 つの側面で AI ビデオを開発する経験を蓄積してきました。

動画はユーザーによって作成され、プラットフォームによって注釈が付けられ、理解された後、配信できるコンテンツがフィルタリングされます。これが Kuaishou のビジネス ロジックに固有のルートです。加工されたコンテンツは一種のデータとなり、コンテンツそのものの説明から配信後の人気まで、Kuaishou は膨大な量のコンテンツ データをマスターしています。平たく言えば、どちらもコンテンツを持っており、ユーザーがどのような「良いコンテンツ」を見たいのかを知っています。

大規模な生成ビデオ モデルのトレーニングでは、このプロセスは事前に料理を準備するようなものです。

「料理人」も既製です。

Kelingプロジェクトチームの中心的な研究開発メンバーのほとんどは、Y-tech時代のWan Pengfeiの古い部下です。今年の初めに、チームメンバーは徐々に関連情報や資料に触れるようになり、Keling の研究開発に取り組み始めました。

以前、Wan Pengfei のチームは、Kuaishou クリエイティブ エコシステムの下で UGC インテリジェントな制作ニーズを担当し、メイン ステーションの制作、Kuaiying、Yitian Camera などのビジネス関係者と緊密に連携していました。製品形式には、ポートレートの美化、オーディオおよびビデオの特殊効果が含まれます。 、生放送アバターなど。

2021年、万鵬飛氏は世界人工知能技術会議で「Y-tech部門AI技術プラットフォーム責任者」として講演を行った。当時共有されたケースの中には、「生きた写真の特殊効果」、つまり大型モデル以前の時代の Tusheng ビデオ ゲームプレイが含まれていました。当時、Kuaishou と Kuaiying のテンプレート ライブラリは、ユーザーが写真をアップロードすると、写真内のキャラクターが笑顔、瞬き、うなずきなどの動きをしてビデオ効果を形成できる「動く古い写真」特殊効果を開始しました。報告によると、このダイナミックな特殊効果は快営市の 344 万人以上の人々に使用されています。


2021年にKuaishouネチズン@senyuheluが公開した感動的な古い写真とビデオ

2021 年、Wan Pengfei 氏は生成技術の開発に非常に自信を持っており、「生成モデルはますます強力になり、生成されるコンテンツはより現実的になり、生成プロセスはより安定して制御可能になるだろう」と提案しました。

3年後、Keling氏は「Reviving Old Photos」という作品で再び登場し、使用許可を申請した一部のユーザーは、亡くなった親戚の写真をビデオに変換する「Tusheng Video」機能を使用した。 3 年前の「生きた写真の特殊効果」と比較して、ユーザーはオープンな指示を通じて写真内のキャラクターにより複雑なアクションを実行させることができます。これはまさに新しい大型モデル技術によってもたらされた変化です。

Sora は今年 2 月にリリースされ、Kuaishou Keling チームは近い時期に結成され始めましたが、マルチモーダル駆動のビデオ生成テクノロジーの開発と応用は常に Wan Pengfei と彼のチームの仕事の範囲内にありました。 。

前述の実践者たちは、ヘッジホッグ コミューンと同様の見解を表明しました。「実際、ソラの出現は、そのノードでの技術的なルートや計画を全員に決定させるのと同じですが、マルチモーダルなものを含め、ビジュアル テクノロジーの応用例は数多くあります。それが彼らがいつもやってきたことだ。」

柯玲が必要とする技術の蓄積はここから来ています。料理人は調理済みの料理を発見し、新しいレシピが世界中で公開された後、Kuaishou は完成品を最速で作り上げたチームの 1 つになりました。

しかし同時に、上記の関係者らは、ケリングが技術と製品において長期にわたって主導的な立場になれるかどうかについて様子見の姿勢も示している。 「現在、誰もが使用しているアルゴリズムは似ています。各企業は多少の微調整は必要かもしれませんが、カード、データ、および同様のアルゴリズムの違いは依然として同じです。」同様の効果を持つ製品を製造しています。

したがって、スピードは Kuaishou の一時的な利点にすぎません。彼らはその利点を、主要なウィンドウ期間中に安定した顧客に真に変える必要があります。


シーンがあるところにはお客様がいます

2020年12月29日、Kuaishouは全従業員に宛てた社内書簡の中で「Kuaishou派」を企業価値観として初めて正式に発表し、「顧客への執着」がKuaishouの価値観の中核であると述べた。

以前は、Kuaishou 内でも他の大手インターネット企業内でも、よく言及される概念は「ユーザー」でした。このため、クアイショウ氏はこの語彙変更の理由を具体的に説明した。 「当社のビジネスはより複雑になり、『ユーザー』から『顧客』へと拡大しています。顧客には、生産者と消費者、B側の顧客とC側のユーザー、社外の顧客と社内の顧客が含まれます。生産者と顧客に対する理解を強化する必要があります。」 B 側の顧客に対する理解と認識を向上させるために、社内の顧客に対するサービスの意識も強調する必要があります。」

2024 年を振り返ると、これは確かに Kuaishou の事業構造の変化における重要な分水嶺でした。 2020年のKuaishouの年間収入のうち、ライブブロードキャスト収入の割合は前年の80.4%から56.5%に減少し、オンラインマーケティングサービス収入の割合は19%から37.2%に増加しました。サービス収益に占める割合は前年の 1% から 6.3% に急速に上昇しました。

Kuaishou 自身が説明したように、生産者と消費者、B 側顧客と C 側ユーザー、外部顧客と内部顧客はすべて Kuaishou の重要な顧客であり、Kuaishou の大型モデルの対象顧客にもなります。

生産者と消費者が共同して、Kuaishou の最も基本的なビジネス チェーンを構築します。生産者はコンテンツを生産し、消費者はコンテンツを消費します。大型モデル製品の価値は、コンテンツの品質を向上させながら制作の敷居を下げることにあります。

前者は分かりやすいですが、現在Kelingが実現しているように、撮影条件や制作能力のない人にとっては、動画を入力するだけで制作の敷居が下がります。

後者は、最初は直感に反して聞こえるかもしれませんが、現在の AI ビデオ製品のシミュレーション機能と出力長を考えると、品質の点で実際の撮影やプロの制作よりも優れているはずがありません。しかし、Kuaishou や Douyin などの大手プラットフォームでは、毎日制作される数千万のショートビデオのほとんどが一般ユーザーからのものであり、プロのコンテンツ制作者の目には、「十分に洗練されていない」AI テクノロジーだけで一般ユーザーが利用できるようになります。ランダムなショットを撮影して、素材と豊かさを追加します。

B サイドの販売者も、Kuaishou の大規模モデル機能の顧客になる可能性があります。今年の世界人工知能会議でKuaishouが発表したデータによると、同社のAI広告収入は1日あたり2000万を超えた。 AI によって生成された広告素材は、CTR をベースラインに維持しながら、アイテムあたりのコストを 0.47 元に削減できます。


Keling は写真とプロンプトの言葉を生成します: リンゴ ジュースの広告素材、白いテーブルの上にリンゴ ジュースのグラスがあり、その横に 2 つの赤いリンゴがあります。

多くの大型モデル製品にとって、着地シナリオを見つけることは製品ライフサイクル全体を通じて難しい問題ですが、Kuaishou には明らかにシナリオが不足していません。Kuaishou の副社長で大型モデルの責任者である Zhang Di 氏が述べたように、Keling の成功は「ユーザーの真のニーズを満たすために実際のシーンで真の価値を掘り出す」ことにあります。

彼らが直面しなければならない問題は、現在のシナリオの下でユーザーにKuaishouの大型モデルの高頻度ユーザーとなり、喜んで料金を支払い続けてもらい、まず自社のエコシステム内で大型モデルの商用化を実現する方法である。

7 月 25 日、Keling は登録を完全に開始し、同日、Keling は会員システムを開始し、課金段階に入りました。

Kelingの公式Webサイトの情報によると、非会員ユーザーは毎日ログインすると66のインスピレーションポイントを受け取ることができ、現在の「価格」によると、約6本のビデオまたは330枚の写真が無料で生成できます。

2 つの支払いモデルがあり、ユーザーは月ごと、四半期ごと、半年ごと、または 1 年ごとにさまざまなレベルのメンバーシップを購入できます。2 つ目は、より多くの作品を生成できます。ユーザーが直接料金を支払ってリチャージする場合、ユーザーのビデオごとの制作費は 1 元、写真ごとの制作費は 2 セントです。


Keling によって生成された画像、プロンプトの単語: 日の出、地平線には美しい雲と朝焼けがあり、太陽は雲の中に隠れています

Kelingの料金体系で注目すべき点は2つある。

まず、Kuaishou は無制限に作品を生成できるメンバーシップ オプションを提供していません。これは、ユーザーがリチャージ モードを選択するかメンバーシップ モードを選択するかに関係なく、実際には「時間を買うためにお金を払っている」ことを意味します。唯一の違いは各世代の単価と、ウォーターマーク除去、ビデオ拡張、マスターミラー移動などの機能の差別化です。

AIビデオの生成コストは高く、Kuaishouは無制限に生成できるメンバーを提供していないため、コスト管理の可能性を回避し、グレーな制作をある程度抑制したいと考えています。

第二に、Keling の「支払い通貨」としてのインスピレーションの価値は、Kuaishou エコシステムのアンカーに報酬を与えるために使用される Kuai コインと価格設定が同等です。 1元の人民元で、10クイックコインまたは10インスピレーションポイントを購入できます。この価格設定方法により、将来的に Kuaishou エコシステム内で決済システムが開放される可能性が保たれる可能性があります。


ニーズ、シナリオ、顧客、設備、データ、テクノロジー、人材の予備を同時に備えているのは Kuaishou だけではありません。

前述の業界関係者らは、近い将来、バイト社も同レベルのジェネレーティブビデオ製品を生産できるようになるだろうと予測している。その前に、Kuaishou は、AI コンテンツが Kuaishou エコシステム内で効果的に動作できるように、ウィンドウ期間内にユーザーの蓄積とコンテンツの蓄積を完了する必要があります。商業化の道を走り、フロントランナーの位置に座ることができるのが最善です。もっと長い時間。

従来の成長と運営の手段が議題となっています。 Keling の公式 Web サイトは、会員向けの 50% 割引イベントをすぐに開始しました。同時に、ユーザーの成長と維持に対する支払いモデルの影響を軽減するために、ユーザーは毎日ログインすることで 66 のインスピレーション ポイントを獲得できるようになり、すべてのユーザーが少なくとも敷居なしで試してみてください。

さらに、Kuaishou サイトの運営において、Keling は生成ビデオ、拡散モデル ソリューション、分散トレーニング クラスターなどの概念をあまり重視せず、代わりに「古い写真をビデオにする」、「あなたを受け入れる」を使用します。 「時空」「40年前の復活」「過去の写真」など、ユーザーに先に使い始めてもらうためのゲームプレイ方法を工夫し、ユーザーの理解コストを削減します。

一般のユーザーにとって、新しいゲームプレイは過去の Kuaiying 特殊効果ゲームプレイと同じ難易度であり、「大型モデル」という 3 つの言葉を聞いたことがあるかどうかに関係なく、より強力な特殊効果として理解されます。彼らは大型モデル製品の実際のユーザーになります。

これは、Kuaishou と Byte が AI 動画を作成するための究極の第一歩です。ユーザーが不連続な新しい製品に魅了されているのであれば、これは AI 時代に直面する究極の危機でもあります。

AI動画時代への入り口を争っていると言うよりは、全員が擁護者であると言った方が良いでしょう。新しい生産性は新しいコンテンツ形式を生み出し、最終的には新しいプラットフォームを生み出すでしょう。この話はチェン・イーシャオ氏とチャン・イーミン氏の両方によく知られています。

彼らは第一階層でなければなりません。

(カバー画像は Keling によって作成されました。)


メディア協力連絡先WeChat ID |ciweimeijiejun

私たちとコミュニケーションを取りたい場合は、バックグラウンドで「グループに参加」と返信すると、コミュニティに参加できます。