ニュース

大型モデルの価格競争により粗利益はマイナスに

2024-09-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


国内大型機種の淘汰競争が加速している。この淘汰は 1 ~ 2 年続き、本当に力のある少数の基本モデル企業だけが生き残ることができます。

記事 | 『ファイナンス』特別記者 呉俊宇

編集者 | 謝立龍

中国市場における大型モデルの価格競争は半年近く続いている。この価格戦争は粗利益がマイナスに達しており、当分は止まる気配がありません。大手クラウドベンダーは依然として新たな値下げを計画している。今回の値下げは今年9月下旬に実施される予定。

今年 5 月、中国のクラウド ベンダーは大規模モデルの推論コンピューティング能力をめぐる価格競争を開始しました。 bytedance のクラウド サービスである volcano engine、alibaba cloud、baidu smart cloud、tencent cloud は、大規模モデルの推論コンピューティング能力の価格を 90% 以上次々と引き下げてきました。

大規模なモデルを使用するには、プロンプト言語を入力し、推論によって出力されるコンテンツを取得する必要があります。このプロセスは api (水道や電気のスイッチと同じようなアプリケーション プログラミング インターフェイス) を呼び出し、消費されたトークンの数に応じて支払います (トークンは大きなモデルのテキスト単位であり、トークンは単語、句読点、数字、記号など)。水道や電気の使用料を払うようなものです。

価格引き下げ後、推論コンピューティング能力の消費は確かに急速に増加しています。今年8月、baiduの第2四半期決算カンファレンスコールで、5月のbaidu wenxin big modelの1日あたりの平均apiコールが2億回だったが、8月には1日あたりの平均トークン消費量が2,500億回に増加したことが明らかになった。 8月 1兆まで成長しました。 bytedanceは今年8月、7月の時点でbytedance doubaoモデルの1日の平均トークン使用量が5000億を超えたと発表した。 5 月と比較すると、企業あたりの 1 日の平均トークン使用量は 22 倍に増加しました。

トークンの価格は90%以上下落しました。これにより、短期的にはクラウド ベンダーの推論収益が減少します。しかし、クラウド ベンダーは、この方法を使用して企業顧客の試行錯誤のしきい値を下げ、その結果、コンピューティングの消費電力が 10 倍以上に飛躍的に増加し、最終的には長期的な収益増加を達成したいと考えています。

国内大型モデル市場における推論コンピューティング能力をめぐる価格戦争は半年にわたって続いています。現在、次の 3 つの基本的な事実があります。

まず、計算能力の価格戦争はすでにマイナスの粗利益に達していると推測されます。最近、alibaba cloud や baidu smart cloud を含む多くのクラウド ベンダーの責任者は、今年 5 月以前には、国内の大規模モデル推論コンピューティング能力の粗利益率が 60% を超え、基本的には同等であったことを明らかにしました。国際的な仲間のこと。今年5月に大手メーカーが相次ぎ値下げしたことを受け、推論演算能力の粗利益率はマイナスに陥った。

第二に、同じ仕様の openai モデルと比較して、国内モデルの価格は一般的に 20% ~ 50% にすぎません。国内大型モデルの粗利率はopenaiに比べてはるかに低い。国際市場調査機関futuresearchによる今年8月の調査報告書によると、openaiのgpt-4シリーズのフラッグシップモデルの粗利益率は約75%、gpt-4oシリーズのメインモデルの粗利益率は約75%であるという。 55%。 openai の総合的な粗利益率は少なくとも 40% 以上です。

第三に、モデルの機能が不十分であることが、価格競争の重要な原因となっています。あるクラウドベンダーの大型モデル事業の中核担当者は、現状では国内のフラッグシップモデルとopenaiのgpt-4シリーズのフラッグシップモデルの性能には差があるため、値下げを通じて顧客に試行錯誤を促すべきだと考えている。 。モデルの価格は下がり続けているため、企業顧客にとって価格はもはや最大の関心事ではありません。企業顧客が最も関心を寄せているのは、モデルの機能と効果です。

価格競争を戦わなければならない

alibaba cloud、volcano engine、baidu smart cloud、tencent cloud、openai 公式 web サイトが発表している大規模モデルの推論価格を確認しました。同じ仕様のopenaiのモデルと比較すると、国内モデルの価格は一般的に20%〜50%にすぎません。

alibaba の tongyi qianwen-max、baidu の ernie-4.0-8k、tencent の hunyuan-pro を例に挙げます。100 万トークンあたりの 3 つのモデルの生産価格は、それぞれ 120 元、120 元、100 元です。ベンチマークとなる openai のフラッグシップ モデル gpt-4-turbo の出力価格は、100 万トークンあたり 210 元です (openai の公式 web サイトに記載されている価格は 30 米ドルで、米ドルと人民元の為替レートに基づいて換算されています 1: 7)。これら国産大型モデル3機種の価格はgpt-4-turboの約50%に過ぎない。

alibaba の qwen-long、baidu の ernie-speed-pro-128k、tencent の hunyuan-embedding を例に挙げると、100 万トークンあたりの 3 つのモデルの出力価格はそれぞれ 2 元、0.8 元、5 元です。 openaiの格安モデルopenai gpt-4o-miniミリオントークンの出力価格は4.2元(openaiの公式ウェブサイトに掲載されている価格は0.6米ドルで、米ドルと人民元の1:7の為替レートに基づいて換算されています) )。 alibaba と baidu のエントリーレベル モデルは、openai のエントリーレベル モデルの価格のわずか 48% と 19% です。

大型モデルの価格競争は粗利益率がマイナスに達しているが、それでもさまざまなクラウドベンダーが値下げを続けることを止めていない。

私たちが受け取ったニュースは、alibaba cloud などの大手クラウド ベンダーが依然として新たな値下げを計画しているということです。今回の値下げは今年9月下旬に実施される予定。今回の値下げは高性能フラッグシップモデルが中心。

上記クラウドベンダーの大型モデル事業の中核担当者は、現状では安価な小型モデルの値下げ余地はほとんどなく、値下げの最終段階は「心理的ボトムライン」まで落ちているとみている。法人顧客の。次に注目されるのは、各主力モデルの値下げが継続されるかどうかだ。また、フラッグシップモデルは、ほとんどの問題を解決できるコスト効率の高いバージョンと、非常に困難な問題を解決する高品質で高価なバージョンにさらに細分化されます。

大規模モデル推論の計算能力がマイナスの粗利に達しているのに、なぜ値下げを続けるのでしょうか?

大手クラウド メーカーは長期的な市場動向に注目しています。クラウド コンピューティングのコンピューティング能力構造は劇的な変化を遂げています。より多くの推論コンピューティング能力を獲得することは、より多くの段階的な市場を獲得することを意味します。国際市場調査機関idcは、2022年から2027年にかけて中国の一般コンピューティング能力の年平均成長率は16.6%、インテリジェントコンピューティング能力の年平均成長率は33.9%になると予測している。 2022 年から 2027 年にかけて、インテリジェント コンピューティング能力のうち、推論コンピューティング能力の割合は 72.6% に上昇し、トレーニング コンピューティング能力の割合は 27.4% に低下します。

クラウド ベンダーは、期待される長期的な成長のために、短期的な収益を放棄することをいとわない。短期的には、推論コンピューティング能力は大きな収益をもたらしません。中国のクラウドベンダーの技術者は、各企業のモデルコール収益が2024年に10億元を超えることはなく、年間収益が数百億ドルの市場では限界があると説明した。クラウド ベンダーは、今後 1 ~ 2 年間の短期的な収益損失や事業損失を受け入れるつもりです。大規模モデルの呼び出し数が今後 1 ~ 2 年で少なくとも 10 倍に指数関数的に増加すると誰もが予想しています。最終的には、長期的な収益の増加により、短期的な収益の損失を補うことができます。

同氏はさらに、このプロセスでは、顧客の需要が高まるにつれてコンピューティング能力のコストが徐々に薄まっていくと説明した。大型モデル事業には、最終的にはプラスの利益を達成する可能性がまだ残されている。たとえ賭けが当てはまらなかったとしても、モデルメーカーのグループは価格競争で消滅し、生き残ったメーカーがその残骸を拾うことになる。

また、クラウド ベンダーが異なれば、価格戦争に直面する際の競争上の考慮事項も異なります。volcano engine、alibaba cloud、baidu smart cloud はすべて、戦わなければならない価格戦争に参加しています。

volcano engine は現在、中国のパブリック クラウド市場でトップ 5 にランクされていませんが、2023 年には収益が 150% 以上増加すると見込まれています。大型モデルはクラウド市場で追いつくための重要な機会となる。 volcano engine の社長である tan dai 氏は、今年 5 月に私たちに、米国の ai アプリケーション起業家精神が 2012 年から 2014 年にかけての中国のモバイル インターネットの初期段階の傾向を示していることを今年 3 月にシリコンバレーで発見したと述べました。 「小規模な ai アプリケーションのスタートアップ チームは、すぐに収益と資金調達を達成しました。中国市場でも将来この傾向が見られるかもしれません。しかし、その前提として、推論の価格を下げ、試行錯誤の敷居を下げる必要があります。」

alibaba cloud は中国のパブリック クラウド市場で第 1 位にランクされています。競合他社による値下げに直面し、alibaba cloudはフォローアップする必要がある。アリババクラウドのパブリッククラウド部門ゼネラルマネジャー、リウ・ウェイグアン氏は今年6月、アリババクラウドが内部で複数回の推論と計算を経て、次の2つの矛盾を発見したと分析した。

  • まず、価格引き下げ後は既存収入が減少し、増分収入が増加します。理想的には、増分の収益で既存の収益をカバーできます。

  • 2つ目は、同業他社がさらに積極的に値下げした場合にどう対応するかだ。最終的な結論は、現在は利益よりも規模が重要であるということです。 alibaba cloud は、大規模モデルを使用して業界全体でのクラウド コンピューティングの普及を促進したいと考えています。

baidu intelligent cloud は ai を中核戦略とみなしています。百度の大型モデルのテクニカルディレクターは今年7月、大型モデルは絶対に勝たなければならない戦いであり、価格競争は何としても戦わなければならないと率直に語った。この戦略は実際の成果を上げています。 baidu smart cloudの2024年第2四半期の収益成長率は14%に回復し、過去2年間で最高となった。 baidu 経営陣は、2024 年第 2 四半期の決算報告で、baidu intelligent cloud の大型モデルの収益比率が 2023 年第 4 四半期の 4.8% から 2024 年第 2 四半期には 9% に増加したと明らかにしました。

中国の大手テクノロジー企業のai戦略プランナーは、火山エンジンはバイトダンスの支援を受けており、親会社の広告事業は輸血の役割を果たす可能性があると分析した。 volcano engine はクラウド市場でトップ 5 にランクされておらず、価格競争を通じてさらに多くの市場シェアを獲得したいと考えています。 alibaba cloud は主にパブリック クラウドの 4 つの主要コンポーネント (コンピューティング、ストレージ、ネットワーク、データベース) から構成されており、低価格モデルにより顧客のビジネス データの消費が促進され、それによって上記の基本的なクラウド製品の売上が促進されます。大型モデルは百度の中核戦略である百度は、他の競合他社が価格競争を開始することを決定した場合、中国で最初に大型モデル事業を展開する必要があります。

価格は決め手ではありません

大規模モデルの推論価格戦争とマイナスの粗利益の裏返しとして、企業顧客が大規模モデルを使用するかどうかの主な要因は低価格ではないということです。

前述のクラウドベンダーの大型モデル事業の中核責任者は、クラウドベンダーは長期的な資金の浪費や損失に頼って大型モデル産業の導入を推進することはできないと考えている。低性能、低価格モデルでは意味がありません。不十分なモデル機能は、マイナスの粗利価格競争の重要な理由です。国内モデルのコール価格が大幅に下落したため、法人顧客にとって価格はもはや最も重要な要素ではありません。企業顧客が最も関心を寄せているのは、モデルの機能と効果です。

保険会社の it ディレクターも同意しました。同氏は、現在、企業収益に占める金融・保険業界のit支出の割合は約3%~5%であり、ハードウェアit支出の80%を除くと、実際にデジタル変革に使われているのはわずか20%であると率直に述べた。大型モデルなどの新しいテクノロジーを使用する場合は、入出力比を計算する必要があります。明示的なモデルのコストに加えて、暗黙的なコストも考慮する必要があります。大規模なモデルは既存の it システムと互換性がなければならず、大規模なモデル用のビジネス データを準備するにはデータ ガバナンスが必要であり、ai を理解しているプロダクト マネージャーのグループを採用する必要があります。彼が最も懸念しているのは、モデルの機能と実際の効果です。

スタンフォード大学の基本モデル研究センター (crfm) は、長期にわたる世界的な大規模モデル テストのランキングを実施しています。 9 月 17 日時点の大規模マルチタスク言語理解 (mmlu) テストのランキングによると、上位 10 機種メーカーには、ai スタートアップ anthropic (amazon 出資) の claude 3.5 シリーズ、meta の llama3.1 シリーズ、 openai (microsoft investment が所有する gpt-4 シリーズ) および google が所有する gemini 1.5 シリーズ。現在、中国の大型モデルでトップ10に入っているのはアリババ傘下のtongyi qianwen 2 instruct(72b)だけだ。

中国のクラウドベンダーの多くの大型モデルの技術担当者も蔡京氏に対し、同様の見解を示した。大型モデル市場では、低パフォーマンスと低価格の戦略は持続不可能だという。理想的な状況は、高性能とリーズナブルな価格に依存した、健全で永続的なビジネスのクローズド ループを確立することです。

より価値のあるベンチマークは openai です。今年9月の時点で、openaiには月間アクティブユーザーが10億人、有料ユーザーが1100万人いる(うち有料個人加入者1000万人、企業加入者100万人)。今年5月、openai経営陣は同社の年間収益を発表した(年間収益は当月の収益×12。サブスクリプションベースのソフトウェア会社は毎月ユーザーのサブスクリプション更新を受け取り、安定した収益が期待できるため、年間収益基準を使用することが多い) 34億米ドル(米ドルと人民元の為替レート1:7で換算、約241億元)。

国際市場調査機関であるfuturesearchの最新調査報告書は、openaiが発表した年間収益と有料ユーザー構造に基づいて同社の収益構造を計算している。1,000万人の個人加入者が19億米ドルの収益をもたらし、100万ドルを占めている。企業のサブスクライバーは 7 億 1,000 万ドルの収益をもたらし、21% を占め、api コールは 5 億 1,000 万ドルの収益をもたらし、15% を占めました。

複数回の値下げを行った後でも、openai は依然として比較的健全な粗利益率を維持できます。今年 4 月、openai の主力モデル gpt-4-turbo 出力価格が 67% 値下げされました。今年8月、openaiの主力モデルgpt-4oの生産価格が30%値下げされた。 futuresearchが今年8月に発表した調査報告書によると、openaiのgpt-4シリーズのフラッグシップモデルの粗利益率は約75%、gpt-4oシリーズの主力モデルの粗利益率は約55%となっている。 openai の包括的な粗利益率は少なくとも 40% です。

openai には独自の成長環境があります。十分なコンピューティング能力を備えているだけでなく、膨大な to c (一般消費者向け) ユーザーを抱え、世界最大の to b (企業顧客向け) ソフトウェア市場にも参入しています。

openaiの過去2年間の成功体験は、大規模なコンピューティングパワーに依存して「奇跡を起こす力技」を行ったことだ。中国企業にはopenaiのようなコンピューティング能力の条件や資金調達環境が欠けている。計算能力は中国のモデルメーカーの主要な欠点です。

中国のクラウド ベンダーのモデル技術者は、過去 1 年ほどにわたって、中国のクラウド ベンダーは nvidia の ai チップの購入コストの 1.5 倍以上を支払っており、そのためモデルのコンピューティング能力のコストが高止まりしていると説明しました。これは大型モデルの性能上限に影響を与え、大型モデルの産業実装にも支障をきたします。サーバーディーラーによると、2023年の中国市場におけるnvidia h100/h800シリーズのaiチップを搭載した8枚カードサーバーの価格は一時300万元/台を超え、nvidiaの公式価格の1.5倍以上となった。

コンピューティングリソースが限られており、コンピューティングコストが高い場合、中国企業はどのようにして自社に合った開発パスを見つけられるのでしょうか?これには、慎重な計画と調整が必要です。

過去 2 年間、大規模モデルの開発はスケーリング則 (2020 年に openai によって提案された法則、直訳すると「スケーリング則」) に従ってきました。モデルのパフォーマンスは主に計算量、モデル パラメーターの量、およびモデルのパラメータの量に関係します。トレーニングデータの量。

前述のクラウドベンダーの大規模モデル事業の中核担当者は、スケーリング則の制約の下でデータの質と量を向上させ、モデルのパラメータであるmoe(mixture of experts)を適切に削減することが基本原則であると述べた。設計戦略を使用して、複数のモデルを混合することもできます (パフォーマンスを向上させるためのプロフェッショナル モデル) アーキテクチャは、モデルのパフォーマンスを向上させ、推論コストを削減します。具体的なビジネス戦略を実行する場合、2 つの選択肢があります。

  • まず、データの品質と量を増やし、アルゴリズムとアーキテクチャを最適化することで、モデルのパフォーマンスを向上させ、モデルのサイズを縮小します。これにより、コンピューティングの消費電力が効果的に削減され、主要なアプリケーションの効果が向上し、主流の市場の需要に適応できます。

  • 第二に、より正確で細分化されたモデル製品戦略を採用します。すべての問題を解決するためにいくつかのモデルに依存するのではなく、さまざまなモデルにさまざまな問題を解決させます。たとえば、コスト効率の高いモデルを経済市場に届け、高品質のモデルをハイエンド市場に届けます。

今年の openai の 3 つのモデル、gpt-4、gpt-4turbo、および gpt-4o は、この考え方に沿って進化しました。 gpt-4o のモデル パラメーターは gpt-4 より小さいですが、日常的な問題のほとんどを正確に解決できます。 gpt-4 turbo は、より困難な問題を解決するために使用されます。 openai の最新の o1-preview は、強化学習を経て、モデルの能力を高めるために、答えを出力する前に繰り返し考えます。これら 3 つのモデルの 100 万トークンの出力価格はそれぞれ 70 元、210 元、420 ​​元です (openai 公式 web サイトに記載されている価格は 10 米ドル、30 米ドル、60 米ドルであり、これらに基づいて換算されています)米ドルと人民元の為替レート 1:7)。

ノックアウト加速

粗利マイナスの価格競争で大型モデル市場の淘汰が加速している。多くの業界関係者も財経に対し、この淘汰は1~2年続き、生き残れるのは基本的なモデル企業3~5社だけになるだろうと同様の見方を示した。

中国情報化100人委員会の執行委員でアリババクラウド・インテリジェント・テクノロジー研究センター所長のアン・シャオペン氏は今年7月、蔡京に対し、大型モデルには継続的な投資、1万枚、さらには10万枚のカードを搭載できる能力、そして商業的利益が必要であると語った。多くの企業にはそのような機能がありません。将来的には、中国市場にはベーシックモデルのメーカーは 3 ~ 5 社しかなくなるでしょう。

大規模なモデルを開発するには、チップとサーバーを購入し、データセンターを構築するために土地を借りる必要があります。この投資は年間数百億元に達することもあります。こうしたコストはテクノロジー企業の設備投資に反映されるだろう。 microsoft の 2024 会計年度第 4 四半期決算報告では、同月の設備投資 190 億ドルのほぼすべてがコンピューティング能力に費やされたことが明らかになりました。過去1年間(2023年第3四半期から2024年第2四半期まで)、アリババ、テンセント、百度の設備投資はそれぞれ232億元、231億元、113億元に達し、77.1%増加した。それぞれ 154.1% と 46.9% は、コンピューティング能力への投資の結果です。

コンピューティング能力への継続的な数百億元の投資に加えて、大規模なモデル推論ビジネスには年間 10 億元の補助金も必要です。中国のクラウドベンダー幹部は、大規模モデルのコールの粗利率がマイナスとなっているため、短期的にコール数が増えるほど損失が大きくなると分析した。現在の推論コンピューティング能力の消費量によると、価格競争に参加している複数の大手クラウドベンダーは、2024 年に大規模モデルの推論コンピューティング能力の消費に対して 10 億元以上の補助金を出す予定です。

alibaba cloud、volcano engine、baidu smart cloud、tencent cloud は、グループの大規模モデルに頼って価格戦争と戦うことができますが、大規模モデルの新興企業が存続することは困難です。前述の中国の大手テクノロジー企業の ai 戦略プランナーは、今回の価格戦争においては alibaba cloud と volcano engine が最も強力な血統を持っていると信じています。アリババはクラウドから収益を上げることができ、ボルケーノ・エンジンはバイトダンスの広告ビジネスを輸血の代わりにしている。価格競争では、百度はアリババやバイトダンスほどではありません。しかし、baidu の wenxin 大型モデルには強力なテクノロジーがあり、そのテクノロジーに喜んでお金を払う顧客グループがいるでしょう。これは百度が価格競争を乗り切るのに役立つだろう。

大規模モデルの新興企業が短期的に生き残るためには、大手メーカーと資金調達に頼らなければなりません。ある大手模型新興企業の技術者は今年9月、蔡京に対し、国産大型模型の「5小虎」であるzhipu ai、baichuan intelligence、dark side of the moon、zero one thing、minimaxがすべて投資されていると語った。アリババによる。投資方法の1つは、投資金額がコンピューティングパワーの形で支払われ、投資先企業がalibaba cloudのコンピューティングパワーを利用するというものだ。 「5匹のリトルタイガー」が存続できるかどうかは、アリが投資を続けるかどうかにある程度かかっている。

前述の大手クラウドベンダーの技術者や、前述の大型モデルの新興企業の技術者も、中国市場における大型モデルの新興企業は今後2年間で試練に直面するだろうと考えている。基本モデル市場で突破口を開くには、将来 3 つの方法がある可能性があります。政府および企業のプロジェクト モデル開発会社になるには、to b の垂直型インダストリ モデルに頼るか、to のアプリケーション マーケットに頼る必要があります。 c.実際、市場の差別化はすでに始まっています。 zhipu ai は政府や企業のプロジェクトで多数の入札を獲得していますが、dark side of the moon は to c 市場のみに焦点を当てています。

編集者 | 秦立信