大規模モデルのオープンソースとクローズドソースをめぐる争いとは何ですか?

2024-08-14

紛争は互いの市場価値を否定することはできません。2 つの市場ニーズは長期にわたって共存します。

文 | ウー・ジュンユー・シュ・ウェンプー

編集者｜謝立龍

今年以来、中国と米国のAI（人工知能）業界の起業家や投資家、起業家らは、大規模モデルをオープンソースにするか、クローズドソースにするかという議論を同時に始めている。

中国で論争の中心にいるのは、百度の創設者ロビン・リー氏だ。今年4月、同氏は「かつては誰もがオープンソースを使用しており、オープンソースは安価だと考えていた。実際、大規模モデルのシナリオではオープンソースが最も高価だ。オープンソースモデルはますます後進的になるだろう」と公に述べた。この見解には反対の声も少なくありません。反対派には、Alibaba Cloud CTO（最高技術責任者）のZhou Jingren氏、バイチュアンインテリジェンスCEOのWang Xiaochuan氏とCheetah Mobile CEOのFu Sheng氏。今年5月、周静仁氏はメディアのインタビューで「オープンソースが世界のテクノロジーとエコロジーに貢献していることは疑いの余地がない。これは世界中で何度も証明されており、これ以上議論する必要はない」と率直に語った。

米国では議論がさらに白熱している。テスラ創設者のマスク氏はかつてAIスタートアップを訴えたオープンAI。マスク氏は、2015 年の OpenAI の主要な創設者および投資家の 1 人でした。同氏は、現最高経営責任者（CEO）のアルトマン氏が率いるOpenAIが「非営利団体として運営し、AIをオープンソースかつオープンソースにする」という公約に違反したと考えている。シリコンバレーの2人の著名な投資家、a16zの創設者であるアンドリーセン氏とクライナー・パーキンス・コーフィールド・アンド・バイヤーズの創設者であるコスラ氏は、ソーシャルメディア上で何度も対立してきた。前者は、クローズドソースモデルは巨大企業の独占につながり、学術研究を損なうと信じている。後者は、大規模モデルは経済兵器であり、オープンソースであるべきではないと考えています。

オープンソースはソフトウェア開発モデルです。ソースコードは無料で公開され、コミュニティからの寄付によって存続します。開発者は、ソフトウェアを自由にダウンロード、変更、配布し、ソフトウェアのバグ (ソフトウェアの欠陥またはエラー) を報告し、最適化の提案を行うことができます。この集合的なイノベーションにより、ソフトウェアの反復が加速されます。オープンソースモデルとは、無料で使用でき、モデルパラメーターなどの技術的な詳細が公開されているモデルを指します。クローズドソースモデルは、支払いが必要で、技術的な詳細が公開されていないモデルを指します。簡単に理解すると、オープンソースは無料ですが、自分で食べ物を買って調理する必要があります。クローズドソースは有料であり、レストランに食事に行くのと同じであり、より良いサービスを受けることができます。

大規模なモデルはオープンソースにするべきでしょうか、それともクローズドソースにするべきですか?商業的利益、技術的意見、その他の要因が入り混じっているため、多くの事実が混乱していますが、この議論の背後にはいくつかの確かな事実があります。

まず、ビジネス戦略が異なると、企業は異なる技術的ルートを選択できるようになります。Baidu や OpenAI などの企業は、大規模なモデルビジネスを迅速に商業化したいと考えており、Alibaba Cloud や Meta などの企業はクローズドソースを選択しています。クラウドコンピューティングあるいは、収益性の高い広告ビジネスを行っている企業は、パイを大きくするためにオープンソースを選択します。

第二に、オープンソースとクローズドソースの市場需要は長期間にわたって共存し、どちらが優れているかを単純に判断することは不可能です。オープンソースモデルとクローズドソースモデルにはそれぞれ適用可能なシナリオがあり、どのモデルを選択するかは市場の需要に関連します。これはモデルメーカーの意向によって変更されるものではありません。

第三に、オープンソースモデルとオープンソースソフトウェアの間には本質的な違いがあります。オープンソースソフトウェアは、ソースコードとほとんどの技術的な詳細を公開します。オープンソースモデルは、無料の技術的なブラックボックスに似ています。モデルのパラメーターはオープンですが、ソースコード、トレーニングデータ、トレーニングプロセス、その他の技術的な詳細がオープンになることはほとんどありません。

さらに、中国の AI 業界におけるオープンソースとクローズドソースの戦いは、むしろ商業的な競争に関するものです。オープンソースには国境がなく、この概念は一般的に認識されています。しかし、AI業界における中国と米国の競争激化を背景に、オープンソースに対する米国業界の反対の声はますます大きくなっている。

誰がオープンソースで誰がクローズドソースですか?

大型モデルの開発はまだ初期段階にあり、試行錯誤が必要です。オープンソースとクローズドソースは区別されません。企業は、オープンソースかクローズドソースかという多肢選択の問題に直面したとき、3 つの異なる道をたどることになります。

最も極端なことは、オープンソースモデルのみを実行することです。この道を歩む企業は比較的少なく、Meta はその数少ない企業の 1 つです。利点は、より多くのユーザーを引き付けることです。問題は、収益モデルがなく、大企業だけがそれを行う余裕があることです。

Meta が所有する Llama 3 は、世界で最も多くのユーザーを持つオープンソースモデルです。メタの主力事業はソーシャルメディア（フェイスブック、インスタグラムなど）で、２０２３年の純利益は３９０億ドルに達する。メタには新しいビジネスを探索したいという衝動がありますが、モデルを通じてお金を稼ぐというプレッシャーはありません。したがって、オープンソースモデルのみを実行でき、当面は収益性の問題は考慮されません。

中間のパスは、オープンソースとクローズドソースを並行して行うもので、非常に柔軟性があります。企業はオープンソースを通じてユーザーを獲得できるだけでなく、クローズドソースを通じて収入も得ることができるため、開発者に選択の余地が与えられるだけでなく、企業自身にもミスの余地が与えられます。

この道を選択している企業には、Microsoft、Google、Alibaba Cloud、Tencent Cloud に加え、Mistral Al、Zhipu AI、Baichuan Intelligence などの AI スタートアップ企業が含まれます。オープンソースとクローズドソースを並列化する際の一般的な方法は、無料のオープンソースモデルを使用してユーザーを引きつけ、よりサイズが大きく、より強力なパフォーマンスを持つクローズドソースモデルを使用するようにユーザーを誘導することです。たとえば、Microsoft の主な商用モデルは OpenAI の GPT-4 シリーズですが、小型モデルの Phi-3 Mini もオープンソース化しています。Alibaba Cloud は、5 億から 1,100 億の範囲のパラメータを持つ 10 以上のモデルをオープンソース化しています。クローズドソースの基盤、業界モデル。Google は小規模モデルの Gemma シリーズをオープンソース化しており、Mistral Al などの新興企業はオープンソース化されたモデルを提供しています。前世代ではパフォーマンスを向上させ、今世代ではより強力なパフォーマンスを備えたモデルを使用するためにユーザーを料金を支払うように誘導しました。

オープンソースとクローズドソースの問題は、商業化には競合する取り組みが含まれる場合があることです。一部の顧客は無料のオープンソースモデルを使用しており、今後は有料のクローズドソースモデルを使用しない予定です。その結果、模型メーカーは収入の一部を失うことになる。

中国の AI ソフトウェアサービスプロバイダーの技術者が今年 7 月に財京に語ったところによると、彼らは最近、地方都市の観光局向けの二次トレーニングと微調整に Alibaba Cloud の Tongyi Qianwen オープンソースモデル (Qwen2) を使用したとのこと。この注文は1000万元を超えており、彼らは受益者だが、アリババクラウドには収入がない。「Caijing」は、Github (世界最大のコードホスティングプラットフォーム) 上で Qwen2 のライセンス契約について問い合わせました。規約には「商用利用の申請は不要」と書かれている。言い換えれば、Qwen2 をトレーニングして微調整した後は、商用利用のために料金を支払う必要はありません。

オープンソースの長期的な価値は、モデル市場のケーキを大きくすることです。 Alibaba Cloud 担当者は Caijing に対し、ユーザーが商用目的でオープンソースモデルを変更するのは普通のことであり、オープンソースを行う場合にはこれに対する準備をしておく必要があると語った。 Alibaba Cloud はまだすべてを食べ尽くしたわけではありませんが、業界のケーキをさらに大きくしました。長期的には、最終的には利益を得るでしょう。化学反応は、大型モデルが政府、大企業、中堅企業、開発者などのさまざまな顧客によって広く使用される場合にのみ発生します。大規模モデル産業はエコロジーを確立し、成長フライホイールを形成する必要があります。この傾向は、Alibaba Cloud が所有する AI オープンソースコミュニティである ModelScope で見ることができます。今年 7 月の時点で、Moda コミュニティには 560 万人を超える開発者、5,500 を超える高品質モデル、数千のデータセットがあり、中国最大のオープンソースモデルコミュニティとなっています。

もっと楽観的な見方は、オープンソースとクローズドソースが上流と下流の関係を形成する可能性さえあるということです。オープンソースはテクノロジーの上流にあり、コミュニティへの参加、テクノロジーの反復、顧客の誘致、テクノロジーが競合他社よりも先を行くことを保証する役割を担っています。クローズドソースは下流にあり、商業的な実現を担当します。

Lanzhou Technology は、中国の大手模型スタートアップ企業です。 Lanzhou Technology のパートナー兼共同 CEO である Li Jingmei 氏は、オープンソースは技術戦略であると同時にビジネス戦略でもあると Caijing 氏に語った。それは開発者コミュニティだけでなく、潜在的な顧客の技術チームの精神にも影響を与える可能性があります。オープンソースとクローズドソースは矛盾するものではありません。クローズドソースモデルの顧客フィードバックサイクルは比較的長いですが、オープンソースモデルのコミュニティ開発者はすぐにフィードバックを提供します。これにより、企業は製品を迅速に反復することができます。

中国の大手テクノロジー企業の AI 戦略プランナーは、Alibaba Cloud などの大手クラウドベンダーにとって、オープンソースとクローズドソースを並行して使用する方が、クローズドソースのみよりも優れていると考えています。 Alibaba Cloud の収益は主に、パブリッククラウドの 4 つの主要コンポーネント (コンピューティング、ストレージ、ネットワーク、データベース) から得られます。無料のオープンソースモデルは顧客のビジネスデータの消費を促進し、それによって上記の基本的なクラウド製品の売上を促進します。

クローズドソースモデルを作成するだけが、シンプルで直接的かつ論理的なアプローチです。この路線をとる大企業は、大規模モデルを商品化する場合はクローズドソースでなければならず、そうでなければ商業ループを閉じることはできないと考えています。

AI スタートアップの OpenAI (同社の GPT-4 シリーズモデル)、Amazon (AI スタートアップの Anthropic に投資。Claude 3.5 シリーズモデルを含む)、Huawei (Pangu モデル)、Baidu (Wenxin モデル) およびその他の企業がこの道を選択しています。大規模なモデルを使用する企業は、API (アプリケーションプログラミングインターフェイス) 呼び出しごとに料金を支払うことが多く、これは水道、電気、ガスの料金を使用量に応じて支払うのと同じです。クローズドソースモデルのビジネスモデルは、理論的には最も健全です。 Microsoft Azure、Amazon AWS、Google Cloud の売上成長率はこの 1 年間で約 5 ポイント増加し、利益水準も若干増加しました。これは大規模なモデルのプルの結果であると考えられます。

しかし中国では、クローズドソースモデルが短期的に真の利益を上げることは困難です。今年5月、中国モデル市場で価格競争が始まった。値下げの目的は、顧客の需要を喚起し、市場規模を拡大することです。 ByteDance のクラウドサービスである Volcano Engine、Alibaba Cloud、Tencent Cloud、Baidu Smart Cloud は、大規模モデルの通話料金を 90% 以上値下げしてきました。大型モデルの売上総利益率は60％以上から0％未満に低下した。

中国クラウドベンダーの大型モデル事業担当者は、大型モデルコールは「粗利マイナス時代」に入ったとみる。使えば使うほど損失は大きくなります。違いは、Alibaba、ByteDance、Baidu などの大企業は損失を許容できるが、中小企業や新興企業は損失を許容できないことです。

彼と大規模モデルのスタートアップ幹部も同様の見解を示した。企業が異なれば遺伝子もモデル事業戦略も異なる。クラウドは Alibaba Cloud の中核ビジネスであり、オープンソースモデルの最終目標はより多くのクラウドを販売することです。 Volcano Engine は ByteDance の支援を受けており、親会社の広告事業を注入することができます。ボルケーノ・エンジンのクラウドコンピューティング市場シェアはアリババクラウドよりもはるかに低く、「裸足で靴を履くのを恐れない」ため、価格競争を通じてさらなる市場シェアを獲得したいとしている。 AI は Baidu の中核事業であり、Baidu は大規模なモデルから収益を上げたいと考えており、クローズドソースモデルの価値を重視しています。

議論は何ですか?コンセンサスは何ですか?

中国の大規模モデルに関するオープンソースとクローズドソースの議論にはいくつかの焦点があります。まず、オープンソースモデルとオープンソースソフトウェアの間に違いはあるのでしょうか?次に、オープンソースモデルとクローズドソースモデルのどちらが強いでしょうか?第三に、オープンソースモデルとクローズドソースモデルではどちらの方が高価ですか?

最初の議論は、オープンソースモデルとオープンソースソフトウェアの間に違いはあるのかということです。答えは、大きな違いがあるということです。オープンソースモデルの大部分は完全にオープンソースではありません。オープンソースソフトウェアのような透明なボックスではなく、無料で使用できるブラックボックスのようなものです。

オープンソースソフトウェアはソースコードを公開し、開発者はソースコードを通じてソフトウェアの技術的な詳細のほとんどを習得できます。無料のオープンソースソフトウェアの中核となるロジックは、社会全体の開発者がソフトウェアメーカーが製品のバグを発見し、最適化の提案を提供できるよう支援できるということです。ソーシャル開発は、ソフトウェアの研究開発コストを削減するだけでなく、ソフトウェアの反復を高速化することもできます。モバイルオペレーティングシステムの Android とデータベースソフトウェアの MySQL はどちらもこの方法で成功を収めました。

オープンソースモデルの複雑さは、オープンソースソフトウェアの複雑さをはるかに超えています。オープンソースプロジェクトには、ソースコード、パラメーターの重み、モデル構造、トレーニングデータ、トレーニングプロセスなどが含まれます。オランダのラドボウド大学の2人の学者、リーゼンフェルト氏とディンゲマンス氏は、今年3月にオープンソースモデルにおけるオープンソースの度合いを比較する論文を発表した。この論文では、最もパフォーマンスの高いオープンソースモデルは、通常、オープンソースパラメーターの重みのみを使用していることを示しています。説明の 1 つは、最先端のモデルのパフォーマンスを確保するために、モデルのメーカーがすべての「レシピ」を公開できないということです。世界で最も強力なオープンソースモデル Llama3 を例に挙げると、そのパラメータの重みとモデル構造は部分的にのみオープンソース化されています。ソースコード、トレーニングデータ、およびトレーニングプロセスはオープンソース化されていません。

産業エコロジーに対するオープンソースの概念の価値には疑いの余地がありません。Baidu Smart Cloud AI および大規模モデルプラットフォームのゼネラルマネージャーである Xin Zhou 氏は、今年 7 月に Caijing に対し、オープンソースモデルによってモデルアプリケーションと業界モデルがよりリッチになると語った。しかし、彼はオープンソースモデルとオープンソースソフトウェアを混同することに反対している。なぜなら、この 2 つには本質的な違いがあるからです。オープンソースモデルでは、オープンソースソフトウェアのように製品のパフォーマンスを向上させ、研究開発コストを削減するためにソーシャル開発者の参加に依存することができません。基本モデルは、モデルメーカー自身のトレーニングによってのみ改善できます。オープンソースモデルの微調整と推論の最適化は、開発者にとって高度な技術要件があり、実際の使用コストは高くありません。低い。

2 番目の議論は、オープンソースモデルとクローズドソースモデルのどちらが強いかということです。実際、クローズドソースモデルは一般にオープンソースモデルよりもパフォーマンスが優れていますが、オープンソースモデルとクローズドソースモデル間のパフォーマンスの差は縮まりつつあります。

スタンフォード大学の基本モデル研究センター (CRFM) は、長年にわたって世界的な大規模モデルのテストのランキングを実施してきました。 7 月 24 日の時点で発表された大規模マルチタスク言語理解 (MMLU) テストのランキングによると、トップ 10 のパフォーマンスモデルのうち、Claude3.5 (Amazon が投資)、GPT を含むオープンソースモデルは Llama3.1 だけです。 -4o (Microsoft が投資)、Gemini1 5 Pro (Google が自社開発) などはクローズドソースモデルです。

Li Jingmei 氏は、同じ会社のクローズドソースモデルはオープンソースモデルよりも優れたパフォーマンスを備えているに違いないと考えています。ただし、業界内の水平比較では、クローズドソースモデルがオープンソースモデルより必ずしも優れているわけではありません。大規模なモデルは 6 ～ 12 か月ごとに反復されるため、一部のオープンソースモデルはより速く進化する可能性があります。

審査機関によるランキングはこの傾向を示しています。 LMSYS 組織 (Large Model System Research Organization) は、カリフォルニア大学バークレー校によって設立され、長期にわたって世界的なモデルのパフォーマンスを評価し、ランク付けします。この評価では、Meta の Llama3.1 と Alibaba Cloud の Qwen2 が急速に順位を上げています。 Llama3.1 は、ほとんどのクローズドソースモデルをも上回ります。

中国のクラウドベンダーの大型モデル事業担当者は、この1年でオープンソースモデルとクローズドソースモデルの性能差が縮まった理由は2つあると分析し、ベーシックな大型モデルが全体的にボトルネック期に入ったという。パフォーマンスの向上。オープンソースモデルには多くの開発者が集まります。コードフィードバックを通じてモデルのパフォーマンスを直接向上させることはできませんが、モデル研究の全体的なレベルが向上し、間接的にオープンソースモデルのモデルパフォーマンスの向上に役立ちます。

3 番目の議論は、オープンソースモデルとクローズドソースモデル、どちらの方が高価かということです。結論から言えば、決め手となるのはパフォーマンスです。モデルの使用コストはモデルのパフォーマンスに直接関係します。パフォーマンスが高くなるほど、タスクを完了するために必要な呼び出しの数が少なくなるため、長期的な使用コストが低くなります。

オープンソースモデルは無料であり、多くの場合、より安価で低コストであるという印象を与えます。 Xin Zhou氏は、大規模モデルアプリケーションは「テクノロジー+サービス」を含む包括的なソリューションであり、企業は「総勘定元帳」を計算する必要があると説明した。クローズドソースモデルのメーカーは、完全なモデルとツールチェーンを提供するだけでなく、企業が迅速に事業を開始できるようにするためのトレーニングや技術サービスも提供しています。オープンソースモデルは無料に見えますが、クローズドソースと同じ効果を達成するには、その後に多大な人材、資金、時間の投資が必要となり、全体のコストが高くなります。

長期的には、オープンソースモデルとクローズドソースモデルのアプリケーションコストの決定的な要因は、推論のコストです。通常、パラメータの大きさが同じクローズドソースモデルは、オープンソースモデルよりも優れたパフォーマンスを発揮し、総合的なコストが低くなります。 Xin Zhou 氏は、企業がオープンソースモデルを無料で導入する場合、クローズドソースモデルの導入には 50 万元のコストがかかると試算しました。初期投資段階では、オープンソースモデルの方が安価です。使用の後期段階では、クローズドソースモデルの総合的なパフォーマンスがオープンソースモデルより 20% 優れている場合、一部の大規模企業ではクローズドソースモデルの方が 1 日あたり数万元を節約できます。。最終的には、長期的な使用コストはオープンソースモデルよりもはるかに低くなければなりません。

オープンソースモデルを使用しているのは誰ですか?クローズドソースモデルを使用しているのは誰ですか?

オープンソースモデルとクローズドソースモデルのどちらが優れていますか?この問題は、供給側のモデルメーカーによって決定されるのではなく、需要側の企業顧客によって決定されます。

公の場では企業内での舌戦が続いている。しかし、クラウドベンダーの多くの技術担当者は、これらの議論は互いの市場価値を否定することはできないと財京に語った。これら 2 つのニーズは長期間にわたって共存することになります。別の観点から見ると、舌戦は共同で市場の認知度を高めることを容易にします。

実際、ほとんどの企業顧客は、モデルがオープンソースである必要があるかどうかを気にしません。 Xin Zhou 氏は、多くの大企業の顧客とコミュニケーションをとった結果、IT 部門の責任者がモデルを使用すべきかどうかは、通常、効果、パフォーマンス、価格、セキュリティの優先順位によって決まることが判明したと結論付けました。オープンソースかクローズドソースかは決定的な要素ではありません。

ほとんどの企業の「ツールボックス」では、オープンソースモデルとクローズドソースモデルは補完的です。大企業による大規模モデルの実装は、通常、さまざまな段階に分かれています。

初期段階では、IT 部門が市場にあるオープンソースモデルとクローズドソースモデルのパフォーマンスと特徴を整理します。モデルによって利点も異なります。強力な言語発音機能を備えたモデルもあれば、強力なデータ統計機能を備えたモデルもあります。ビジネス効果を検証するための初期段階のオープンソースモデルの POC (概念実証) テストを無料で実施します。

中期的には、マーケティング、顧客サービス、ナレッジベースなど、難易度が低く成果が早いビジネスシナリオのプロジェクトを第1フェーズから開始していきます。クローズドソースモデルを購入する必要があるだけでなく、独自のオープンソースモデルをトレーニングして微調整する必要もあります。内部モデルと外部モデルを互いに「競争」させ、異なるモデルの効果とコストを比較し、いつでも使用方法を切り替えます。

後期では、実施結果をもとに、難易度が高く成果が出にくいビジネスシナリオの第2フェーズ、第3フェーズのプロジェクトを段階的に計画していきます。現時点では、独立した制御可能な基本的な大規模モデルまたは業界の大規模モデルのセットを確立するには、多くの場合、数千万元を費やす必要さえあります。

オープンソースモデルは無料ですが、そのままでは使用できず、時間と労力がかかり、詳細については誰も責任を負いません。クローズドソースモデルでは、成熟した製品を直接入手し、販売前、販売中、販売後に完全なサービスを提供できます。簡単に理解すると、オープンソースモデルは食べ物を買って自分で料理するようなものですが、クローズドソースモデルはレストランで食べるためにお金を使うようなものです。

Xin Zhou 氏の見解は、オープンソースモデルは学術研究、IT 予算が非常に限られている一部の中小企業、および一部の大企業の独立した制御可能な社内自己研究プロジェクトには適しているが、そうではないというものです。大規模な外部商業プロジェクトに適しています。数百万ドルまたは数千万ドルの費用がかかる一部の本格的な商業プロジェクトでは、依然としてクローズドソースモデルが最良の選択です。

オープンソースモデルはフリーランチではありません。オープンソースモデルを使用する大企業には、多くの隠れたコストが発生します。たとえば、コンピューティング能力やソフトウェアの適応などを購入します。中国の海外インテリジェントマーケティングサービスプロバイダーのテクニカルディレクターは今年 7 月、財京に対し、彼の会社はクラウドサービスに大きく依存しており、研究開発に毎年 8,000 万元以上を費やしていると語った。過去 2 年間、同社は 10 を超えるクローズドソースモデルを同時に使用してきましたが、その中にオープンソースモデルはありませんでした。同氏の見解では、オープンソースモデルの開発には時間と人手が必要だという。ほとんどのオープンソースモデルはそのままでは使用できず、誰も詳細を知らず、「おもちゃ」としか見なされません。彼は十数のクローズドソースモデルを管理し、価格とパフォーマンスに基づいていつでも切り替える傾向があります。これが最も費用対効果が高いです。

ある大手商業銀行の IT ディレクターは、オープンソースモデルをそのまま使用できないことは大きな問題ではないと考えています。同氏は2023年12月にCaijingに対し、彼のチームは自己開発のためにAlibaba（Tongyiオープンソースモデル）、Meta（Llamaオープンソースモデル）、Baidu（Wenxinシリーズ）、およびZhipu（GLMシリーズ）も使用していると語った。オープンソースモデルは、無料の POC テストが可能で、必要に応じて変更できるため、このような小規模プロジェクトに適しています。彼の IT チームには数十人の人材がおり、また外部委託された IT サービス会社にもこれらの問題に対処するのに十分な人材がいます。しかし同氏は、100万元や1,000万元の価値がある大規模プロジェクトでは、クローズドソースモデルの方が適しているとも考えている。クローズドソースモデルは安定していて信頼できるため、その管理を担当するモデル会社を見つけることもできます。

オープンソースモデルを使用して一連の業界モデルを完全にトレーニングするには数千万元の費用がかかり、また、自作のコンピュータールームを構築するには AI チップを購入する必要もあります。前述の AI ソフトウェアサービスプロバイダーの技術者は、オープンソースモデルは、データセキュリティ、自律性、制御に対する高い要件があり、コストをあまり重視しない一部の中央国営企業に適していると結論付けています。彼らはオープンソースモデルを使用して独自のインダストリモデルをトレーニングします。なぜなら、「オープンソースモデル + プライベートクラウド」は、多くの中央および国営企業のデータセキュリティと独立した制御性の要求を満たすからです。

将来は何ですか？

中国市場における大型モデルのオープンソースとクローズドソースの間の議論は、純粋に商業的な問題です。しかし、国際市場では、大規模モデルのオープンソースとクローズドソース間の紛争には、独占禁止法や国益などのより多くの要素が関係します。

今年5月の価格競争の後、中国の大型モデルコールは「粗利マイナス時代」に突入した。オープンソースモデルとクローズドソースモデルの両方が問題に直面しています。大規模モデルは直接利益を得ることができません。

中国のクラウドベンダーの大型モデル事業担当者は、「大型モデル市場でのノックアウト競争が始まっている」と分析し、大型モデルのコール粗利益がマイナスになっているということは、短期的にはコールが増えるほど収益が低下することを意味していると分析する。クラウドベンダーの損失はさらに大きくなります。中国のクラウドベンダーは、大規模モデルのコール価格が90％引き下げられた後、今後1～2年で大規模モデルのコール数が急激に増加すると賭けている。長期的には、顧客の需要が高まるにつれてクラウドベンダーのコンピューティング電力コストは薄まり、それでも最終的にはプラスの利益を達成できるでしょう。たとえこの賭けが当てはまらなかったとしても、モデルメーカーのグループは価格競争で消滅し、生き残ったメーカーがその残骸を拾うことになるだろう。

多くの業界関係者も財経に対し、この淘汰は１～２年続き、基本的なモデル企業だけが生き残れるとの見方を示した。

中国情報化百匯の執行委員であり、アリババクラウド知能技術研究センター所長の安暁鵬氏は今年7月、蔡京に対し、中国では数百機種の戦争はおろか、10機種の戦争さえ存在しないと語った。大型モデルには継続的な投資が必要で、10,000 枚または 100,000 枚のカードの容量があり、商業的な利益が必要です。多くの企業にはそのような機能がありません。将来的には、中国市場にはベーシックモデルのメーカーは 3 ～ 5 社しかなくなるでしょう。

価格競争で誰が利益を得るのでしょうか?最後に笑うのは誰だ?前述の中国の大手テクノロジー企業の AI 戦略プランナーは、今回の価格戦争ではアリババクラウドとバイトダンスの火山エンジンが最も多くの血を流していると考えています。 Alibaba Cloud はクラウドから収益を上げることができ、Volcano Engine は Bytedance の広告ビジネスを担っています。価格競争では、百度はアリババやバイトダンスほどではありません。しかし、Baidu の Wenxin 大型モデルには強力なテクノロジーがあり、そのテクノロジーに喜んでお金を払う顧客グループがいるでしょう。これは百度が価格競争を乗り切るのに役立つだろう。同氏はさらに、中国市場におけるこうした大型モデルの新興企業は今後1～2年で厳しい試練に直面すると説明した。大規模なモデルのスタートアップは、プロジェクトベースのモデル開発会社になるか、垂直型インダストリモデルに移行するかを選択できます。

中国の大規模モデル市場における全体的な競争は、オープンソースモデルとクローズドソースモデル間のローカルな競争よりもはるかに重要です。世界的な競争の方向性は、ローカルな競争の結果を直接決定します。

Alibaba Cloud 関係者は、オープンソースモデルとクローズドソースモデルの両方にそれぞれの利点があり、Alibaba Cloud は AI をより包括的なものにしたいと率直に述べました。オープンソースかクローズドソースかに関係なく、主な目的は開発者により多くの選択肢を提供することです。 Alibaba Cloud は、オープンソースとクローズドソースの 2 つの足で歩むことを選択しており、フルサイズのフルモーダルオープンソースモデルとクローズドソースモデルの両方を備えています。中国のクラウドベンダーの大規模モデル事業を担当する別の担当者は、オープンソースにはビジネスモデルがないと考えている。中国のモデル市場では、オープンソースにこだわることができるのは、持続的に資金を調達できる有力企業かごく少数のスタートアップだけだ。最終的には、中国市場に残るオープンソースモデルは 1 ～ 2 つだけになる可能性があります。

モデルメーカーは、ほぼ 6 ～ 12 か月ごとに新世代のモデルをトレーニングします。中国のモデル市場では、利益を上げるプレッシャーが高まるにつれて、モデルのオープンソースはますます「戦略的」なものになる可能性があります。企業は、前世代の遅れた技術とより小さなパラメーターを備えたモデルをオープンソースにし、ユーザーにお金を支払うように誘導する傾向があるでしょう。テクノロジーのアップデートとパラメータを使用します。

オープンソースモデルとクローズドソースモデルの間の競争はすぐには終わりません。企業によっては、オープンソースとクローズドソースの両方を同時に実行できる場合もあります。IT 業界では、これは前例がないわけではありません。データベースが誕生してから 60 年以上が経過し、最初のオープンソースデータベースが誕生してからは 50 年以上が経過しています。データベース市場は現在、さまざまなクローズドソースデータベースとオープンソースデータベースで活発であり、新しいデータベースブランドが絶え間なく登場し続けています。データベース大手の Oracle は、クローズドソースの RDBMS データベースとオープンソースの MySQL データベースの両方を持っています。

多くのクラウドベンダー技術者は、オープンソースモデルとクローズドソースモデルが長期間にわたって共存すると信じています。大型モデル市場は、技術路線の異なる競争の中で徐々に拡大していきます。

編集者｜張裕飛

ニュース