大規模モデルのオープン ソースとクローズド ソースをめぐる争いとは何ですか?
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
紛争は互いの市場価値を否定することはできません。2 つの市場ニーズは長期にわたって共存します。
文 | ウー・ジュンユー・シュ・ウェンプー
今年以来、中国と米国のAI(人工知能)業界の起業家や投資家、起業家らは、大規模モデルをオープンソースにするか、クローズドソースにするかという議論を同時に始めている。中国で論争の中心にいるのは、百度の創設者ロビン・リー氏だ。今年4月、同氏は「かつては誰もがオープンソースを使用しており、オープンソースは安価だと考えていた。実際、大規模モデルのシナリオではオープンソースが最も高価だ。オープンソースモデルはますます後進的になるだろう」と公に述べた。この見解には反対の声も少なくありません。反対派には、Alibaba Cloud CTO(最高技術責任者)のZhou Jingren氏、バイチュアン インテリジェンスCEOのWang Xiaochuan氏とCheetah Mobile CEOのFu Sheng氏。今年5月、周静仁氏はメディアのインタビューで「オープンソースが世界のテクノロジーとエコロジーに貢献していることは疑いの余地がない。これは世界中で何度も証明されており、これ以上議論する必要はない」と率直に語った。米国では議論がさらに白熱している。テスラ創設者のマスク氏はかつてAIスタートアップを訴えたオープンAI。マスク氏は、2015 年の OpenAI の主要な創設者および投資家の 1 人でした。同氏は、現最高経営責任者(CEO)のアルトマン氏が率いるOpenAIが「非営利団体として運営し、AIをオープンソースかつオープンソースにする」という公約に違反したと考えている。シリコンバレーの2人の著名な投資家、a16zの創設者であるアンドリーセン氏とクライナー・パーキンス・コーフィールド・アンド・バイヤーズの創設者であるコスラ氏は、ソーシャルメディア上で何度も対立してきた。前者は、クローズドソースモデルは巨大企業の独占につながり、学術研究を損なうと信じている。後者は、大規模モデルは経済兵器であり、オープンソースであるべきではないと考えています。
オープンソースはソフトウェア開発モデルです。ソースコードは無料で公開され、コミュニティからの寄付によって存続します。開発者は、ソフトウェアを自由にダウンロード、変更、配布し、ソフトウェアのバグ (ソフトウェアの欠陥またはエラー) を報告し、最適化の提案を行うことができます。この集合的なイノベーションにより、ソフトウェアの反復が加速されます。オープンソース モデルとは、無料で使用でき、モデル パラメーターなどの技術的な詳細が公開されているモデルを指します。クローズド ソース モデルは、支払いが必要で、技術的な詳細が公開されていないモデルを指します。簡単に理解すると、オープンソースは無料ですが、自分で食べ物を買って調理する必要があります。クローズドソースは有料であり、レストランに食事に行くのと同じであり、より良いサービスを受けることができます。大規模なモデルはオープンソースにするべきでしょうか、それともクローズドソースにするべきですか?商業的利益、技術的意見、その他の要因が入り混じっているため、多くの事実が混乱していますが、この議論の背後にはいくつかの確かな事実があります。まず、ビジネス戦略が異なると、企業は異なる技術的ルートを選択できるようになります。Baidu や OpenAI などの企業は、大規模なモデル ビジネスを迅速に商業化したいと考えており、Alibaba Cloud や Meta などの企業はクローズド ソースを選択しています。クラウドコンピューティングあるいは、収益性の高い広告ビジネスを行っている企業は、パイを大きくするためにオープンソースを選択します。第二に、オープンソースとクローズドソースの市場需要は長期間にわたって共存し、どちらが優れているかを単純に判断することは不可能です。オープンソース モデルとクローズド ソース モデルにはそれぞれ適用可能なシナリオがあり、どのモデルを選択するかは市場の需要に関連します。これはモデルメーカーの意向によって変更されるものではありません。第三に、オープンソース モデルとオープンソース ソフトウェアの間には本質的な違いがあります。オープンソース ソフトウェアは、ソース コードとほとんどの技術的な詳細を公開します。オープンソース モデルは、無料の技術的なブラック ボックスに似ています。モデルのパラメーターはオープンですが、ソース コード、トレーニング データ、トレーニング プロセス、その他の技術的な詳細がオープンになることはほとんどありません。さらに、中国の AI 業界におけるオープン ソースとクローズド ソースの戦いは、むしろ商業的な競争に関するものです。オープンソースには国境がなく、この概念は一般的に認識されています。しかし、AI業界における中国と米国の競争激化を背景に、オープンソースに対する米国業界の反対の声はますます大きくなっている。
大型モデルの開発はまだ初期段階にあり、試行錯誤が必要です。オープンソースとクローズドソースは区別されません。企業は、オープンソースかクローズドソースかという多肢選択の問題に直面したとき、3 つの異なる道をたどることになります。最も極端なことは、オープンソース モデルのみを実行することです。この道を歩む企業は比較的少なく、Meta はその数少ない企業の 1 つです。利点は、より多くのユーザーを引き付けることです。問題は、収益モデルがなく、大企業だけがそれを行う余裕があることです。Meta が所有する Llama 3 は、世界で最も多くのユーザーを持つオープンソース モデルです。メタの主力事業はソーシャルメディア(フェイスブック、インスタグラムなど)で、2023年の純利益は390億ドルに達する。メタには新しいビジネスを探索したいという衝動がありますが、モデルを通じてお金を稼ぐというプレッシャーはありません。したがって、オープンソースモデルのみを実行でき、当面は収益性の問題は考慮されません。中間のパスは、オープンソースとクローズドソースを並行して行うもので、非常に柔軟性があります。企業はオープンソースを通じてユーザーを獲得できるだけでなく、クローズドソースを通じて収入も得ることができるため、開発者に選択の余地が与えられるだけでなく、企業自身にもミスの余地が与えられます。この道を選択している企業には、Microsoft、Google、Alibaba Cloud、Tencent Cloud に加え、Mistral Al、Zhipu AI、Baichuan Intelligence などの AI スタートアップ企業が含まれます。オープンソースとクローズドソースを並列化する際の一般的な方法は、無料のオープンソースモデルを使用してユーザーを引きつけ、よりサイズが大きく、より強力なパフォーマンスを持つクローズドソースモデルを使用するようにユーザーを誘導することです。たとえば、Microsoft の主な商用モデルは OpenAI の GPT-4 シリーズですが、小型モデルの Phi-3 Mini もオープンソース化しています。Alibaba Cloud は、5 億から 1,100 億の範囲のパラメータを持つ 10 以上のモデルをオープンソース化しています。クローズドソースの基盤、業界モデル。Google は小規模モデルの Gemma シリーズをオープンソース化しており、Mistral Al などの新興企業はオープンソース化されたモデルを提供しています。前世代ではパフォーマンスを向上させ、今世代ではより強力なパフォーマンスを備えたモデルを使用するためにユーザーを料金を支払うように誘導しました。オープンソースとクローズドソースの問題は、商業化には競合する取り組みが含まれる場合があることです。一部の顧客は無料のオープンソース モデルを使用しており、今後は有料のクローズド ソース モデルを使用しない予定です。その結果、模型メーカーは収入の一部を失うことになる。中国の AI ソフトウェア サービス プロバイダーの技術者が今年 7 月に財京に語ったところによると、彼らは最近、地方都市の観光局向けの二次トレーニングと微調整に Alibaba Cloud の Tongyi Qianwen オープンソース モデル (Qwen2) を使用したとのこと。この注文は1000万元を超えており、彼らは受益者だが、アリババクラウドには収入がない。 「Caijing」は、Github (世界最大のコードホスティングプラットフォーム) 上で Qwen2 のライセンス契約について問い合わせました。規約には「商用利用の申請は不要」と書かれている。言い換えれば、Qwen2 をトレーニングして微調整した後は、商用利用のために料金を支払う必要はありません。オープンソースの長期的な価値は、モデル市場のケーキを大きくすることです。 Alibaba Cloud 担当者は Caijing に対し、ユーザーが商用目的でオープンソース モデルを変更するのは普通のことであり、オープンソースを行う場合にはこれに対する準備をしておく必要があると語った。 Alibaba Cloud はまだすべてを食べ尽くしたわけではありませんが、業界のケーキをさらに大きくしました。長期的には、最終的には利益を得るでしょう。化学反応は、大型モデルが政府、大企業、中堅企業、開発者などのさまざまな顧客によって広く使用される場合にのみ発生します。大規模モデル産業はエコロジーを確立し、成長フライホイールを形成する必要があります。この傾向は、Alibaba Cloud が所有する AI オープンソース コミュニティである ModelScope で見ることができます。今年 7 月の時点で、Moda コミュニティには 560 万人を超える開発者、5,500 を超える高品質モデル、数千のデータセットがあり、中国最大のオープンソース モデル コミュニティとなっています。もっと楽観的な見方は、オープンソースとクローズドソースが上流と下流の関係を形成する可能性さえあるということです。オープンソースはテクノロジーの上流にあり、コミュニティへの参加、テクノロジーの反復、顧客の誘致、テクノロジーが競合他社よりも先を行くことを保証する役割を担っています。クローズドソースは下流にあり、商業的な実現を担当します。Lanzhou Technology は、中国の大手模型スタートアップ企業です。 Lanzhou Technology のパートナー兼共同 CEO である Li Jingmei 氏は、オープンソースは技術戦略であると同時にビジネス戦略でもあると Caijing 氏に語った。それは開発者コミュニティだけでなく、潜在的な顧客の技術チームの精神にも影響を与える可能性があります。オープンソースとクローズドソースは矛盾するものではありません。クローズド ソース モデルの顧客フィードバック サイクルは比較的長いですが、オープン ソース モデルのコミュニティ開発者はすぐにフィードバックを提供します。これにより、企業は製品を迅速に反復することができます。中国の大手テクノロジー企業の AI 戦略プランナーは、Alibaba Cloud などの大手クラウド ベンダーにとって、オープン ソースとクローズド ソースを並行して使用する方が、クローズド ソースのみよりも優れていると考えています。 Alibaba Cloud の収益は主に、パブリック クラウドの 4 つの主要コンポーネント (コンピューティング、ストレージ、ネットワーク、データベース) から得られます。無料のオープンソース モデルは顧客のビジネス データの消費を促進し、それによって上記の基本的なクラウド製品の売上を促進します。クローズドソース モデルを作成するだけが、シンプルで直接的かつ論理的なアプローチです。この路線をとる大企業は、大規模モデルを商品化する場合はクローズドソースでなければならず、そうでなければ商業ループを閉じることはできないと考えています。AI スタートアップの OpenAI (同社の GPT-4 シリーズ モデル)、Amazon (AI スタートアップの Anthropic に投資。Claude 3.5 シリーズ モデルを含む)、Huawei (Pangu モデル)、Baidu (Wenxin モデル) およびその他の企業がこの道を選択しています。大規模なモデルを使用する企業は、API (アプリケーション プログラミング インターフェイス) 呼び出しごとに料金を支払うことが多く、これは水道、電気、ガスの料金を使用量に応じて支払うのと同じです。クローズドソースモデルのビジネスモデルは、理論的には最も健全です。 Microsoft Azure、Amazon AWS、Google Cloud の売上成長率はこの 1 年間で約 5 ポイント増加し、利益水準も若干増加しました。これは大規模なモデルのプルの結果であると考えられます。しかし中国では、クローズドソースモデルが短期的に真の利益を上げることは困難です。今年5月、中国モデル市場で価格競争が始まった。値下げの目的は、顧客の需要を喚起し、市場規模を拡大することです。 ByteDance のクラウド サービスである Volcano Engine、Alibaba Cloud、Tencent Cloud、Baidu Smart Cloud は、大規模モデルの通話料金を 90% 以上値下げしてきました。大型モデルの売上総利益率は60%以上から0%未満に低下した。中国クラウドベンダーの大型モデル事業担当者は、大型モデルコールは「粗利マイナス時代」に入ったとみる。使えば使うほど損失は大きくなります。違いは、Alibaba、ByteDance、Baidu などの大企業は損失を許容できるが、中小企業や新興企業は損失を許容できないことです。彼と大規模モデルのスタートアップ幹部も同様の見解を示した。企業が異なれば遺伝子もモデル事業戦略も異なる。クラウドは Alibaba Cloud の中核ビジネスであり、オープンソース モデルの最終目標はより多くのクラウドを販売することです。 Volcano Engine は ByteDance の支援を受けており、親会社の広告事業を注入することができます。ボルケーノ・エンジンのクラウドコンピューティング市場シェアはアリババクラウドよりもはるかに低く、「裸足で靴を履くのを恐れない」ため、価格競争を通じてさらなる市場シェアを獲得したいとしている。 AI は Baidu の中核事業であり、Baidu は大規模なモデルから収益を上げたいと考えており、クローズドソース モデルの価値を重視しています。
中国の大規模モデルに関するオープンソースとクローズドソースの議論にはいくつかの焦点があります。まず、オープンソース モデルとオープンソース ソフトウェアの間に違いはあるのでしょうか?次に、オープンソース モデルとクローズド ソース モデルのどちらが強いでしょうか?第三に、オープンソース モデルとクローズド ソース モデルではどちらの方が高価ですか?最初の議論は、オープンソース モデルとオープンソース ソフトウェアの間に違いはあるのかということです。答えは、大きな違いがあるということです。オープンソース モデルの大部分は完全にオープンソースではありません。オープンソース ソフトウェアのような透明なボックスではなく、無料で使用できるブラック ボックスのようなものです。オープンソース ソフトウェアはソース コードを公開し、開発者はソース コードを通じてソフトウェアの技術的な詳細のほとんどを習得できます。無料のオープンソース ソフトウェアの中核となるロジックは、社会全体の開発者がソフトウェア メーカーが製品のバグを発見し、最適化の提案を提供できるよう支援できるということです。ソーシャル開発は、ソフトウェアの研究開発コストを削減するだけでなく、ソフトウェアの反復を高速化することもできます。モバイル オペレーティング システムの Android とデータベース ソフトウェアの MySQL はどちらもこの方法で成功を収めました。オープンソース モデルの複雑さは、オープンソース ソフトウェアの複雑さをはるかに超えています。オープンソース プロジェクトには、ソース コード、パラメーターの重み、モデル構造、トレーニング データ、トレーニング プロセスなどが含まれます。オランダのラドボウド大学の2人の学者、リーゼンフェルト氏とディンゲマンス氏は、今年3月にオープンソースモデルにおけるオープンソースの度合いを比較する論文を発表した。この論文では、最もパフォーマンスの高いオープンソース モデルは、通常、オープンソース パラメーターの重みのみを使用していることを示しています。説明の 1 つは、最先端のモデルのパフォーマンスを確保するために、モデルのメーカーがすべての「レシピ」を公開できないということです。世界で最も強力なオープンソース モデル Llama3 を例に挙げると、そのパラメータの重みとモデル構造は部分的にのみオープンソース化されています。ソース コード、トレーニング データ、およびトレーニング プロセスはオープンソース化されていません。
産業エコロジーに対するオープンソースの概念の価値には疑いの余地がありません。Baidu Smart Cloud AI および大規模モデル プラットフォームのゼネラル マネージャーである Xin Zhou 氏は、今年 7 月に Caijing に対し、オープンソース モデルによってモデル アプリケーションと業界モデルがよりリッチになると語った。しかし、彼はオープンソースモデルとオープンソースソフトウェアを混同することに反対している。なぜなら、この 2 つには本質的な違いがあるからです。オープンソース モデルでは、オープンソース ソフトウェアのように製品のパフォーマンスを向上させ、研究開発コストを削減するためにソーシャル開発者の参加に依存することができません。基本モデルは、モデル メーカー自身のトレーニングによってのみ改善できます。オープンソース モデルの微調整と推論の最適化は、開発者にとって高度な技術要件があり、実際の使用コストは高くありません。低い。2 番目の議論は、オープンソース モデルとクローズド ソース モデルのどちらが強いかということです。実際、クローズドソース モデルは一般にオープンソース モデルよりもパフォーマンスが優れていますが、オープンソース モデルとクローズドソース モデル間のパフォーマンスの差は縮まりつつあります。
スタンフォード大学の基本モデル研究センター (CRFM) は、長年にわたって世界的な大規模モデルのテストのランキングを実施してきました。 7 月 24 日の時点で発表された大規模マルチタスク言語理解 (MMLU) テストのランキングによると、トップ 10 のパフォーマンス モデルのうち、Claude3.5 (Amazon が投資)、GPT を含むオープンソース モデルは Llama3.1 だけです。 -4o (Microsoft が投資)、Gemini1 5 Pro (Google が自社開発) などはクローズド ソース モデルです。Li Jingmei 氏は、同じ会社のクローズド ソース モデルはオープン ソース モデルよりも優れたパフォーマンスを備えているに違いないと考えています。ただし、業界内の水平比較では、クローズド ソース モデルがオープン ソース モデルより必ずしも優れているわけではありません。大規模なモデルは 6 ~ 12 か月ごとに反復されるため、一部のオープンソース モデルはより速く進化する可能性があります。
審査機関によるランキングはこの傾向を示しています。 LMSYS 組織 (Large Model System Research Organization) は、カリフォルニア大学バークレー校によって設立され、長期にわたって世界的なモデルのパフォーマンスを評価し、ランク付けします。この評価では、Meta の Llama3.1 と Alibaba Cloud の Qwen2 が急速に順位を上げています。 Llama3.1 は、ほとんどのクローズド ソース モデルをも上回ります。中国のクラウドベンダーの大型モデル事業担当者は、この1年でオープンソースモデルとクローズドソースモデルの性能差が縮まった理由は2つあると分析し、ベーシックな大型モデルが全体的にボトルネック期に入ったという。パフォーマンスの向上。オープンソース モデルには多くの開発者が集まります。コード フィードバックを通じてモデルのパフォーマンスを直接向上させることはできませんが、モデル研究の全体的なレベルが向上し、間接的にオープン ソース モデルのモデル パフォーマンスの向上に役立ちます。3 番目の議論は、オープンソース モデルとクローズド ソース モデル、どちらの方が高価かということです。結論から言えば、決め手となるのはパフォーマンスです。モデルの使用コストはモデルのパフォーマンスに直接関係します。パフォーマンスが高くなるほど、タスクを完了するために必要な呼び出しの数が少なくなるため、長期的な使用コストが低くなります。オープンソースモデルは無料であり、多くの場合、より安価で低コストであるという印象を与えます。 Xin Zhou氏は、大規模モデルアプリケーションは「テクノロジー+サービス」を含む包括的なソリューションであり、企業は「総勘定元帳」を計算する必要があると説明した。 クローズド ソース モデルのメーカーは、完全なモデルとツール チェーンを提供するだけでなく、企業が迅速に事業を開始できるようにするためのトレーニングや技術サービスも提供しています。オープンソース モデルは無料に見えますが、クローズド ソースと同じ効果を達成するには、その後に多大な人材、資金、時間の投資が必要となり、全体のコストが高くなります。長期的には、オープンソース モデルとクローズド ソース モデルのアプリケーション コストの決定的な要因は、推論のコストです。通常、パラメータの大きさが同じクローズドソース モデルは、オープンソース モデルよりも優れたパフォーマンスを発揮し、総合的なコストが低くなります。 Xin Zhou 氏は、企業がオープンソース モデルを無料で導入する場合、クローズド ソース モデルの導入には 50 万元のコストがかかると試算しました。初期投資段階では、オープンソースモデルの方が安価です。使用の後期段階では、クローズドソース モデルの総合的なパフォーマンスがオープンソース モデルより 20% 優れている場合、一部の大規模企業ではクローズドソース モデルの方が 1 日あたり数万元を節約できます。 。最終的には、長期的な使用コストはオープンソース モデルよりもはるかに低くなければなりません。
オープンソース モデルを使用しているのは誰ですか?クローズドソースモデルを使用しているのは誰ですか?オープンソース モデルとクローズド ソース モデルのどちらが優れていますか?この問題は、供給側のモデル メーカーによって決定されるのではなく、需要側の企業顧客によって決定されます。公の場では企業内での舌戦が続いている。しかし、クラウドベンダーの多くの技術担当者は、これらの議論は互いの市場価値を否定することはできないと財京に語った。これら 2 つのニーズは長期間にわたって共存することになります。別の観点から見ると、舌戦は共同で市場の認知度を高めることを容易にします。実際、ほとんどの企業顧客は、モデルがオープンソースである必要があるかどうかを気にしません。 Xin Zhou 氏は、多くの大企業の顧客とコミュニケーションをとった結果、IT 部門の責任者がモデルを使用すべきかどうかは、通常、効果、パフォーマンス、価格、セキュリティの優先順位によって決まることが判明したと結論付けました。オープンソースかクローズドソースかは決定的な要素ではありません。ほとんどの企業の「ツールボックス」では、オープンソース モデルとクローズド ソース モデルは補完的です。大企業による大規模モデルの実装は、通常、さまざまな段階に分かれています。初期段階では、IT 部門が市場にあるオープンソース モデルとクローズド ソース モデルのパフォーマンスと特徴を整理します。モデルによって利点も異なります。強力な言語発音機能を備えたモデルもあれば、強力なデータ統計機能を備えたモデルもあります。ビジネス効果を検証するための初期段階のオープンソース モデルの POC (概念実証) テストを無料で実施します。中期的には、マーケティング、顧客サービス、ナレッジベースなど、難易度が低く成果が早いビジネスシナリオのプロジェクトを第1フェーズから開始していきます。クローズドソース モデルを購入する必要があるだけでなく、独自のオープンソース モデルをトレーニングして微調整する必要もあります。内部モデルと外部モデルを互いに「競争」させ、異なるモデルの効果とコストを比較し、いつでも使用方法を切り替えます。後期では、実施結果をもとに、難易度が高く成果が出にくいビジネスシナリオの第2フェーズ、第3フェーズのプロジェクトを段階的に計画していきます。現時点では、独立した制御可能な基本的な大規模モデルまたは業界の大規模モデルのセットを確立するには、多くの場合、数千万元を費やす必要さえあります。オープンソース モデルは無料ですが、そのままでは使用できず、時間と労力がかかり、詳細については誰も責任を負いません。クローズドソース モデルでは、成熟した製品を直接入手し、販売前、販売中、販売後に完全なサービスを提供できます。簡単に理解すると、オープンソース モデルは食べ物を買って自分で料理するようなものですが、クローズド ソース モデルはレストランで食べるためにお金を使うようなものです。Xin Zhou 氏の見解は、オープンソース モデルは学術研究、IT 予算が非常に限られている一部の中小企業、および一部の大企業の独立した制御可能な社内自己研究プロジェクトには適しているが、そうではないというものです。大規模な外部商業プロジェクトに適しています。数百万ドルまたは数千万ドルの費用がかかる一部の本格的な商業プロジェクトでは、依然としてクローズドソース モデルが最良の選択です。オープンソース モデルはフリーランチではありません。オープンソース モデルを使用する大企業には、多くの隠れたコストが発生します。たとえば、コンピューティング能力やソフトウェアの適応などを購入します。中国の海外インテリジェント マーケティング サービス プロバイダーのテクニカル ディレクターは今年 7 月、財京に対し、彼の会社はクラウド サービスに大きく依存しており、研究開発に毎年 8,000 万元以上を費やしていると語った。過去 2 年間、同社は 10 を超えるクローズドソース モデルを同時に使用してきましたが、その中にオープンソース モデルはありませんでした。同氏の見解では、オープンソースモデルの開発には時間と人手が必要だという。ほとんどのオープンソース モデルはそのままでは使用できず、誰も詳細を知らず、「おもちゃ」としか見なされません。彼は十数のクローズドソース モデルを管理し、価格とパフォーマンスに基づいていつでも切り替える傾向があります。これが最も費用対効果が高いです。ある大手商業銀行の IT ディレクターは、オープンソース モデルをそのまま使用できないことは大きな問題ではないと考えています。同氏は2023年12月にCaijingに対し、彼のチームは自己開発のためにAlibaba(Tongyiオープンソースモデル)、Meta(Llamaオープンソースモデル)、Baidu(Wenxinシリーズ)、およびZhipu(GLMシリーズ)も使用していると語った。オープンソース モデルは、無料の POC テストが可能で、必要に応じて変更できるため、このような小規模プロジェクトに適しています。彼の IT チームには数十人の人材がおり、また外部委託された IT サービス会社にもこれらの問題に対処するのに十分な人材がいます。しかし同氏は、100万元や1,000万元の価値がある大規模プロジェクトでは、クローズドソースモデルの方が適しているとも考えている。クローズドソース モデルは安定していて信頼できるため、その管理を担当するモデル会社を見つけることもできます。オープンソース モデルを使用して一連の業界モデルを完全にトレーニングするには数千万元の費用がかかり、また、自作のコンピューター ルームを構築するには AI チップを購入する必要もあります。前述の AI ソフトウェア サービス プロバイダーの技術者は、オープンソース モデルは、データ セキュリティ、自律性、制御に対する高い要件があり、コストをあまり重視しない一部の中央国営企業に適していると結論付けています。彼らはオープンソース モデルを使用して独自のインダストリ モデルをトレーニングします。なぜなら、「オープンソース モデル + プライベート クラウド」は、多くの中央および国営企業のデータ セキュリティと独立した制御性の要求を満たすからです。
中国市場における大型モデルのオープンソースとクローズドソースの間の議論は、純粋に商業的な問題です。しかし、国際市場では、大規模モデルのオープンソースとクローズドソース間の紛争には、独占禁止法や国益などのより多くの要素が関係します。今年5月の価格競争の後、中国の大型モデルコールは「粗利マイナス時代」に突入した。オープンソース モデルとクローズド ソース モデルの両方が問題に直面しています。大規模モデルは直接利益を得ることができません。中国のクラウドベンダーの大型モデル事業担当者は、「大型モデル市場でのノックアウト競争が始まっている」と分析し、大型モデルのコール粗利益がマイナスになっているということは、短期的にはコールが増えるほど収益が低下することを意味していると分析する。クラウド ベンダーの損失はさらに大きくなります。中国のクラウドベンダーは、大規模モデルのコール価格が90%引き下げられた後、今後1~2年で大規模モデルのコール数が急激に増加すると賭けている。長期的には、顧客の需要が高まるにつれてクラウド ベンダーのコンピューティング電力コストは薄まり、それでも最終的にはプラスの利益を達成できるでしょう。たとえこの賭けが当てはまらなかったとしても、モデルメーカーのグループは価格競争で消滅し、生き残ったメーカーがその残骸を拾うことになるだろう。多くの業界関係者も財経に対し、この淘汰は1~2年続き、基本的なモデル企業だけが生き残れるとの見方を示した。中国情報化百匯の執行委員であり、アリババクラウド知能技術研究センター所長の安暁鵬氏は今年7月、蔡京に対し、中国では数百機種の戦争はおろか、10機種の戦争さえ存在しないと語った。大型モデルには継続的な投資が必要で、10,000 枚または 100,000 枚のカードの容量があり、商業的な利益が必要です。多くの企業にはそのような機能がありません。将来的には、中国市場にはベーシックモデルのメーカーは 3 ~ 5 社しかなくなるでしょう。価格競争で誰が利益を得るのでしょうか?最後に笑うのは誰だ?前述の中国の大手テクノロジー企業の AI 戦略プランナーは、今回の価格戦争ではアリババ クラウドとバイトダンスの火山エンジンが最も多くの血を流していると考えています。 Alibaba Cloud はクラウドから収益を上げることができ、Volcano Engine は Bytedance の広告ビジネスを担っています。価格競争では、百度はアリババやバイトダンスほどではありません。しかし、Baidu の Wenxin 大型モデルには強力なテクノロジーがあり、そのテクノロジーに喜んでお金を払う顧客グループがいるでしょう。これは百度が価格競争を乗り切るのに役立つだろう。同氏はさらに、中国市場におけるこうした大型モデルの新興企業は今後1~2年で厳しい試練に直面すると説明した。大規模なモデルのスタートアップは、プロジェクトベースのモデル開発会社になるか、垂直型インダストリ モデルに移行するかを選択できます。中国の大規模モデル市場における全体的な競争は、オープンソース モデルとクローズド ソース モデル間のローカルな競争よりもはるかに重要です。世界的な競争の方向性は、ローカルな競争の結果を直接決定します。Alibaba Cloud 関係者は、オープンソース モデルとクローズド ソース モデルの両方にそれぞれの利点があり、Alibaba Cloud は AI をより包括的なものにしたいと率直に述べました。オープンソースかクローズドソースかに関係なく、主な目的は開発者により多くの選択肢を提供することです。 Alibaba Cloud は、オープン ソースとクローズド ソースの 2 つの足で歩むことを選択しており、フルサイズのフルモーダル オープン ソース モデルとクローズド ソース モデルの両方を備えています。中国のクラウドベンダーの大規模モデル事業を担当する別の担当者は、オープンソースにはビジネスモデルがないと考えている。中国のモデル市場では、オープンソースにこだわることができるのは、持続的に資金を調達できる有力企業かごく少数のスタートアップだけだ。最終的には、中国市場に残るオープンソース モデルは 1 ~ 2 つだけになる可能性があります。モデル メーカーは、ほぼ 6 ~ 12 か月ごとに新世代のモデルをトレーニングします。中国のモデル市場では、利益を上げるプレッシャーが高まるにつれて、モデルのオープンソースはますます「戦略的」なものになる可能性があります。企業は、前世代の遅れた技術とより小さなパラメーターを備えたモデルをオープンソースにし、ユーザーにお金を支払うように誘導する傾向があるでしょう。テクノロジーのアップデートとパラメータを使用します。オープンソース モデルとクローズド ソース モデルの間の競争はすぐには終わりません。企業によっては、オープンソースとクローズドソースの両方を同時に実行できる場合もあります。IT 業界では、これは前例がないわけではありません。データベースが誕生してから 60 年以上が経過し、最初のオープンソース データベースが誕生してからは 50 年以上が経過しています。データベース市場は現在、さまざまなクローズド ソース データベースとオープン ソース データベースで活発であり、新しいデータベース ブランドが絶え間なく登場し続けています。データベース大手の Oracle は、クローズドソースの RDBMS データベースとオープンソースの MySQL データベースの両方を持っています。多くのクラウド ベンダー技術者は、オープン ソース モデルとクローズド ソース モデルが長期間にわたって共存すると信じています。大型モデル市場は、技術路線の異なる競争の中で徐々に拡大していきます。