ニュース

大型モデルの投入をめぐる争いで、百度はどう突破できるのか。

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

1年以上の調査を経て、大型モデルは本当に「人気」なのか?

大きなモデルに関しては、「大きなパラメータ」を追求するか、「スケーリング則」を考慮するかという議論が絶えないようです。 「密」または「疎」のどちらのフレームワークが優れていますか? 「言語」または「マルチモダリティ」: 大規模モデルの本当の未来はどちらでしょうか?プレイヤーたちは明確な立場と自分の意見を持っていますが、この人気はより確立された市場には伝わっていないようです。

大手メーカーの中で、baidu は大規模なモデル エンジニアリングを導入している数少ない企業の 1 つです。本日発表された baidu の 2024 年第 2 四半期財務報告書によると、四半期総収益は 339 億元、baidu の中核収益は 267 億元、 baidu coreの営業利益は56億元で、前年同期比23%増加した。

wenxin の大規模モデルでは毎日 6 億件以上の通話があり、ai によってクラウド収益が 51 億元に達し、前年比 14% 増加しました。この成長は喜ばしいものです。

空に「浮かんでいる」aiを地上に戻すことで、このような結果が得られるのですか?

通話数は、値下げとさらに体力に依存して増加し続けています

baidu の第 2 四半期財務報告書の中で最も目を引くデータ、wenxin の大規模モデルへの通話の急増から始めましょう。

1 日あたりの呼び出し数は 6 億件を超え、1 日あたりに処理される平均トークン数は 1 兆件を超えます。相談件数の急増の裏で思い出されるのは、今年5月に業界全体の注目を集めた大規模な「大型モデル価格戦争」だ。

この戦いにおいて、baidu の値下げ努力は「猛烈」であると言えます。

戦いはすぐに始まり、baidu は ernie-speed、ernie-lite、ernie-tiny シリーズのモデル プリセット サービスが無料になると直接発表しました。

今年7月のwaic期間中に、baidu smart cloudは更なる値下げを発表し、2つの主力モデルであるernie 4.0とernie 3.5の価格を大幅に引き下げ、インプットとアウトプットはそれぞれ0.03元/千トークンと0.06元/千トークンに抑えられた。 。

価格の敷居を撤廃するだけで、当然多くのユーザーが殺到するだろう。特に、大・中・小の多くの企業や団体はコストを気にすることなく、大型モデルを積極的に試していきたいと考えています。

確かに、価格の低下により、顧客の電話に対する「プッシュ」は減少しました。また、大型モデルの競争は非常に熾烈であり、価格がさらに下がったとしても、特に価格が既に非常に低いにもかかわらず、なぜ wenxin が傑出しているのでしょうか。

ある記事では、このようなほぼ決定的な利益移転を実行できる百度の能力は、基本的に百度のより高度なフルスタックai技術に依存しており、それが無料化と値下げに自信を与えていると分析してきた。

wenxin big model の誕生以来、wenxin big model の週平均トレーニング効率は 98.8% に達し、wenxin yiyan のリリース時と比較してトレーニング効率は 5.1 倍に向上しました。推論は 105 倍になり、推論のコストは元の 1% に下がります。 baidu は 6 月に flying paddle 3.0 もリリースしました。このアップグレードにより、flying paddle フレームワークと baidu ai インフラストラクチャおよび wenxin の大規模モデルとの互換性が大幅に向上し、将来的にモデル推論コストがさらに削減されることが期待されています。

baidu は、大規模モデル ユーザーの現在の課題について非常に詳細な分析を行っています。ユーザーにとっての 1 つ目の課題は、アプリケーション実装の敷居が比較的高いことと、シナリオに基づいて適切なアプリケーションを迅速に開発する方法です。問題点は、特定のシナリオ、つまり業界のニーズを満たすために特別なモデルを使用する方法です。

基本的に、テクノロジー製品がユーザーに購入してもらうためには、やはりテクノロジー製品の「可用性」と「使いやすさ」が最優先事項となります。

財務報告書が発表されるちょうど前日、百度は同社の主力大型モデル「ernie 4.0 turbo」の微調整サポートを発表した。以前、baidu qianfan 大型モデル プラットフォームは、モデルの微調整のために ernie 3.5、ernie speed、ernie lite、ernie tiny、および ernie character をサポートしていましたが、これまでに合計 6 つの wenxin 大型モデルを qianfan プラットフォームで微調整できます。累積的な微調整 これまでに 21,000 のモデルを生産し、1,000 社を超える企業の中核的なビジネス シナリオに対応し、多くの成功事例を持っています。

政府事務の分野では、中華全国労働組合総連合会と百度スマートクラウドが法律相談に ai 機能を活用し、労働者が法的問題をより正確に理解し、労働補償額をより迅速に計算し、大規模なモデルを通じてよりパーソナライズされたソリューションを提供できるようになりました。 . ケースの評価を完了します。

従来の開発手法に比べ、極めて高い精度とフィードバックスピードが求められるこのシステムは、わずか1か月で納品され、従来の3~6か月の納品サイクルに比べて大幅な効率化が実現しました。

生産性がこれほど向上し、より多くのユーザーがこの価値を実感できるようになれば、wenxin の大規模モデルへの呼び出し数を増やさないことは難しくなるでしょう。

maasとツールに依存し、クラウドビジネスが急成長

ai の急速な発展は、baidu に直接的な成果をもたらし、同社のクラウド ビジネスの継続的な成長につながりました。

財務報告書によると、第2四半期の百度スマートクラウドの収益は前年同期比14%増の51億元で、ai収益が9%を占め、前四半期の6.9%を上回った。

優れた大型モデルを名刺代わりに扱えば、それと密接に連携するクラウドビジネスも自然と動いていくだろう。 ai アプリケーションの大きな隆盛により、gpu クラウドは徐々に企業調達における「標準構成」になりました。

その結果、サービスとしてのモデル (maas) モデルが徐々に段階に入り、baidu cloud の成長に新たに加わることになりました。

idcの最新レポートによると、baidu intelligent cloudは2023年に中国の大型モデルプラットフォーム市場シェアで1位となり、19.9%に達すると予想されている。同様に、今年中国で落札者として発表された約260件の大規模モデルプロジェクトの中で、百度は落札者ランキングでトップに立っている。主流の大型模型メーカーの中で、百度は落札プロジェクト数が最も多く、最も多くの業界をカバーし、落札額は6,400万元以上で、3社中第1位となっている。

大型モデルが発売された期間中、qianfan プラットフォームは「富を築き」、合計 15 万の顧客にサービスを提供してきました。政府関係、電力、教育などの多くの業界で努力を重ねてきました。技術的な製品が市場で認められるだけでなく、その評価は生産性の向上という形で社会にフィードバックをもたらします。

河南省や重慶市などの農村地域では、銭帆氏が「田舎へ行く大規模モデル」を推進しており、村民が医療保険の支払いや戸籍登録処理など、最も些細で時間のかかる問題を安全に支援機関に引き渡せるようにしている。大きなモデルの。

地方自治体のナレッジ ベースで正確にカバーすることが難しい問題に遭遇した場合、この大規模モデルでは、baidu 検索を組み合わせて回答を提供し、質問者に自動的に @返信することもでき、田舎に 24 時間便利なサービスをもたらします。

現在、常駐アシスタントが 6,000 以上の村に入り、一般の人々がよりスマートな生活を楽しめるようになりました。

顧客に「可用性」と「使いやすさ」を感じてもらうために、baidu の大規模モデルの商品化は、大規模モデルのツール チェーンのアップグレードに大きく依存しています。

ツールチェーンのアップグレードの深耕は、今年のbaiduの技術開発の主要テーマの1つである。

モデルの微調整の観点から、modelbuilder はハイブリッド wenxin ラージ モデルの高品質データ機能を開始しました。ユーザーは、一般的な混合コーパスおよび垂直ドメイン コーパスをビジネス データと統合して、より安定して効果的な業界固有の大規模モデルを微調整できます。

ai ネイティブ アプリケーション開発の観点から見ると、appbuilder は、ai ネイティブ アプリケーションの開発時に顧客が直面する問題の多くを解決します。大規模なナレッジの取得、カスタム戦略、エンタープライズ レベルのセキュリティ、その他の側面が強化され、大規模なモデルがより使いやすくなりました。レベル。現在、オンライン教育、電子商取引、政府事務、その他の業界をカバーする数十万以上のアプリケーションがプラットフォーム上に作成されています。

baidu の大規模モデル システムにより実際に顧客の生産性が向上したことは、業界の誰にとっても明らかです。

振り返ってみると、baidu 自体も巨大なテクノロジー製品エコシステムを持っています。大型モデルの能力が本当に強力であるならば、樹齢 24 年の「古木」である baidu は再び「新しい芽」を育てることができるでしょうか。

製品モデルを再構築し、世界を見て、自分自身を見てみましょう

インターネット上で広く広まっている話があります。第二次世界大戦のさなか、戦争は不安な時期でしたが、米軍のパラシュートの品質が心配されていました。パラシュートの合格率 100% を達成するために、軍隊がやって来ました。解決策を考えてみましょう: パラシュートの販売員に自分でテストしてもらいます。ジャンプしないと通過できません。その結果、パラシュート通過率はついに100%に近づいた。

「自分自身が製品を使用しない場合、どうやって他の人を安心させることができますか?」

同じ原則が百度にも当てはまります。ロビン・リー氏は昨年の初めに、百度のすべての製品を再構築するために文新モデルを使用すると大胆な声明を発表した。最初に矢面に立たされるのはbaiduの本拠地である検索だ。

現在、検索結果の 18% は ai によって生成されており、より正確で直接的な結果をユーザーに提供できます。これは、baidu が 1 年前に提案した「新しい検索」のコンセプトを裏付けるものであり、ユーザーの検索結果をより正確で、より整理され、より正確なものにするための「極度の満足度」、「推奨の刺激」、「複数ラウンドのインタラクション」の 3 つの特徴を備えています。より直感的に。

エージェントはその重要な役割を果たします。 baidu は検索結果へのエージェントの配信を加速しており、現在、baidu の 1 日あたりのエージェントの平均配信数は 8 億件を超えており、これは 5 月の 2 倍となっています。

ロビン・リー氏は、エージェントは ai ウェブサイトのようなもので、しきい値は低いが上限は高いと繰り返し強調してきました。

開発の観点から見ると、web サイトよりもエージェントの開発の方が簡単です。「当時、web サイトはどのように作られたのでしょうか? ブラウザーでソース コードを確認するだけで非常に簡単でした。今日は少し変更します。インテリジェント エージェントはこれとよく似ています。名前を付けて、何を応答し、何を応答しないかを指定すると、インテリジェント エージェントが作成されます。」

業界で最も初期の大手メーカーの 1 つである baidu は、インテリジェント エージェント トラックで具体化し始めているエコシステムを構築しました。 baidu wenxin intelligence platform agentbuilder には 200,000 人の開発者と 63,000 社の企業が登録されており、開発者が wenxin intelligence platform でエージェントを作成する場合、wenxin モデル 3.5 または 4.0 のバージョンを柔軟に選択でき、すべてのモデルが「平準化」されていると言えます。使用の閾値」。

今夏のパリオリンピックの開幕に伴い、多くのアスリートのファンが自発的にbaidu wenxinスマートプラットフォームに集まり、多くのファンサポートスマートボディを開発しました。中国の女子卓球選手孫穎莎のファンは彼女のために「孫穎莎の小さな扇子」を開発し、女子テニス選手の王曼宇を応援するファンは女子海女クアン・ホンチャンの知的なボディを人気のランドセルチャームとして開発した。ファンからは「ちゃんちゃんの小さなランドセル」と名付けられた やりとりがユニークでとても面白かったです。

農業分野では、中国工程院の朱有勇院士も百度の「農民院士インテリジェンス」の創設を支援した。 zhu youyong 氏と彼のチームの研究結果を備えたこのインテリジェント エージェントは、高品質の乾地米、冬ジャガイモ、その他の作物の作付けなど、農家のさまざまな質問に答えることができ、農家に利益をもたらすテクノロジーを新たなレベルに引き上げます。

敷居が低くて効果が高いのに、どうしてインテリジェントエージェントが普及しないのでしょうか?将来のインテリジェント エージェントの規模は、巨大なエコシステムを形成する今日の膨大な数の web サイトに匹敵するものであることを理解するのは難しくありません。

baidu の野心は、検索をインテリジェント エージェントの配布への最大の入り口として使用し、インテリジェント エージェントの偉大な繁栄の最前線に立つことです。

百度の多くの伝統的な製品の中でも、百度文空は「得点が2度ある」ことで有名です。

ビッグモデルによって「ワンストップ ai コンテンツ取得および作成プラットフォーム」に再構築された baidu wenku は、数百ものスマート ppt、スマート ドキュメント、スマート マインド マップ、スマート リサーチ レポートなどを備え、ai の道をさらに前進しています。モーダル ai 機能により、ユーザーのドキュメント エクスペリエンスと利用効率が大幅に向上します。

これまでに、baidu wenku ai ユーザーの累計は 1 億 8,000 万人を超え、ai 機能の使用回数は 22 億回を超え、より多くの人が大型モデルによってもたらされる生産性の恩恵を享受できるようになり、この 15 年前の製品は「二度目の春」。

結論

今年、robin li 氏はかつて、大規模モデルの焦点は依然として「ボリューム アプリケーション」であると注目を集める発言をしました。「アプリケーションがなければ、オープン ソースであろうとクローズド ソースであろうと、単なる基本モデルは価値がありません。」

しかし、実際に分かるのは、baidu は基本モデルとアプリケーションの両方を把握する必要があり、両手が強くなければならないということです。

過去 10 年間、baidu は大規模モデルと基礎的な ai 研究に汗を流し、ついに 1 エーカーの肥沃な土壌を育みました。しかし、土壌だけでは十分ではなく、baidu は ai ネイティブ アプリケーションの構築に焦点を当てた大規模モデル開発の第 2 段階に入りました。この「肥沃な土壌」で豊かな「作物」を育てます。

生成 ai をビジネスに深く統合し、大規模モデルを断固として使用して検索を再構築したことも、baidu に対する多くの証券会社の信頼を高めています。

jpモルガンは、「ビジネスの観点から見ると、このような変化はバリューチェーンにおける百度の役割を純粋な交通案内から販売前のコンサルティングまで拡大することになる。我々は後者がうまく実行されれば取引上の会話の流れが増加すると信じている」と述べた。中長期的には収益にプラスの影響を及ぼします。」

他の大手企業が大規模なモデルを実装したい場合は、実際に baidu から学ぶ必要があるかもしれません。つまり、使用量とコストのしきい値を最小限に抑え、クラウドの強みとツール チェーンに頼って適切に機能するエコシステムを構築し、大規模なモデルと既存のビジネスモデルを再構築するエージェント。

これら 3 つの動きはいずれも、大型モデルが真に「一般家庭に飛び込む」よう推進するための重要な取り組みです。