ロビン・リーの内部発言が暴露: 大型モデルに関する 3 つの主要な認知的誤解について議論、モデル間のギャップは将来さらに広がるだろう

ロビン・リーの内部発言が暴露: 大型モデルに関する 3 つの主要な認知的誤解について議論、モデル間のギャップは将来さらに拡大する

2024-09-16

最近のメディア報道によると、「外の世界では大型モデルについてかなり多くの誤解がある」とロビン・リー氏の社内での発言が暴露されたという。最近の従業員とのコミュニケーションの中で、robin li 氏は、大規模モデルに関する 3 つの誤解について、大規模モデルの競争、オープンソースモデルの効率性、インテリジェントエージェントについて話しました。傾向熱い話題を待ってください。

ロビン・リー氏は、大型モデル間の差は将来的にますます大きくなる可能性があると述べた。同氏は、大規模モデルの上限は非常に高く、理想的な状況にはまだ程遠いため、モデルは繰り返し、更新し、アップグレードし続け、数年以上継続的に投資できる必要があると述べた。 10 年間継続してユーザーのニーズに応え、コストを削減します。

以下は社内スピーチの内容です

質問: 大規模モデルの機能間に障壁はないと考える人もいますか?

ロビン・リー：私はこの意見に同意しません。外の世界では、大きなモデルについてかなり多くの誤解があると思います。新しいモデルがリリースされるたびに、彼らは必ずそれがどれほど優れているかを主張し、それをフォローしたいと考えています。gpt-4o との比較のために、テストセットやいくつかのリストを作成し、スコアが gpt-4o とほぼ同じか、いくつかの項目でそれを上回っていると述べていますが、これはこれらの新しくリリースされたモデルが最先端であることを証明するものではありません。 openalと比較するとそこまで大きな差はありません。

モデル間のギャップは多次元であり、1 つの次元は、理解能力、生成能力、論理的推論能力、記憶能力などの基本的な能力の違いであり、もう 1 つの次元はコストです。，この能力を身につけたい、またはこれらの質問に答えたい場合、どれくらいの費用がかかりますか?一部のモデルは推論速度が非常に遅い場合がありますが、同じ効果が得られますが、実際には最も高度なモデルほど優れたエクスペリエンスは得られません。そしてお試しセットに関してはオーバーフィッティングにより、その能力を証明したいすべてのモデルがランキングに参加します。ランキングを行うとき、彼は他の人が何をテストしているのか、どの質問が使用でき、どのテクニックが正解できるのかをランキングから推測する必要があります。またはテストセット一見したところ、機能は非常に近いと思われますが、実際のアプリケーションではまだ明らかなギャップがあります。

セルフメディアの誇大広告の一部は、新モデルがリリースされるたびに宣伝する動機と相まって、モデル間の機能の差が比較的小さいという印象を誰にでも与えます。実際にはそうではありません。実際の使用プロセスにおいて、wenxin 大型モデルの能力を真に評価するのは、特定のアプリケーションシナリオでユーザーのニーズを満たせるかどうか、そして価値の向上を生み出すことができるかどうかです。私たちが本当に大切にしていること。

モデルの機能間には比較的明らかなギャップがある一方で、現在行っていることは、実際にやりたいことや目標からはまだ遠いということを理解する必要があります。理想的な状態であるため、モデルを継続的かつ迅速に反復、更新、アップグレードする必要もあります。今日は差がそれほど大きくないように見えても、次の年には差が広がっているかどうかがわかりますか? ユーザーのニーズを満たし、シナリオを満たし、効率の向上やコスト削減のニーズを満たせるように、この方向への投資を数年、さらには 10 年以上続けられる人がいるでしょうか。しかし、実際のニーズが分からない場合、テストセットの質問をこなすだけでほぼ十分だと感じるかもしれません。

いわゆるリーダー12 か月または 18 か月遅れても、それはそれほど重要ではないと思います。私たちの各企業は完全に競争の激しい市場環境にあり、どの方向に進んでも、競合他社よりも常に 12 ～ 18 か月先を行くことができれば、無敵になります。 12 人から 18 人があなたより先にいると考えてください。1 か月は非常に短い時間です。たとえ競合他社よりも常に先を行くことが保証できたとしても6か月後、勝ちます、あなたの市場シェアはおそらく70% であるのに対し、相手は 20%、あるいは 10% のシェアしか持っていない可能性があります。

q: オープンソースモデルがクローズドソースモデルとの差を縮めつつあると言う人もいますが、これはクローズドソースモデルの大手企業のビジネスモデルを破壊することになるのでしょうか。

ロビン・リー：この質問は、機能や効果に加えて、効率性の点でもオープンソースモデルは良くない、と先ほど述べた質問と大きく関連しています。正確に言うと、クローズドソースモデルは、無数のユーザーまたは顧客が同じリソースを共有し、研究開発コスト、マシンリソース、および推論リソースを共有するモデルです。gpu。オープンソースモデルでは、一連のものを自分でデプロイする必要があります。デプロイ後の gpu の使用率はどのくらいですか?私たちのウェンシン大型モデル3.5、4.0 に関係なく、使用率は 90% を超えています。展開しているオープンソースモデルを使用している人は何人いますか? wenxin モデルは 1 日に 6 億回以上呼び出され、毎日生成されるトークンの数は 1 兆を超えると一般に伝えていますが、1 日に何回呼び出し、生成されるトークンの数がわかるのはどのオープンソースモデルですか?誰も使用しない場合、コストはどのように共有されますか?推論のコストは商用モデルとどのように比較できますか?

ビッグモデルの時代以前は、誰もが無料かつ低コストを意味するオープンソースに慣れていました。当時、市販されている商用製品の場合、コンピューターのインストールを購入するなど、バージョンごとに料金を支払う必要がありました。windows や microsoft は多額の費用を請求する必要があるかもしれませんが、linux を実行する場合はこの費用を費やす必要はありません。 linux はオープンソースなので、すべてのプログラマーがコードを確認でき、何か問題があれば、更新後にチェックインできます。全員が火に油を注ぐことで、肩を並べて進歩を続けることができます。巨人の。しかし、これらのことは大規模モデルの時代には当てはまりません。大規模モデルの時代には、gpu がいかに高価であるかがよく話題になります。また、コンピューティング能力が大規模モデルの成功または失敗を決定する重要な要素となります。オープンソースモデルによってコンピューティング能力が得られますか?コンピューティング能力が得られない場合、どうすれば効率的に使用できるでしょうか?オープンソースモデルではこの問題を解決できません。

以前は、コンピューターを購入するときにすでにコンピューティング能力の代金を支払っていましたが、大規模なモデルの推論には当てはまりません。この推論は実際には非常に高価です。したがって、オープンソースの大規模モデルの価値は教育や研究の分野にあります。大規模モデルがどのように機能するかを理解したい場合、ソースコードを知らなければ、間違いなく不利になります。効率性や効果を追求する場合、コストを最安で追求する場合、オープンソースモデルにはメリットがありません。

聞く：aiアプリケーションはどのように進化するのでしょうか?なぜインテリジェンスを重視するのでしょうか？

ロビン・リー: 大きなモデルの開発プロセスは、最初は人が支援し、最後に何かが出来上がったときに最終チェックを通過する必要があります。ok、これは副操縦士の段階であり、その下にあるのがエージェントのさまざまな定義です。最も重要なことは、エージェントにはある程度のレベルがあるということです。自律性、ツールの使用、反省、自己進化などの能力を備え、この程度の自動化がさらに進むと、次のようなさまざまな精神的および肉体的な作業ができる、いわゆるアルワーカーになります。人間であり、仕事のすべての側面を独立して行うことができます。そういう過程もあるはずです。

「インテリジェントエージェントは大規模モデルの最も重要な開発方向である」という判断は、実はコンセンサスではありません。 baidu create カンファレンスでは、agentbuilder、appbuilder、modelbuilder という 3 つの製品をリリースしました。agentbuilder と appbuilder はどちらもエージェントに関するもので、1 つはより強力な機能を備えています。それを説明して、ようやく「これは面白いもので、価値を生むもので、誰もが使いやすいと感じる敷居の低いもので作れる」ということを理解してくれる人も出てきました。それ以来、インテリジェントエージェントの人気は徐々に高まり、多くの人がインテリジェントエージェントの開発の方向性について楽観的になり始めました。しかし、現時点では、インテリジェンスが最も重要な戦略であり、大規模モデルの最も重要な開発方向であると考えているバイドゥのような企業は多くありません。

なぜエージェントをこれほど重視するのでしょうか?なぜなら、インテリジェントエージェントの敷居は確かに非常に低いからです。私たちは昨年、アプリケーションを展開すべきであり、誰もがアプリケーションを作成すべきであると言いました。実際、多くの人が、それをどのように行うか、自分たちにできるかどうかがまだわからないと言っています。この方向性、そしてどのような能力を使用する必要があるか? このシナリオで価値を生み出すには数え切れないほどの不確実性があり、モデルからアプリケーションに移行する方法が誰もわかりません。ただし、エージェントは、モデル上にエージェントを構築するための、非常に直接的で、非常に効率的で、非常に便利な方法を提供します。、これが、wenxin プラットフォーム上で毎週何万もの新しいエージェントが作成される理由です。

エージェントに関しては、すでにトレンドを認識しており、モデル自体の強力な機能に加えて、優れた流通チャネルも備えています。百度のapp、特にbaidu検索は何十億人もの人々使用中、ユーザーは積極的にニーズを私たちに表明し、どのインテリジェントエージェントが彼の質問に適切に答え、ニーズを満たせるかが決まります。これは自然なマッチングプロセスであるため、私たちはこれらの開発者がインテリジェントを配布するのを最大限に支援できます。

レポート/フィードバック

ニュース

ロビン・リーの内部発言が暴露: 大型モデルに関する 3 つの主要な認知的誤解について議論、モデル間のギャップは将来さらに拡大する

導入

私の連絡先情報