ニュース

DeepSeek の暴露: 中国の技術的理想主義のより極端な物語 36Kr 限定 |

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

テキスト | ユリリ
編集者 | 劉京

中国の大手モデルスタートアップ 7 社の中で、DeepSeek は最も有名ではありませんが、予期せぬ形で常に記憶に残ることがあります。

1年前、この驚きは、その背後にある量的プライベートエクイティ大手のHuan Fangが、主要メーカー以外で10,000個のA100チップを予約した唯一の企業であったという事実から来た。1年後、それは同社がA100チップの供給源であったという事実から来た。中国の大型モデルの価格競争。

AI の攻撃が続いた 5 月、DeepSeek は有名になりました。その理由は、同社が DeepSeek V2 と呼ばれるオープンソース モデルをリリースしたためです。これは、前例のない費用対効果を提供します。推論コストは、100 万トークンあたりわずか 1 元に削減され、Llama3 70B、GPT-4 One の約 7 分の 1 です。ターボの70番目。

DeepSeekはたちまち「AI業界の拼多多」と呼ばれるようになったが、ByteDance、Tencent、Baidu、Alibabaなどの大手メーカーもそれに耐えかねて次々と値下げを行った。中国の大型モデルの価格戦争が勃発しようとしている。

この煙と煙は、補助金のためにお金を費やしている多くの大企業とは異なり、DeepSeek が利益を上げているという事実を実際に隠しています。

この背景には、DeepSeek のモデル アーキテクチャにおける全面的な革新があります。まったく新しい MLA (雄牛の新たな潜在的な注意メカニズム) アーキテクチャにより、メモリ使用量が過去に最も一般的に使用されていた MHA アーキテクチャの 5% ~ 13% に削減されます。同時に、独自の DeepSeekMoESparse 構造により計算量も極限まで削減され、これらすべてが最終的にはコストの削減。

シリコンバレーでは、DeepSeekは「東洋から来た神秘の力」と呼ばれています。 SemiAnalysis の主任アナリストは、DeepSeek V2 論文が「今年最高の論文になるかもしれない」と考えています。 元 OpenAI 従業員の Andrew Carr 氏は、この論文を「驚くべき知恵に満ちている」と呼び、そのトレーニング設定を彼自身のモデルに適用しました。 OpenAIの元政策ディレクターでAnthropicの共同創設者であるジャック・クラーク氏は、ディープシークは「予測不可能な魔術師のグループを雇用している」と信じており、中国製の大型モデルは「無視できないドローンや電気自動車と同じくらい重要になるだろう」と考えている。強さ。"

これは、シリコンバレーが基本的にストーリーを推進しているAIの波においては珍しい状況です。多くの業界関係者が私たちにこう語った。この大きな反響は、アーキテクチャレベルでのイノベーションに由来しており、これは国内の大手モデル会社や世界のオープンソースベースの大型モデルでも珍しい試みです。 AI研究者によると、アテンションアーキテクチャは長年にわたって提案されてきたが、大規模な検証はおろか、修正に成功した例はほとんどないという。 「ほとんどの人が自信を持っていないため、それは意思決定から除外されるアイデアですらあります。」

一方で、国産の大型モデルは、これまで建築レベルでのイノベーションにほとんど関与してこなかった。これは、そのような固定観念を打ち破る率先力を持つ人がほとんどいなかったためでもある。米国は0から1までの技術革新に優れており、中国は1から10までのアプリケーション革新に優れています。さらに、この種の行動は非常に不経済です。新世代のモデルは数か月以内に誰かによって自然に生産され、中国企業はそれをフォローしてうまく適用するだけで済みます。モデル構造を革新するということは、たどるべき道がなく、多くの失敗を経験する必要があり、時間と経済的コストが膨大になることを意味します。

DeepSeek は明らかに反逆者です。大型モデルの技術は必然的に収束し、それに従うことがより賢い近道であるという喧騒の中で、DeepSeekは「回り道」で蓄積された価値を重視しており、アプリケーションの革新に加えて、中国の大型モデルの起業家も世界的な技術革新に参加できると信じています。激流。

DeepSeek の選択肢の多くはユニークです。現時点で、中国の大型モデルスタートアップ7社の中で、「ニーズ&ウォント」路線を諦め、toC申請を行わずに研究と技術に注力している唯一の企業でもある。商業化を十分に考慮しておらず、オープンソースルートで資金調達さえしていない企業もあります。これらにより、ポーカー テーブルの外では忘れ去られることがよくありますが、その一方で、コミュニティ内のユーザーによって「水道水」のように広められることもよくあります。

DeepSeekはどのように作られているのでしょうか?この目的のために、私たちはめったに登場しないDeepSeekの創設者であるLiang Wenfengにインタビューしました。

80 年代以降のこの創設者は、Magic Square の時代から舞台裏でテクノロジーを研究してきたが、他の研究者と同様に、「論文を読み、コードを書き、グループ ディスカッションに参加する」という控えめなスタイルを今でも続けています。毎日。

海外のヘッジファンドでの経験があり、主に物理学や数学などを専攻していたクオンツファンドの創設者の多くとは異なり、梁文峰氏は常に地元出身で、初期の頃は浙江大学の電子工学科で人工知能を研究していた。 。

多くの業界関係者やDeepSeek研究者らは、梁文峰氏は「強力なインフラエンジニアリング能力とモデル研究能力を併せ持ち、リソースを動員できる」「高所から正確な判断ができる」という、現在の中国AI業界では非常に稀有な人材であると語った。 「細かい点では第一線の研究者よりも優れている」人で、「恐ろしい学習能力」を持っていて、同時に「上司らしくない、むしろオタクっぽい」人です。

特に珍しいインタビューです。インタビューの中で、この技術的理想主義者は、中国の科学技術界では特に稀少な発言を行った。彼は「利害観」よりも「善悪観」を優先させ、時代の惰性を思い出させ、「独自の革新」を課題に掲げる数少ない人物の一人である。

1 年前、DeepSeek が終了したばかりのとき、私たちは「Crazy Magic Square: The Road to Large Models of an Invisible AI Giant」で初めて Liang Wenfeng にインタビューしました。あの時あの一言を言ったら「めちゃくちゃ野心的でなくてはなりませんが、同時にめちゃくちゃ誠実でなければなりません。」これは今でも美しいスローガンですが、1 年後、それは行動になりました。

以下は会話の一部です。

価格戦争の第一弾はどのようにして始まったのでしょうか?

「底流」: DeepSeek V2 モデルのリリース後、すぐに血みどろの大型モデルの価格戦争が始まりました。あなたは業界のナマズだと言う人もいました。

リャン・ウェンフェン:私たちはナマズになるつもりはなかった、たまたまナマズになっただけだ。

「Undercurrent」: この結果は驚きましたか?

リャン・ウェンフェン :とても予想外でした。価格のせいで誰もがこれほど敏感になるとは思いませんでした。私たちは自分たちのペースで物事を進め、原価計算を行っているだけです。私たちの原則は、金銭を提供したり、莫大な利益を上げることではありません。この価格も原価より少しお得です。

「底流」:Zhipu AIが5日後に追跡調査を行い、Byte、Alibaba、Baidu、Tencentなどの大手企業が続いた。

リャン・ウェンフェン :Zhipu AIはエントリーレベルの製品であり、当社と同レベルのモデルはまだ非常に高価です。 Byte は本当に最初にフォローしました。主力モデルが当社と同じ価格まで下落したことをきっかけに、他の大手メーカーも値下げを始めました。大手メーカーのモデルは当社のモデルよりもはるかに高いため、これで誰かが損をするだろうとは予想していませんでしたが、最終的にはインターネット時代のお金を燃やす補助金の論理になりました。

「底流」: 外部から見ると、値下げはユーザーを掴もうとしているように見えますが、これはインターネット時代の価格競争によく見られることです。

リャン・ウェンフェン : ユーザーを獲得することが私たちの主な目的ではありません。価格を下げたのは、次世代モデルの構造を模索しているため、コストが下がってきたからです。一方で、API と AI はどちらも普遍的で誰にとっても手頃なものでなければならないと考えています。

「Undercurrent」: 以前は、ほとんどの中国企業がこの世代の Llama 構造を直接コピーして適用していました。なぜモデル構造から始めたのですか?

リャン・ウェンフェン : アプリケーションを作成することが目的の場合は、Llama 構造と短くフラットで高速な製品を使用することも合理的な選択です。しかし、私たちの目的地は AGI です。つまり、限られたリソースの下でより強力なモデル機能を実現するには、新しいモデル構造を研究する必要があります。これは、より大きなモデルにスケールアップするために必要な基本的なスタディの 1 つです。モデルの構造に加えて、データをどのように構造化するか、モデルを人間に近づける方法など、その他にも多くの研究を行い、それらはすべてリリースされたモデルに反映されています。さらに、Llama の構造は、トレーニング効率と推論コストの点で、海外の上級レベルに比べて 2 世代遅れていると推定されています。

「底流」: この世代間のギャップは主にどこから来るのでしょうか?

リャン・ウェンフェン :まず、トレーニング効率に差があります。国内の最良のモデルと海外の最良のモデルでは、モデルの構造とトレーニングのダイナミクスが 2 倍異なる可能性があると推定されており、これだけでも、同じ効果を達成するには 2 倍の計算能力を消費する必要があります。さらに、データ効率に 2 倍の差が生じる可能性があります。これは、同じ効果を達成するには 2 倍のトレーニング データと計算能力を消費する必要があることを意味します。合計すると、4 倍の計算能力を消費します。私たちがしなければならないのは、これらのギャップを縮め続けることです。

「底流」: ほとんどの中国企業がモデルとアプリケーションの両方を選択するのはなぜですか?

リャン・ウェンフェン :今最も重要なことは、世界的なイノベーションの波に参加することだと感じているからです。過去何年にもわたって、中国企業は他者が技術革新を起こすことに慣れており、私たちはそれを利用してアプリケーションを収益化していますが、これは当然のことではありません。この波の中で、私たちの出発点は、富を築く機会を利用することではなく、テクノロジーの最前線に立ち、エコシステム全体の発展を促進することです。

「底流」: インターネットとモバイル インターネット時代にほとんどの人に残された慣性認識は、米国が技術革新に優れ、中国がアプリケーションに優れているというものです。

リャン・ウェンフェン: 私たちは、経済発展とともに、中国も常にただ乗りするのではなく、徐々に貢献者にならなければならない。過去30年ほどのITの波の中で、私たちは基本的に本当の技術革新に参加してこなかった。私たちはムーアの法則が空から降ってくることに慣れており、自宅でわずか 18 か月後にはより優れたハードウェアとソフトウェアが登場します。 スケーリング則もこのように扱われます。

しかし実際には、これは西側主導のテクノロジーコミュニティが何世代にもわたって精力的に取り組んできたものであり、単に私たちが以前にこのプロセスに参加していなかったために、その存在を無視していました。

本当のギャップは1年や2年ではなく、オリジナリティと模倣の違いです

「アンダーカレント」: なぜ DeepSeek V2 はシリコンバレーの多くの人々を驚かせるのでしょうか?

リャン・ウェンフェン : 米国で毎日起こっている数多くのイノベーションの中でも、これは非常に一般的なものです。彼らが驚いた理由は、これは中国の企業だったということです。革新的な貢献者として彼らのゲームに参加してください。結局のところ、ほとんどの中国企業は革新するよりも後追いすることに慣れているのだ。

「Undercurrent」:しかし、中国の文脈では、この選択はあまりにも贅沢すぎます。ビッグモデルは多額の投資が必要なゲームであり、すべての企業が最初に商業化を考慮せずにイノベーションを研究するだけの資本を持っているわけではありません。

リャン・ウェンフェン : イノベーションのコストは決して低くはなく、過去の流用主義の惰性は過去の国情にも関係しています。しかし今、中国の経済規模を見ても、バイトやテンセントといった大手企業の利益を見ても、世界的に見ても低いわけではない。イノベーションにおいて私たちに欠けているのは間違いなく資本ではなく、自信の欠如と、効果的なイノベーションを達成するために高密度の人材を組織する方法を知らないことです。

「底流」:資金に余裕のない大企業を含めた中国企業は、なぜ迅速な事業化を最優先に考えるのか。

リャン・ウェンフェン :過去30年間、私たちは金儲けだけを重視し、イノベーションを無視してきました。イノベーションは完全にビジネスによって推進されるわけではなく、好奇心と創造性も必要とします。私たちは過去の惰性に縛られているだけですが、それも一つの段階です。

「アンダーカレント」: しかし、結局のところ、あなたは公共の福祉科学研究機関ではなく、商業組織です。オープンソースを通じて革新し、共有することを選択します。どこに堀を形成する必要がありますか? 5 月に発表された MLA アーキテクチャのようなイノベーションは、すぐに他の企業にコピーされるでしょう?

リャン・ウェンフェン:存在する破壊的テクノロジーに直面すると、クローズドソースによって形成された堀は長続きしません。 OpenAI がクローズドソースであっても、他のものに追い越されることを防ぐことはできません。したがって、私たちはチームに価値を置き、その過程で仲間が成長し、多くのノウハウを蓄積し、イノベーションを起こすことができる組織と文化を形成します。これが私たちの堀です。

実際、オープンソースや論文の出版によって失われるものは何もありません。技術スタッフにとって、フォローされることは大きな達成感をもたらします。実際、オープンソースは商業的行動というよりも文化的行動に似ています。寄付することは実際には特別な名誉です。これを行う企業には文化的な魅力もあるでしょう。

「底流」:朱暁湖のような市場信者についてどう思いますか?

リャン・ウェンフェン: 朱暁湖は一貫性を持っていますが、彼のプレイスタイルはより早く金を稼ぐ企業に適しています。そして、米国で最も利益を上げている企業を見てみると、それらはすべて深い蓄積を備えたハイテク企業です。

「アンダーカレント」:しかし、大型モデルとなると、技術でリードするだけでは絶対的な優位性を形成することは困難です。それよりも大きな賭けは何ですか?

リャン・ウェンフェン私たちが目にしているのは、中国のAIが常に追従する立場にあるわけではないということです。中国のAIと米国の間には1年か2年のギャップがあるとよく言われますが、本当のギャップは独創性と模倣の違いです。これが変わらなければ、中国は常に追随することになるため、ある程度の探求は避けられない。

NVIDIA のリーダーシップは、単なる一企業の努力によるものではなく、西側のテクノロジー コミュニティと業界全体の共同の努力の結果です。彼らは次世代のテクノロジーのトレンドを理解し、ロードマップを手に入れることができます。中国におけるAIの発展にもこのようなエコシステムが必要です。多くの国内チップは、サポートする技術コミュニティの欠如と受け売りの情報だけのために開発できません。したがって、中国には技術の最前線に立つ人が必要です。

投資が増えてもイノベーションが増えるとは限らない

「底流」: 現在の DeepSeek には、OpenAI の初期の頃からある種の理想主義的な気質があり、オープンソースでもあります。将来的にはクローズドソースを選択しますか? OpenAI と Mistral はどちらも、オープンソースからクローズドソースへ移行するプロセスを経ています。

リャン・ウェンフェン : ソースは閉じません。私たちは、まず強力な技術エコシステムを構築することがより重要であると考えています。

「アンダーカレント」: 資金計画はありますか?メディアの報道によると、HuanfangはDeepSeekを独立させて上場する計画を立てており、シリコンバレーのAIスタートアップは最終的には大手メーカーに束縛されることは避けられないという。

リャン・ウェンフェン: 短期的な資金調達計画はありません。私たちが直面している問題は決してお金ではなく、ハイエンドチップの禁輸です。

「底流」: AGI の実行と定量化の実行はまったく別のことであると多くの人が信じています。定量化は静かに実行できますが、AGI にはより高レベルの取り組みと提携が必要になる可能性があり、そのために投資が増加する可能性があります。

リャン・ウェンフェン :より多くの投資がより多くのイノベーションを生み出すとは限りません。そうしないと、大手メーカーがすべてのイノベーションを引き継いでしまう可能性があります。

「アンダーカレント」:今はアプリケーションを作らないのは、動作する遺伝子がないからですか?

リャン・ウェンフェン :現段階はアプリケーションの爆発期ではなく、技術革新の爆発期だと考えています。長期的には、業界が当社のテクノロジーと成果物を直接使用するエコシステムを形成したいと考えています。当社は基本的なモデルと最先端のイノベーションのみを担当し、その後は他の企業が DeepSeek をベースに toB および toC ビジネスを構築します。川上と川下の完全な産業が形成できれば、自分たちでアプリケーションを作る必要はありません。もちろん、必要に応じて適用することには何の支障もありませんが、研究と技術革新は常に最優先事項です。

「Undercurrent」: しかし、API を選択するとき、なぜ大手メーカーではなく DeepSeek を選択するのでしょうか?

リャン・ウェンフェン:将来の世界は、専門分業の世界になる可能性が高く、基本的な大規模モデルには継続的な革新が必要であり、必ずしも適切ではない可能性があります。

「底流」: しかし、テクノロジーによって本当に格差が広がるのでしょうか? あなたはまた、絶対的な技術的秘密は存在しないとも言いました。

リャン・ウェンフェン :技術に秘密はありませんが、リセットには時間とコストがかかります。理論的には、NVIDIA のグラフィックス カードには技術的な秘密がなく、簡単にコピーできますが、チームを再編成して次世代技術に追いつくには時間がかかるため、実際の外堀は依然として非常に広いです。

「底流」:価格を引き下げた後、Byte が最初にフォローアップしました。これは、彼らが依然として何らかの脅威を感じていることを示しています。スタートアップが大企業と競争するための新しいソリューションについてどう思いますか?

リャン・ウェンフェン :正直に言うと、私たちはこの件についてはあまり気にしておらず、たまたまやっただけです。クラウド サービスを提供することが私たちの主な目標ではありません。私たちの目標は依然として AGI を達成することです。

これまでのところ新しいソリューションは見当たりませんが、大手メーカーにも明確な利点があるわけではありません。大手メーカーには既成のユーザーがいますが、キャッシュフロー事業も負担となっており、いつでも破壊されやすい状態にあります。

「Undercurrent」: DeepSeek 以外の 6 つの大型モデルのスタートアップの結果についてどう思いますか?

リャン・ウェンフェン : たぶん2、3家族は生き残るでしょう。私たちはまだお金を燃やす段階にあるため、明確な自己ポジショニングとより洗練されたオペレーションを持っている人は生き残る可能性が高くなります。他の企業も再発明されるかもしれない。価値のあるものは消えることはありませんが、変化します。

「底流」:魔方陣の時代、競争に臨む姿勢は「我が道を行く」と評価され、横の比較はほとんど意識されなかった。競争に関して、あなたの考え方の出発点は何ですか?

リャン・ウェンフェン :よく考えるのは、社会を効率化できるものなのか、その産業分業チェーンの中で自分が得意なポジションを見つけられるのかということです。最終結果が社会の効率化である限り、それは有効です。その間には多くの段階があり、過度に注意を払うと必然的にめまいが起こります。

「とんでもない」ことをする若者たちの集団

「底流」: OpenAI の元ポリシー ディレクターであり、Anthropic の共同創設者であるジャック クラーク氏は、DeepSeek が「予測不可能な魔術師のグループ」を雇用したと考えています。

リャン・ウェンフェン: 謎の天才はいません。彼らは一流大学を卒業したばかりの者、博士号 4 と 5 を取得したまだ卒業していないインターン、そして卒業して数年しか経っていない若者たちです。

「底流」: 多くの大手モデル企業が海外で人材の引き抜きに執拗に取り組んでおり、この分野のトップ 50 の人材は中国企業ではないのではないかと考えています。

リャン・ウェンフェン :V2モデルには海外から帰国した人は一人もおらず、全員が現地人です。上位 50 人の人材は中国にいないかもしれませんが、そのような人材を自分たちで育成できるかもしれません。

「底流」: この MLA イノベーションはどのようにして起こったのでしょうか?最初は若手研究者の個人的な興味からこのアイデアが生まれたと聞きましたが?

リャン・ウェンフェン : アテンション アーキテクチャの主流の変更をいくつかまとめた後、彼は突然代替案を設計したいと考えました。ただし、アイデアから実装までには長いプロセスがかかります。私たちはこのためにチームを結成しましたが、この問題を解決するのに数か月かかりました。

「Undercurrent」: この多様なインスピレーションの誕生は、完全に革新的な組織の構造と密接に関係しています。魔方陣の時代には、上から下まで目標やタスクを割り当てることはほとんどありませんでした。しかし、不確実性に満ちたフロンティア探索である AGI には、さらなる管理措置が必要なのでしょうか?

リャン・ウェンフェン :DeepSeekもすべてボトムアップです。さらに、私たちは通常、事前に分業を行うのではなく、自然な分業を行います。誰もが独自の成長経験を持ち、独自のアイデアを持っているので、それを押し付ける必要はありません。探索の過程で問題に遭遇すると、彼は他の人を招待して議論します。しかし、アイデアに可能性がある場合は、上から下にリソースを割り当てます。

「Undercurrent」: DeepSeek はカードと人の動員において非常に柔軟だと聞きました。

リャン・ウェンフェン : 私たち一人ひとりには、カードや人の譲渡に上限はありません。アイデアがあれば、誰でも承認なしでいつでもトレーニング クラスターのカードを呼び出すことができます。同時に、階層や部門を超えないため、相手も興味を持っていれば誰でも柔軟に呼び出すことができます。

「底流」:緩やかな運営方法も、強い愛に突き動かされる人々のグループを選択することにかかっています。細やかな人材採用が得意で、従来とは異なる評価指標で優秀な人材を選抜できると聞きました。

リャン・ウェンフェン :人を選ぶ基準は常に愛情と好奇心なので、多くの人がユニークな経験をしており、非常に興味深いです。多くの人はお金のことよりもはるかに研究をしたいと考えています。

「Undercurrent」: Transformer は Google の AI Lab で生まれ、ChatGPT は OpenAI で生まれました。大企業の AILab とスタートアップ企業のイノベーションの価値の違いは何だと思いますか。

リャン・ウェンフェン :Google Labsであろうと、OpenAIであろうと、あるいは中国の大手企業のAI Labsであっても、それらはすべて価値があります。最終的には OpenAI がそれを成功させましたが、これは歴史的な事故でもありました。

「底流」: イノベーションはほとんどが偶然なのでしょうか?あなたのオフィスエリアの中央に並んでいる会議室には、左右に自由に押して開けることができるドアがあるようですね。あなたの同僚は、これは偶然の余地を残すためだと言いました。 トランスの誕生には、偶然通りかかった人々がそれを聞きつけて参加し、やがて普遍的な枠組みになったという物語があります。

リャン・ウェンフェン :イノベーションとはまず信念の問題だと思います。なぜシリコンバレーはこれほど革新的なのでしょうか? 1つ目は、あえてすることです。 Chatgpt が登場したとき、投資家から大手製造業者に至るまで、国全体が最先端のイノベーションに対する自信を欠いており、その差は大きすぎるので、とにかく申請すべきだと感じていました。しかし、イノベーションにはまず自信が必要です。この自信は通常、若い人ほど顕著です。

「アンダーカレント」: しかし、あなたは資金調達に参加しておらず、外部の世界に対してほとんど発言しません。そして、あなたの社会的発言力は、資金調達に積極的に取り組んでいる企業ほど優れていません。どうすれば、DeepSeek が最初の選択肢であることを保証できますか。大きなモデルを作りたい人?

リャン・ウェンフェン:一番難しいことをやっているからです。優秀な人材を最も惹きつけるのは、間違いなく世界で最も困難な問題を解決することです。実際、中国では優秀な人材が過小評価されている。社会全体のレベルで本格的なイノベーションが少なすぎるため、それらが特定される機会がありません。私たちは最も難しいことをやっているのですが、それが彼らにとって魅力的です。

「アンダーカレント」: 少し前の OpenAI のリリースは GPT5 を待たずに行われました。多くの人がテクノロジーの曲線が明らかに減速していると考えており、多くの人がスケーリングの法則に疑問を抱き始めています。どう思いますか?

リャン・ウェンフェン :私たちは楽観的であり、業界全体が期待どおりに進んでいるように見えます。 OpenAI は神ではないため、常に最前線に立つことはできません。

「Undercurrent」: AGI が実現されるまでにどれくらい時間がかかると思いますか? DeepSeek V2 をリリースする前に、コード生成と数学モデルをリリースし、高密度モデルから MOE に切り替えました。それでは、AGI のロードマップはどのような計画になりますか?

リャン・ウェンフェン :2年後かもしれないし、5年後かもしれないし、10年後かもしれない。つまり、私たちが生きているうちに実現するでしょう。ロードマップについては社内でも合意ができていない。しかし、私たちは 3 つの方向に賭けました。 1 つは数学とコード、2 つ目はマルチモーダリティ、3 つ目は自然​​言語そのものです。数学とコードは AGI の自然なテストの場であり、囲碁に似ています。これは閉鎖的で検証可能なシステムであり、自己学習を通じて高い知能を達成することが可能です。一方で、現実世界の人間を巻き込んだマルチモーダル学習もAGIには必要かもしれない。私たちはあらゆる可能性を受け入れます。

「アンダーカレント」:大きなモデルの結末はどうなると思いますか?

リャン・ウェンフェン :基本的なモデルや基本的なサービスを提供する専門会社が存在し、専門的な分業の長い連鎖が存在することになります。より多くの人が社会全体の多様なニーズに応えることができます。

すべてのルーチンは前世代の製品です

「底流」:昨年初めに活躍していた王恵文氏が途中で退社し、その後入社した企業も、この1年で多くの変化があった。差別化を示し始めた。

リャン・ウェンフェン : 王恵文はすべての損失を自分で負い、他の人たちを無傷で逃がしました。自分にとっては一番不利だけど、みんなにとっては最善の選択をしたので、とても優しい人で、とても尊敬しています。

「Undercurrent」: あなたは今、どこに最もエネルギーを注いでいますか?

リャン・ウェンフェン :主に次世代の大型モデルの研究に重点を置いています。まだ答えのない疑問がたくさんあります。

「アンダーカレント」: 他のいくつかの大手モデルのスタートアップは、結局のところ、テクノロジーが永続的なリーダーシップをもたらすことはなく、DeepSeek があえてモデルの研究に注力することも重要です。モデルの能力が足りないから?

リャン・ウェンフェン : すべてのルーチンは前世代の産物であり、将来的には当てはまらない可能性があります。馬化騰氏がビジネスを始めたときにゼネラル・エレクトリック社とコカ・コーラ社について議論したのと同じように、インターネットのビジネス ロジックを使用して AI の将来の収益モデルを議論します。刀を求めて舟を彫るようなものであろう。

「底流」:かつて、Huanfangには強力なテクノロジーとイノベーションの遺伝子があり、その成長は比較的スムーズであったため、あなたは楽観的ですか?

リャン・ウェンフェン :Magic Square はテクノロジー主導のイノベーションに対する私たちの自信をある程度高めてくれましたが、それは必ずしも平坦な道ではありません。私たちは長い蓄積のプロセスを経てきました。外から見えるのは2015年以降の魔方陣の部分ですが、実は16年もやってるんです。

「Undercurrent」: 本来のイノベーションの話題に戻ります。経済が低迷し、資本が冷え込みに入った今、本来のイノベーションにさらなる制約がもたらされるのだろうか?

リャン・ウェンフェン : 私はそうは思わない。中国の産業構造の調整は、よりコア技術の革新に依存することになるだろう。多くの人が、過去に手っ取り早くお金を稼いだのはおそらく時代の幸運によるものだったと発見すると、より喜んで身を乗り出して真のイノベーションを行うようになるでしょう。

「アンダーカレント」:では、あなたもこの件については楽観的ですか?

リャン・ウェンフェン :私は 1980 年代に広東省の 5 級都市で育ちました。私の父は小学校の教師でした。当時、広東省にはお金を稼ぐチャンスがたくさんありました。彼らのほとんどは勉強は無駄だと考えていました。しかし、今振り返ると考え方が変わりました。お金を稼ぐのが難しいので、タクシーを運転する機会さえないかもしれません。それは一世代で変わります。

将来的には、より多くのハードコアなイノベーションが起こるでしょう。社会集団全体が事実について教育される必要があるため、今はそれを理解するのは簡単ではないかもしれません。この社会が筋金入りの革新的な人々が成功することを可能にすると、集団の考え方も変化するでしょう。必要なのは、大量の事実とプロセスだけです。