ニュース

OpenAI は、Yao クラスのトップの学生である Yao Shunyu について言及するのが好きです。彼は Thinking Tree の著者であり、プリンストン大学で博士号を取得し、ラップの仕方も知っています。

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

ジン レイの西風はアオフェイ寺院から発生します
パブリックアカウント QbitAI

清華大学八尾クラスのトップの学生ヤオ・シュンユウ、OpenAIに参加したことを正式に発表しました。



しかし、このような短いメッセージがサークルの全員の注目と祝福を集めました。ぜひこの感情を感じてみてください。



その中には、OpenAIの最先端研究ディレクターやアメリカのIOIコーチなどが多数含まれている。マーク・チェン、AI分野の教授、投資家なども含まれます。

では、なぜ姚舜宇はこれほど注目を集めているのでしょうか?

彼の過去の履歴書から判断すると、次のようなキーワードが抽出できます。

  • 清華大学八尾クラス
  • 八尾学級合同委員会委員長
  • 清華大学学生ラップクラブの共同創設者
  • プリンストン大学でコンピューターサイエンスの博士号を取得



△姚舜宇、写真出典:個人ホームページ

しかし、彼の比較的輝かしい経歴に加えて、姚舜宇を本当に世間の注目を集めたのは、彼の多くの科学研究の成果です。

  • 思考の木(思考の木): LLM に繰り返し考えさせ、推論能力を大幅に向上させます。
  • SWEベンチ: 大規模なモデル機能評価データセット。
  • SWEエージェント:オープンソースのAIプログラマー。

ほぼすべての研究がこのサークルに大きな波紋を引き起こしていると言っても過言ではなく、それらがすべて深く関わっていることは明らかです。大型モデルそして展開します。



これは、姚舜宇氏の公式発表の一文とも一致するかもしれない。

研究のビジョンを現実にする時が来ました。

この「研究ビジョン」については、引き続き詳しく見ていきましょう。

研究キーワード:言語エージェント

姚舜宇のホームページ、特に論文研究コーナーを見ると、頻繁に登場するフレーズを見つけるのは難しくない——言語エージェント



彼の X ホームページに掲載されているプロフィールでも、最初の文は言語エージェントです。



そしてこれは彼の博士論文のタイトルでもあります。言語エージェント: 次世代トークン予測からデジタル自動化まで



言語エージェント、つまり言語エージェント、新しいタイプのエージェントを提案したのはヤオ・シュンユウでした。

従来のエージェントとは異なり、この手法ではエージェントの推論と行動に言語モデルを使用し、エージェントに認識させることに重点を置いています。デジタルオートメーション(デジタルオートメーション)。

具体的な実装方法としては、次の 3 つの主要なテクノロジ (すべて独立した論文あり) があります。

  • 反応する: 推論とアクションを組み合わせて、言語モデルを通じて推論の軌跡とアクションを生成し、さまざまな言語推論と意思決定タスクを解決する方法。
  • 思考の木: 複数の思考パスを生成および評価することで、複雑な問題を解決し、言語モデルの推論能力を向上させる、ツリー検索に基づく手法。
  • コアラ: 記憶、行動空間、意思決定などの側面を含む、言語エージェントを組織および設計するための概念的なフレームワーク。



ReActを例に挙げると、言語モデルのアクション空間をアクションセットと言語空間の和集合に拡張する研究です。

言語空間でのアクション (つまり、思考や推論の軌跡) は外部環境に影響を与えませんが、現在のコンテキストに関する推論を通じてコン​​テキストを更新し、将来の推論やアクションをサポートできます。

たとえば、次の図に示すダイアログでは、ReAct メソッドを使用して、エージェントが「アイデアの生成 → 行動の実行 → 結果の観察」というプロセスを循環するようにガイドできます。

このようにして、推論の軌跡と操作を組み合わせることができ、モデルが動的な推論を実行できるようになり、エージェントの意思決定と最終結果が向上します。



ReAct メソッドを要約すると、エージェントに「行動する理由」、次の方法は思考の木、その後、焦点はエージェントに「計画する理由」



思考ツリーは、問題をツリー構造上の探索として表現します。各ノードは部分的な解決策を表す状態であり、分岐は状態を変更する操作に対応します。

これには主に次の 4 つの問題が含まれます。

  • 思考分解: 複雑な問題を一連の中間ステップに分解します。各ステップはツリーのノードとみなすことができます。
  • 思考の生成: 言語モデルを使用して、問題を解決するための中間ステップまたは戦略である各ノードの潜在的な思考を生成します。
  • ステータス評価: 言語モデルを使用して各ノードのステータスを評価し、問題解決における進捗状況と可能性を判断します。
  • 検索アルゴリズム: さまざまな検索アルゴリズム (幅優先検索 BFS や深さ優先検索 DFS など) を使用して思考ツリーを探索し、最適なソリューションを見つけます。



思考ツリーを「24点」ゲームに適用すると、従来の思考連鎖(CoT)と比べて正解率が大幅に向上しました。



言語エージェントの最後の主要なテクノロジーについては、コアラは、言語エージェントを編成および設計するための概念的なフレームワークです。



以下の構造図から判断すると、情報保存、行動空間、意思決定の3つのモジュールに大別されます。

情報保存とは、言語エージェントが短期作業記憶と長期記憶 (意味記憶、エピソード記憶、手続き記憶など) を含む複数の記憶モジュールに情報を保存することを意味します。

これらのメモリ モジュールは、感覚入力、知識、経験などのさまざまな種類の情報を保存するために使用され、エージェントの意思決定プロセスにおいて役割を果たします。

さらに、CoALA はエージェントのアクション空間を外部アクションと内部アクションに分割します。外部アクションには、ロボットの制御、人間との通信、デジタル環境での操作の実行など、外部環境との相互作用が含まれます。

内部アクションは、推論、検索、学習などの操作を含む、エージェントの内部状態と記憶と相互作用します。

最終的に、言語エージェントは意思決定プロセスを通じて実行するアクションを選択し、このプロセスでもさまざまな要因とフィードバックに基づいて最適な解決策を見つけます。



さらに、オープンソースAIプログラマーのような仕事もありますSWEエージェントなどサークル内でも広く浸透しています。

しかし、姚舜宇の多くの科学研究トピックからは、言語エージェントに加えて、彼が追求するもう一つのキーワードも見えてきます——計算的思考

実はこれは彼が大学生の時に発覚した。

コンピューターサイエンスの博士号取得のためプリンストン大学に進学する前に、2015年4年生の姚舜宇氏は、清華大学の2019年各種自主選抜試験の開会式で、清華大学での学習と成長の経験を再受験者たちと共有した。 -試験。

関連する内容は、彼が書いた「清華大学の姚クラスで何を学んだのか?姚舜宇: 世界を変えるのに十分だ」というタイトルの記事に記録されています。

当時、彼は理論と実践の両面から計算的思考を共有することに重点を置き、4 年を経て次のように感じたと明かしました。最大の成果は計算的思考です

私たちは今、理論的には不可能なことをたくさん目にしています。いわゆる理論が実践を導くというよりも、システムの能力の限界や物事の難しさを高いレベルで理解した上で、何ができるのか、何が意味があるのか​​を選択することが重要だと思います。

晴れやかで陽気な少年のタグに閉じ込められた姚舜宇も、清華南部浸透プログラムのためにアルゼンチンに行った経験を次のように語った。

アルゼンチンの子供たちのグループに会いました...英語は世界共通ではなく、アルゼンチン人はスペイン語を話します。私はかつてスペイン語を学ぼうとしたことがありますが、コンピュータの勉強をしていたため、Google翻訳を引っ張り出し断念しました。私は彼らに北京の紫禁城や万里の長城について話しました。



△出典:清華大学入学公式アカウント

同氏の見解では、今の時代、コンピューティングはあらゆる分野と組み合わせることができ、世界は広く、清華ではやりたいことが何でもできるという。

ヤオ・シュンユウについて話した後、ヤオ・​​クラスで大型モデルに取り組んでいる人は他にいますか?

人気のビッグモデル、八尾クラスでは他に誰が手掛けているのでしょうか?

私が言及しなければならないことは、馬天宇そしてチェン・ダンチー





2人は当時の同級生で、2008年に清華ヤオクラスの卒業生で、後に「ノーベル賞トレンドベーン」として知られるスローン賞を受賞した。



馬騰宇博士はプリンストン大学で学び、そこでの指導者は理論コンピュータ科学者でゲーデル賞を 2 回受賞したサンジーブ・アローラ教授でした。

博士課程を卒業すると、MIT、ハーバード大学、スタンフォード大学などのトップ大学がこぞって助教授としてのオファーを出し、馬天宇氏は最終的にスタンフォード大学を選んだ。

昨年末、馬天宇氏は大規模なモデルスタートアップ企業であるVoyage AIの設立を正式に発表し、チームを率いて現時点で最高の組み込みモデルを構築し、カスタマイズされたモデルも提供することを明らかにした。特定の分野や企業。

スタンフォード人工知能研究所の所長であるクリストファー・マニング氏と、AI分野で著名な中国学者であるリー・フェイフェイ氏を含む3人の教授がVoyage AIの学術顧問を務めている。



Chen Danqi 氏の場合、清華大学 Yao Ban で学部課程を修了した後、2018 年にスタンフォード大学で NLP に焦点を当てて博士号を取得し、最終的にはプリンストン大学コンピューター サイエンス学部の助教授およびプリンストン言語学部の副所長になりました。プリンストン NLP グループを共同主導するインテリジェンス プロジェクト。

彼の個人のホームページには、「最近は主に大型モデルの開発に興味を持っています」と記載されており、彼が研究しているテーマは次のとおりです。

  • 次世代モデルでは検索がどのように重要な役割を果たし、現実性、適応性、解釈可能性、信頼性を向上させることができるか。
  • 大規模モデルの低コストのトレーニングとデプロイメント、改善されたトレーニング方法、データ管理、モデル圧縮、下流タスク適応の最適化。
  • また、現在の大規模モデルの機能と限界について、経験的にも理論的にも理解を深める研究にも興味があります。



Chen Danqi 氏のチームの大規模モデル作業と量子ビットにも引き続き注目が集まっています。

たとえば、大規模モデル向けに提案されているコスト削減方法であるデータ選択アルゴリズム LESS は、命令の微調整タスクに最も関連するデータの 5% のみを選択します。これは、データ セット全体を使用するよりも優れています。

命令の微調整は、基本モデルを ChatGPT アシスタント モデルにするための重要なステップです。

人気の「アルパカ シャーリング」手法 - LLM-Shearing ラージ モデル プルーニング手法を提案しました。これは、SOTA を取得するのに計算量の 3% とコストの 5% のみを使用し、オープンソースのラージ モデルの 1B ~ 3B 規模を支配しています。

この二人の他にも、産学界で大型模型に携わる八尾教室の卒業生が多数います。

インターネット上で話題となったビッグモデルのネイティブアプリが「完成しました!」 「大きなモデルに囲まれて」とその続編「大きなモデルを壊してみた」は、八尾クラスの成績優秀者を中心としたチームによって開発されました。

ゲーム作者ファン・ハオ強 , メグヴィ社員No.6。当時、IOI金メダル獲得、清華ヤオクラスへの推薦、高校2年生でインターンに参加するなどの伝説的な功績から天才少年と称賛されていた。現在、彼は Megvii Technology の研究部長であり、Google Scholar h-index 32 の業界リーダーです。



マスク氏の xAI の最初の研究成果である Tensor Programs VI には、共同研究に Yao クラスの卒業生も含まれています。



Tensor Programs VI は、xAI の創設メンバーであり Qiu Chengtong の弟子である Greg Yang による以前の Tensor Programs シリーズの継続であり、この論文は「無限に深いネットワークを訓練する方法」に焦点を当てています。

GPT-4にはTensorプログラム関連の成果が応用されていると言われています。ヤン氏自身も論文を解釈するため、Xで生放送を行った。

共に働くディンリ・ユ, Dingli Yu は、清華大学のヤオ クラスを卒業し、学士号を取得しています。現在、プリンストン大学のコンピューター サイエンス学部で博士号を取得しようとしています。



他にもたくさんあります……

今回の姚舜宇氏のOpenAIへの採用について言えば、OpenAIの採用活動は現在も続いている。

OpenAI エンジニアの Karina Nguyen は、最新の募集投稿をリリースしました。

  • OpenAI モデル動作チームは人材を募集しています。これは、設計エンジニアリングと訓練後の研究を組み合わせた夢のようなポジションであり、世界で最も希少な仕事です❤️
  • RLHF/RLAIF などの調整手法を使用してモデルのコア動作を定義し、基本的な値を反映し、AGI の創造的なインテリジェンスを強化します。これらの結果を通じて、私たちは製品 + モデルの設計およびエンジニアリング チームと協力して、何百万ものユーザーに影響を与える AI インターフェイスとインタラクションの新しいモデルを作成します。



興味深いのは、カリーナ グエン氏が実際に以前は Anthropic AI (クロード氏のチーム) の研究者だったということです。昨年 5 月には、Think Chain の著者である OpenAI のジェイソン ウェイ氏と X (旧 Twitter) での即時単語対決にも参加していました。財団論文」。



カリーナ グエンがこんなに早く OpenAI に切り替えるとは予想していませんでした…

ところで、ちょうど昨日、Google DeepMind の研究者 Thibault Sottiaux 氏も OpenAI に採用されたというニュースが流れました。

ご存知のとおり、ティボー ソティオーは、オリジナルの Gemini や Gemini 1.5 などの論文の中心的な寄稿者でした。



これは、大型モデルトラックが現在どれほど人気が​​あるかを示しています。企業がトラックをめぐって競い合い、人々が人材を求めて争っているのです。

もう一つ

姚舜宇と同じ年に清華大学を卒業した姚舜宇は他に二人いました!

姚舜宇の学生3人が2019年に卒業した際、清華大学関係者は微博に投稿し、3人の集合写真を掲載した。

OpenAI に加わった Yao Shunyu に加えて、もう 1 人の Yao Shunyu が OpenAI から参加しました。人文科学部日本語を専攻している女の子。

もう一人のヤオ・シュンユウはヤオ・シュンですゆう、 から物理学科2018年学部特別賞を受賞。学部在学中、トップオーサーとして物理学のトップジャーナルPRL(Physical Review Letters)に2本の論文を、PRB(Physical Review B)に1本の論文を発表した。



参考リンク:
[1]https://x.com/ShunyuYao12/status/1818807946756997624
[2]https://ysymyth.github.io
[3]https://x.com/karinanguyen_/status/1819082842238079371
[4]https://weibo.com/1676317545/HCR7yuXAl?refer_flag=1001030103_