ニュース

o1 はどのようにして人間のように「推論」するのでしょうか? openai 研究チームの q&a: モデルの詳細、将来の計画、o1 パフォーマンスを最大化するためのヒントを明らかにする

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

9 月 13 日、openai は o1 シリーズ モデルの正式デビューを発表しました。これは ai 分野の新時代を告げ、汎用の複雑な推論タスクを実行できる大規模モデルの時代の到来を告げます。モデルのリリース後、openai 研究チームは x ソーシャル プラットフォームで ama (ask me anything) イベントを開催し、o1 シリーズ モデルの多くの詳細を詳細に明らかにしました。

画像出典:xソーシャルプラットフォーム
  • 「エイリアン」レベルのaiアシスタント

openaiによると、o1シリーズには2つのバージョンがあり、完全モデルの初期バージョンであるo1-previewと、より高速で軽量なo1-miniである。以前のモデルとは異なり、o1 は、最終的な答えを与える前に、隠された思考プロセスの長い連鎖を生成することができ、人間のような推論能力を示します。研究者らはo1を超能力を持つ「エイリアン」に例えている

画像出典:xソーシャルプラットフォーム

推論の過程で、o1 は強化学習を使用して「推論」パフォーマンスを実現します。現時点では、これらの思考連鎖トークンを api ユーザーや chatgpt に表示する計画はありませんが、研究者らは、プロンプトに埋め込まれた指示が o1 の思考方法に影響を与える可能性があることを明らかにしました。対照的に、gpt-4o はプロンプトを通じて o1 の思考連鎖パフォーマンス レベルに到達できません

画像出典:xソーシャルプラットフォーム

o1 シリーズ モデルは gpt-4o と同じトークナイザーを使用し、入力トークンの一貫性を保ちます。しかし、o1 は、より長く、より自由なタスクを処理できるため、入力のチャンク化の必要性が減ります。将来的には、o1 はより大きな入力コンテキスト ウィンドウもサポートする予定です。

o1 はまた、暗号を解読したり、哲学的な質問について熟考したり、自分の能力を評価するための自己テストを受けるなど、優れた推論能力と一般化能力を示しました。

研究チームは次のことも明らかにしました。一部のパーソナライズされた書き込みタスクにおける o1-preview のパフォーマンスは、gpt-4o と同等かわずかに優れています。

  • ミニ版はさらに強力ですか?

o1-preview と比較して、o1-mini はサイズと速度が最適化されています。

画像出典:xソーシャルプラットフォーム

世界の知識など一部の分野では限界があるかもしれませんが、o1-mini は、stem (科学、技術、工学、数学) タスクおよびコード関連タスクでその利点を実証します。また、o1-mini は o1-preview よりも多くの思考連鎖を探索できます

画像出典:xソーシャルプラットフォーム
  • o1 は間もなくツールの統合とマルチモーダルな理解をサポートします

o1-preview は現在ツールを使用していませんが、openai は、関数呼び出し、コード インタープリター、web ブラウジングなどの機能を追加する予定です。ツールのサポート、構造化された出力、システム プロンプトも将来のアップデートで導入される予定です

画像出典:xソーシャルプラットフォーム

さらに、openai 開発チームは次のように述べています。将来的には、ユーザーは o1 の思考時間とトークン制限を制御できるようになります。と述べ、この機能の実装を積極的に推進していくことを約束した。

openai は、ストリーミングのサポートと api での推論進行状況のフィードバックも積極的に推進しています。。また、o1 にはすでにマルチモーダル機能が組み込まれており、マルチモーダル理解タスク (mmlu) に関しては最先端のレベルに達することが期待されています。

画像出典:xソーシャルプラットフォーム
  • o1-mini のプロンプトは 1 週間あたり 50 件に制限されています

o1-mini は現在、chatgpt plus ユーザーに公開されていますが、プロンプトの数は 1 週間あたり 50 件に制限されています。すべてのチップは同じ割り当てとしてカウントされます。 openai が約束するのは、api のアクセス レベルとレート制限は将来的に段階的に引き上げられ、制限が緩和された後はボリューム価格の割引が提供される予定です。

o1 モデルの価格は、1 ~ 2 年ごとの値下げ傾向に従うと予想されます。また、パーソナライズされた微調整サポートが製品ロードマップに含まれています, しかし、具体的なリリーススケジュールはまだ明らかになっていません。

画像出典:xソーシャルプラットフォーム
  • o1 パフォーマンスを最大化する秘訣

o1-mini は現在、2023 年 10 月時点のデータを使用してトレーニングされており、将来の反復ではより新しいデータセットを使用して世界に関する知識を拡大します。

o1 の推論の利点を最大限に活用するには、チームは、ユーザーがプロンプトを設計する際に、エッジケースをカバーする有益で具体的な例を提供し、必要な推論手順とスタイルを明確に指定することを推奨しています。。でも気をつけてください、無関係なコンテキストがモデルの推論プロセスに干渉する可能性があります

日々の経済ニュース総合自己広報

毎日の経済ニュース

レポート/フィードバック