遅くて高価ですか? openai推論モデル「strawberry」登場、gpt-5はどこまで?

遅くて高価ですか? openai推論モデル「strawberry」登場、gpt-5はどこまで？

2024-09-13

openaiの「strawberry」がついに登場。

現地時間9月12日、人工知能（ai）大手openaiは、openai o1-previewと小型バージョンのo1-miniを含む、コード名「strawberry」というai推論モデルのopenai o1シリーズをリリースした。

openai によると、o1 は人間と同じように、反応する前に問題について考えることに多くの時間を費やすようになるそうです。トレーニングを通じて、私は自分の思考プロセスを磨き、さまざまな戦略を試し、間違いを認識することを学びました。複雑なタスクについて推論し、以前の科学、コーディング、数学モデルよりも難しい問題を解決します。

openai は、この一連のモデルは複雑な推論タスクにとって大きな進歩であるため、プロダクトカウンタを 1 にリセットし、openai o1 と名付けたと述べています。名前の「o」はオリオン座を意味しているのかもしれません。

より強力な推論能力、思考の連鎖によりモデルのセキュリティに新たな機会がもたらされる

「strawberry」プロジェクトは以前「q*」と呼ばれていたが、これがopenaiの「法廷闘争」を引き起こし、同社ceoのサム・アルトマン氏の突然の解任につながった。情報筋によると、openaiの最高技術責任者ミラ・ムラティ氏は当時、q*（qスターと発音）aiの躍進に関する書簡が取締役会の解任を促したと従業員に語ったという。

q* に関する openai の進歩により、一部の企業内部関係者は、これが「スーパーインテリジェンス (agi、汎用人工知能)」を発見する上でのブレークスルーになるかもしれないと信じています。

公式情報によると、o1 は gpt-4o をはるかに超える多くの機能を備えています。 codeforces で 89 位にランクされ、american mathematical olympiad (aime) では国内の学生上位 500 人にランクされ、人間の博士レベルを超えました。

報告書によると、人間が難しい問題に答える前に長時間考えるのと同じように、o1 も問題を解決しようとするときに一連の思考を使用します。強化学習を通じて、o1 は思考の連鎖を磨き、使用する戦略を改善することを学びます。間違いを認識して修正し、難しいステップをより簡単なステップに分解し、現在のアプローチが機能しない場合は別のアプローチを試すことを学びます。

openaiは、モデルの思考を明確な方法で観察でき、セキュリティルールに関するモデルの推論が配布外のシナリオに対してより堅牢であるため、思考チェーンを使用するとセキュリティと一貫性を大幅に向上できると述べた。

sensetimeの執行会長兼最高経営責任者（ceo）であるxu li氏は以前、モデルが将来的にスマートかどうかは、モデルの思考連鎖データを構築する方法論が十分強力かどうか、そしてこの十分強力な方法論が持続可能かどうかに完全に依存すると述べた。そして反復的です。

openai o1 のオリジナルの完全な思考チェーンの部分的なスクリーンショット

しかし、openai は最終的に、元の思考チェーンをユーザーに表示するのではなく、思考チェーンの概要を表示することを選択しました。 openai はさらに次のように説明しました。「隠された思考連鎖は、モデルを監視するユニークな機会を提供します。モデルが忠実に読み取り可能であると仮定すると、隠された思考連鎖により、モデルの思考を「読み取り」、その思考プロセスを理解できるようになります。たとえば、将来的には、ユーザーを操作する兆候がないか思考連鎖を監視したいかもしれませんが、これを行うには、モデルがその思考を変更されていない形式で自由に表現できる必要があるため、思考連鎖やユーザーの好みに基づいてポリシーへの準拠をトレーニングすることもできません。一貫性のない思考連鎖をユーザーに直接見せたくないのです。」

現在、chatgpt の plus および team ユーザーは 2 つの o1 モデルを利用でき、エンタープライズおよび教育ユーザーも来週から使用できるようになります。

遅いが高価であり、gpt-4o の「後継」ではありません

現在、週あたりのメッセージ制限は、o1-preview の場合は 30、o1-mini の場合は 50 です。 openaiは、メッセージ制限を増やし、指定されたプロンプトに基づいてchatgptが適切なモードを自動的に選択できるようにするために懸命に取り組んでおり、さらに多くのレベルのユーザーにアクセスを拡張し、すべての無料ユーザーにo1-miniアクセスを提供する予定であると述べた。

api (アプリケーションプログラミングインターフェイス) 側では、o1-preview は 100 万入力トークンあたり 15 ドル (大規模モデルはテキストを単語、文字セット、または単語と句読点の組み合わせに分割します) と 100 万出力トークンあたり 60 ドルを請求します。 gpt-4oと比較すると、入力コストが3倍、出力コストが4倍になります。

o1-miniは測位が速く、コスト効率が高く、aimeやcodeforcesなどの評価ベンチマークでもo1とほぼ同等のパフォーマンスを発揮すると言われています。 o1-mini は、api ユーザーにとって、レート制限が高く、レイテンシが低いため、o1-preview より 80% 安価です。

openai o1 は他のモデルよりも遅いという欠点もあります。海外メディアの報道によると、o1 が特定の質問に答えるには 10 秒以上かかる場合があり、このモデルは現在実行中のサブタスクのラベルを表示することで進行状況を表示することを選択しています。

同時に、生成 ai モデルの予測不可能性を考慮すると、o1 には他の欠陥や制限がある可能性があります。たとえば、三目並べのゲームでは時々間違いを犯すことがあります。 openaiは技術文書の中で、o1はgpt-4oよりも幻覚症状を起こしやすく、質問に対する答えが分からない場合にはそれを認めたがらないという一部のテスターの噂があると述べた。

さらに、o1 は現在、web を参照したり、ファイルを分析したりすることができません。

altman 氏は、o1 は現時点で openai の最も強力で調整された一連のモデルであるが、まだ欠陥があることを率直に認めました。

openaiのグレッグ・ブロックマン社長も、o1技術はまだ初期段階にあり、openaiは信頼性、幻覚、攻撃者に対する堅牢性（安定性）などを積極的に模索していると述べた。

openaiによると、openai o1は初期モデルのため、ネットワーク情報の閲覧、ファイルや写真のアップロードなど、chatgptを便利にする機能の多くがまだ備わっていないという。多くの一般的なケースでは、gpt-4o は短期的にはより優れた機能を備えます。今後も定期的なアップデートと改善が行われ、「この新しいモデルを現行モデルと同じくらい使いやすくするための作業がまだ進行中です。」

openaiは、openai o1がgpt-4oの「後継」ではないことを強調しており、4oはo1シリーズの後にもgptシリーズのモデルを開発およびリリースし続ける予定である。

openai o1 と gpt-4o の複数のベンチマークの比較

以前の海外メディアの報道によると、openaiは「strawberry」大型モデルまたは次世代フラッグシップモデルに対して、月額最大2,000ドルに達する可能性があるより高い料金基準を設定することを検討している可能性があることは言及する価値があります。比較のために、chatgpt plus の現在の料金は月額 20 ドルです。

激動の openai、gpt-5 はいつ登場しますか?

海外メディアの報道によると、ムラティ氏は現在、前世代よりもはるかに大型となる次世代主力モデル「gpt-5」を開発中であると述べた。同社は規模が人工知能から新たな機能を引き出すのに役立つと依然として信じているが、gpt-5には今回発表された推論技術も含まれる可能性が高い。

「スケーリングのパラダイムとこの新しいパラダイムの 2 つのパラダイムがあります。私たちはそれらを 1 つにまとめたいと考えています。」とムラティ氏は述べました。

gpt-5の開発の道は容易ではありません。

現地時間9月11日、gpt-4o/gpt-5の研究リーダーであり、openai版「her」の技術リーダーであるalexis conneau氏が突然辞任を発表した。これまで、openaiの共同創設者兼チーフサイエンティストのイリヤ・サツケヴァー氏、「スーパーアライメント」チームリーダーのジャン・ライク氏、共同創設者のジョン・シュルマン氏、chatgpt責任者のピーター・デン氏らが相次いで辞任しており…現在、創設者11人のうち2人だけとなっている。 openaiに残ります。

人事の混乱があるだけでなく、openai は今年、50 億米ドルの収入と支出のギャップに直面していることも明らかになりました。

しかし、目に見えるのは、openai がすでに行動を起こしているということです。

openai の最新の計画では、約 65 億米ドルを調達し、この資金調達ラウンドの評価額は 1,500 億米ドルに達する予定です。先月末、openaiがベンチャーキャピタル会社thrive capital主導で10億米ドルの新たな資金調達ラウンドを準備していることが明らかになり、openaiの評価額が高ければmicrosoft、apple、nvidiaも投資に参加する可能性がある。 1,000億ドル強です。

現地時間8月29日、openaiは、現在chatgptの週間アクティブユーザー数が2億人を超え、これは昨秋の2倍であると発表した。

openai によると、フォーチュン 500 企業の 92% が同社の製品を使用しており、7 月の chatgpt-4o mini の発売以来、その api の使用量は 2 倍になっています。

ザ・ペーパーの記者、チン・シェン

（この記事はthe paperからのものです。よりオリジナルの情報については、「the paper」アプリをダウンロードしてください）

レポート/フィードバック

ニュース

遅くて高価ですか? openai推論モデル「strawberry」登場、gpt-5はどこまで？

導入

私の連絡先情報