ニュース

GPT-4o mini はランキングを独占しており、2 か月間限定で無料で微調整できます。毎日 200 万のトレーニング トークンが無料で収集されます

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


新しい知恵のレポート

編集者: タオジ

【新しい知恵の紹介】 Llama 3.1 405B という野獣がオープンソース化される一方で、OpenAI が再び脚光を浴びました。今後、9 月 23 日まで毎日、200 万トレーニング トークンを使用してモデルを無料で微調整します。

Llama 3.1 がオープンソース化されたのと同じ日に、OpenAI もオープンされました。


GPT-4o miniは無料で微調整が可能で、2ヶ月の期間限定で毎日200万トレーニングトークンが利用可能です(9月23日時点)。


メールを受け取った開発者たちは、このような大きな羊毛を一刻も早く収穫しなければならないと興奮しながら互いに伝え合いました。


一方、大型モデル分野LMSYSにおけるGPT-4o miniのランキングも出た。

全体のリストでは、GPT-4o mini と GPT-4o が同率 1 位でした。


アルトマン氏は「どの評価にもこれほど興奮したことはありません。GPT-4o miniの性能はGPT-4oに非常に近く、価格はわずか20分の1です!」と興奮気味に語った。


同時に、GPT-4o miniの微調整はオンラインで行えるようになったと述べた。


OpenAI がこれほど強力なモデルを誰もが無料で使用できるようにリリースできるとは本当に予想外です。

ネットユーザーはかつて、これが最も高度なフィッシングメールではないかと考えていました。


1 日あたり 200 万トークン、GPT-4o mini の無料微調整

この電子メールの中で、OpenAI は、最新の小型モデルのパフォーマンスを特定のユースケースで向上させるための GPT-4o mini 微調整機能を正式に開始したと発表しました。

7 月 23 日から 9 月 23 日まで、開発者は毎日 200 万のトレーニング トークンを無料で使用できます。


超過分には 300 万米ドルのトークンが請求されます。

2 か月の無料使用期間が終了すると、微調整トレーニングにもトークンあたり 300 万米ドルが課金されます。


さらに、OpenAI は電子メールの中で、誰もが GPT-3.5 Turbo から GPT-4o mini に切り替える価値がある理由を次のように述べています。

- より手頃な価格: GPT-4o mini の入力トークン料金は GPT-3.5 Turbo より 90% 低く、出力トークン料金は 80% 低くなります。無料期間終了後も、GPT-4o mini のトレーニング費用は GPT-3.5 Turbo の半額です。


- より長いコンテキスト: GPT-4o mini のトレーニング コンテキストの長さは 65k トークンであり、GPT-3.5 Turbo の 4 倍であり、推論コンテキストの長さは 128k トークンで、これは GPT-3.5 Turbo の 8 倍です。

- よりスマートでより高機能: GPT-4o mini は GPT-3.5 Turbo よりもスマートで、ビジュアル機能をサポートしています (ただし、微調整は現在テキストに限定されています)。


最後に、電子メールには、GPT-4o mini 微調整機能が企業顧客だけでなく、Tier 4 および Tier 5 の開発者にも公開され、将来的にはアクセス権がすべてのレベルのユーザーに段階的に拡大される予定であるとも述べられています。


実践してみたい人のために、OpenAI は微調整ガイドをリリースしました。以下を参照してください。

https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples


一部のネチズンはこれについて楽観的ではありません。彼らは AI モデルのトレーニングと改善のためにデータを保存しています。


「AKA、あなたの個人データを教えてください。少額の料金を請求します。」


ネットユーザーの使用例

資格を取得したネチズンは試験が始まるのを待ちきれません。

開発者は、Economist スタイルの見出しデータセットを使用して gpt-4o mini を微調整しました。



次に、見出しの生成における gpt-4o、gpt-4o min オリジナル モデル、および微調整モデルのパフォーマンスを比較しました。


GPT-4o に匹敵する小型モデルがリストを独占

GPT-4o miniの発売から1週間が経ち、いよいよ大型モデルランキングの結果が出ました。

合計 4K+ ユーザー投票が寄せられ、GPT-4o mini モデルが直接リストのトップに上り詰め、GPT-4o と同率で 1 位となりました。

最も重要なことは、20倍安いということです。


これは、より強力なアプリケーションをより低コストで構築できる多くの開発者にとって朗報です。


数学部門では GPT-4o mini の性能が低下し、9 位にランクされました。


また、ハードプロンプト評価においても、GPT-4o miniはGPT-4o、Claude 3.5 Sonnetに次ぐ安定した性能を維持しました。


コーディングの分野でも、GPT-4o miniは強力な能力を発揮します。


GPT-4o mini がアリーナでなぜこれほど上位にランクされるのかについて、多くの人が疑問を呈しています。


これについての公式の説明は次のとおりです。

- チャットボット アリーナは、さまざまな分野の人間の好みに基づいて評価されます。全体的なランキングだけでなく、各カテゴリ (数学、コーディングなど) のランキングにも従うことが推奨されます。

- アリーナの評価はリアルタイムで行われます。全員がアリーナでモデルを直接比較し、リアルタイムで仮説を検証することをお勧めします。

- 透明性は私たちの核となる価値であり、すべてのコードと分析はオープンソースです (http://github.com/lm-sys/FastChat)。過剰適合を回避し、ベンチマークの整合性を維持するために、データの 20% を定期的にリリースし、残りのデータを保持します。

- GPT-4oのミニバトルデータはポリシーに従いランダムで20%公開され、答えはご自身でご確認いただけます。

しかし、他のネチズンは、gpt-4o-mini の勝利は、一般人がそれほど賢くないことの実質的な証拠であると信じています。

そして、歴史上初めて、AI は私たちをだますことができるほど賢くなっています。ちょっとクレイジーで、ちょっと歴史的。



参考文献:

https://x.com/moyix/status/1815840634013639086

https://x.com/HamelHusain/status/1815848198927434019

https://x.com/sama/status/1815877987696533897

https://x.com/0xSMW/status/1815869241205350641