OpenAI、企業が独自のデータに基づいて最も強力な AI モデルをカスタマイズできる新機能をリリース

2024-08-21

テンセント科学技術ニュース、米国現地時間 8 月 21 日火曜日、オープンAI企業顧客が自社データを使用してこの製品をカスタマイズできる新機能を開始しましたAI (人工知能) スタートアップにとって最も強力なモデルGPT-4o。

OpenAIは火曜日に、人工知能業界でナッジとして一般に知られているカスタマイズ機能を開始する予定だ。微調整により、特定のタスクまたは主題領域に関する追加情報を使用して既存の AI モデルをトレーニングできます。

たとえば、スケートボードを製造する会社は、AI モデルを微調整して、ホイールやスケートボードの手入れの詳細に関する質問に答えられる顧客サービスチャットボットとして使用できるようにするかもしれません。

人工知能製品の分野における新興企業間での競争が激しい現在、企業は人工知能への投資収益率を早急に証明する必要があるため、OpenAI の主力モデルの最新機能を微調整することが特に重要です。

この機能が GPT-4o とその前世代で初めて導入されたことは注目に値します。また、OpenAI は以前、GPT-4o mini を含む複数のタイプのモデルに対する微調整権限をユーザーに提供し、ユーザーにさらに多くの機能を提供していました。費用対効果の高いオプション。

市場にある多くのテクノロジー企業のモデルカスタマイズサービスに直面して、OpenAI API プロダクトディレクターのオリヴィエ・ゴデマン氏は、OpenAI はユーザーが外部に頼ることを避けるために企業との直接パートナーシッププロセスを確立することで、顧客のトップモデルへの調整を簡素化し、迅速化することに尽力していると強調した。サービスまたはより弱い代替サービス。

同氏はまた、「私たちは技術的な敷居を下げ、運用上の障壁を減らすことに常に取り組んでおり、それによってモデルの開始と調整にかかるユーザーの負担を軽減します」とも指摘した。

顧客がモデルの微調整を実行するときは、データを OpenAI サーバーに送信する必要があります。 OpenAI カスタム作業ソフトウェアエンジニアの John Allard 氏によると、このプロセスには平均して 1 ～ 2 時間ほどかかります。当初、微調整はテキストデータに限定され、画像やその他のメディア形式はサポートされません。

OpenAI は無料トークンを発行する中で、次のような課題に直面しています。グーグル、人類学的およびその他の独自のモデルサプライヤーとNous Research Hermes 3。メタ Llama 3.1 などのオープンソースモデルの熾烈な価格競争。

ただし、OpenAI および同様のクローズドソース/独自モデルを使用する利点は、開発者がモデルの推論やトレーニングのサーバーホスティングタスクを負担する必要がなく、OpenAI サーバーリソースを利用したり、API を介して好みのサーバーにシームレスに接続したりできることです。

ただし、モデルを微調整すると、元の安全ガードレールやパフォーマンス保証からの逸脱などのリスクが生じる可能性があり、それが全体的な有効性に影響を与えることが研究で示されています。企業がこのリスクを負うかどうかは、企業自身が検討する必要があります。しかし、OpenAI は明らかにお金を払う価値があると考えており、最適化オプションとして微調整を検討するようユーザーに勧めています。

これとは別に、OpenAIは火曜日、自社製品にVogue、The New Yorker、Wiredなどのブランドのコンテンツをフィーチャーすると発表した。この契約により、OpenAI は学習に大量のデータを必要とする人工知能モデルのトレーニングにコンデナストのコンテンツを使用することも許可されます。

この発表は、OpenAIが自社のAIツールでニュース記事やその他のコンテンツをどのように使用するかをめぐってメディア企業と争うのではなく、メディア企業と契約を結ぶよう努力を強化していることを示している。当事者は契約の取引額を明らかにしていない。

以下はOpenAIが発表した公式ニュースの全文です。

本日、開発者から最も要望の多かった機能の 1 つである GPT-4o の微調整を開始します。また、9 月 23 日以降、各企業に毎日 100 万個のトレーニングトークンを無料で提供します。

開発者は独自のデータセットを使用して GPT-4o を微調整し、特定のユースケースに対して低コストで高いパフォーマンスを実現できるようになりました。微調整テクノロジーにより、モデルは応答の構造とトーンを柔軟に調整でき、複雑で高度に専門化されたドメインの指示にも従うことができ、少数のトレーニングサンプル (数十のサンプルなど) のみで重要な結果が得られます。アプリケーション。

コーディングからクリエイティブなライティングまで、微調整機能は幅広い分野をカバーし、モデルの全体的なパフォーマンスに大きな影響を与え、向上させます。これはほんの始まりにすぎず、開発者向けのモデルのカスタマイズオプションの拡大に引き続き投資していきます。

今後、GPT-4o の微調整機能は、有料のすべての開発者に完全に公開されます。微調整ダッシュボードに直接アクセスして「作成」ボタンをクリックし、ベースモデルのドロップダウンリストから「GPT-4o -2024-08-06」を選択して微調整プロセスを開始してください。コストに関しては、GPT-4o 微調整トレーニングコストは 100 万トークンあたり 25 ドルに設定されていますが、推論コストは 100 万入力トークンあたり 3.75 ドル、100 万出力トークンあたり 15 ドルです。

さらに、GPT-4o mini 微調整機能もすべての有料開発者に公開されています。微調整ダッシュボードでベースモデルとして「GPT-4o-mini-2024-07-18」を選択するだけです。特別オファー: 発売を記念して、GPT-4o mini ユーザーに毎日最大 200 万のトレーニングトークンを無料で提供します。このオファーは 9 月 23 日まで有効です。

成功事例の微調整

過去数か月間、私たちは多くの信頼できるパートナーと協力して GPT-4o の微調整とテストを行い、そのユースケースを理解してきました。成功した例をいくつか紹介します。

1.Cosine は SWE-bench ベンチマークテストで驚くべきパフォーマンスを発揮しました

スタートアップコサインジーニーこれは、脆弱性を独自に特定して修復し、機能を構築し、ユーザーと効率的に協力してコードをリファクタリングできる人工知能ソフトウェアエンジニアリングアシスタントです。また、複雑な技術的問題を推論し、より高い精度でより少ないトークン要件でコードを変更することもできます。

Genie は、実際のソフトウェアエンジニアの実世界の経験を組み込んだ微調整された GPT-4o モデルを利用しており、モデルが特定の方法で応答することを学習できます。さらに、このモデルは、コードベースに簡単に統合できるパッチなどの特定の形式への出力の書式設定も習得し、作業効率をさらに向上させます。

先週の火曜日に発表された SWE ベンチ検証ベンチマークテストの結果では、Genie が 43.8% のパフォーマンスを達成したことが示されました。ソタ特にフルテストでの SOTA スコアは 30.08% と高く、これまでの最高スコアである 19.27% を大幅に上回り、このベンチマークテストの歴史において大きな進歩を遂げました。 SWE-Bench は、人工知能ソフトウェアエンジニアリング能力を評価するテストです。

2.Distyl が BIRD-SQL ベンチマークで 1 位にランクされる

Fortune 500 企業の AI ソリューションパートナーである Distyl は、最近、テキストから SQL への主要なベンチマークである BIRD-SQL ベンチマークで第 1 位にランクされました。 Distyl の微調整された GPT-4o は、リーダーボードで 71.83% の実行精度を達成し、クエリの再定式化、意図の分類、思考連鎖、自己修正などのタスクで優れたパフォーマンスを発揮し、特に SQL 生成で優れています。

データのプライバシーとセキュリティ

微調整モデルは完全にユーザーの制御下にあり、ユーザーはビジネスデータの絶対的な所有権を持ち、すべての入力と出力をカバーします。これにより、ユーザーのデータが共有されたり、他のモデルのトレーニングに使用されたりすることがなくなります。

さらに、悪用を防ぐために、微調整されたモデルに多層のセキュリティ保護メカニズムを導入しました。たとえば、微調整されたモデルに対して自動セキュリティ評価を継続的に実行し、使用状況を監視して、アプリケーションが使用ポリシーに準拠していることを確認します。

GPT-4o を微調整して何が作成されるのかを楽しみにしています。モデルのカスタマイズの可能性をさらに探りたい場合は、お気軽に当社のチームにご連絡ください。喜んでサポートと支援を提供させていただきます。（編/ゴールデンディア）

ニュース

OpenAI、企業が独自のデータに基づいて最も強力な AI モデルをカスタマイズできる新機能をリリース

導入

私の連絡先情報