openai が控えめな開発者カンファレンスを開催: コストを大幅に削減し、リアルタイム api の公開ベータ版を開始

openai が控えめな開発者カンファレンスを開催: コストを大幅に削減し、リアルタイム api パブリックベータを開始

2024-10-02

ハイライト:

openaiは火曜日、サンフランシスコで2回目の開発者カンファレンスを控えめな形式で開催したが、メディアの参加は招待されず、新製品も発表されなかった。
この開発者カンファレンスはそれぞれサンフランシスコ、ロンドン、シンガポールで開催され、他の2つは10月30日と11月21日に開催されます。
openai は開発者向けに 4 つの新しいツールを発表し、エンドユーザーアプリケーションでの直接の競争から開発者のエコシステムを強化することに焦点を移しました。
現在、300 万人を超える開発者が openai モデルを使用してアプリケーションを開発しており、そのプラットフォームの魅力と競争力を実証しています。

10月2日のニュースによると、この1週間は経営トップの退任や重要な資金調達活動など、openaiにとって課題に満ちていたが、同社は2024年の開発者カンファレンス（devday）で注目を集めることに再び注力したという。ツールを構築するためのモデル。最近メディアの注目を集めている openai ceo の sam altman 氏は、開発者カンファレンスには姿を見せなかった。

月曜日に開催された記者会見で、openaiの最高製品責任者のケビン・ワイル氏は、出席したメディアに対し、同社の最高技術責任者のミラ・ムラティ氏と最高研究責任者のバオ・ボブ・マクグルー氏が最近辞任を発表したが、この変更は組織に影響を与えないと断言した。会社の進歩。「ボブとミラは素晴らしいリーダーだということから始めます。私は彼らに深く影響を受けており、彼らは私たちが今日の地位に立つのに貢献してくれました。そして、私たちには何もありません。」私たちの開発のスピードは減速する予定です。」

openaiは昨年、業界にセンセーションを巻き起こした初の開発者カンファレンス（devday 2023）を米国サンフランシスコで開催した。同社は、多数のメディアが出席した45分間の基調講演でこの重大発表を行い、128kコンテキストサポートを備えたgpt-4 turbo、apiの値下げ、新しいアシスタントapi、ビジュアル機能用の gpt-4 turbo、dall·e 3 api、大幅に改良された json モデル、そして不運な gpt と app store のようなプラットフォーム gpt store。 microsoft ceoのsatya nadella氏もゲスト出演した。

openaiのプラットフォームプロダクトリードであるオリヴィエ・ゴデマン氏は、同社は今後開発者カンファレンスで新モデルをリリースせず、モデルは独自の研究と安全性のタイムラインに従うようにすると述べた。この変更は、openaiがテクノロジーの移行を急ぎすぎているとして批判を受けていることを背景にしている。非営利団体としてスタートした openai は現在、再編段階の真っ只中にあり、その非営利団体が制御を失い、従来のスタートアップ企業に変身する可能性がある。これは、資金調達、人材の採用、維持を支援することを目的とした動きである。しかし、これらの変化は「会社を引き裂き」、ムラティ氏とチーフサイエンティストのイリヤ・サツケヴァー氏は会社の成長が速すぎるため退職した。

昨年の開発者カンファレンス後にハイレベルの人事異動を経験した openai は、今年の開発者カンファレンスを開催するために、より控えめなアプローチを選択しました。昨年のイベントと比較すると、今年のopenaiの開発者カンファレンスはより抑制されたものになっているようだ。同社は以前、メディアの参加を招待しないと述べていた。公式情報によると、第 2 回 devday 開発者カンファレンスはそれぞれ 10 月 1 日、ロンドン、11 月 21 日に開催され、技術セミナー、グループディスカッション、製品デモンストレーションなどが行われます。このイベントの参加者は、公式サイトから申し込みを済ませ、登録料450ドルを支払うことで参加できる。

openaiの経営陣は、同社は経営陣の交代に直面しているものの、同社のaiモデルを開発に使用している開発者は依然として300万人を超えており、プラットフォームの魅力と競争力を証明していると述べた。それにもかかわらず、openai は市場における競争の激化、特に meta や google などの競合他社からの価格圧力を認識しています。開発者を惹きつけて維持するために、openai は過去 2 年間で api へのアクセスコストを 99% 削減しました。これは競合他社からの挑戦に応える戦略であると考えられます。

openaiは今回の開発者カンファレンスでは新しい人工知能の最先端モデルを発表せず、代わりにエコシステムの構築に重点を置き、開発者が相互につながり、新しい人工知能の機能や製品を深く理解できるよう支援することに重点を置いた。 openai が業界の破壊者からプラットフォームプロバイダーへと移行する中、その成功は活気に満ちた開発者エコシステムを育成する能力にかかっています。 openai は、より高度なツールを提供し、コストを削減し、サポートを強化することで、人工知能の分野での継続的な成長と安定性のための強固な基盤を築きました。この戦略の直接的な影響は明らかではないかもしれませんが、最終的には幅広い業界で ai の持続的かつより深い導入につながることが期待されています。

openai は、この開発者カンファレンスで、vision fine-tuning、realtime api、model distillation、prompt caching という 4 つの主要なイノベーションを発表しました。これらの新しいツールは、openai の戦略的焦点が、エンドユーザーアプリケーションでの直接競合から、開発者エコシステムの強化への移行を示しています。

01 プロンプトキャッシュ: 開発者向けのコスト節約ツール

openai は開発者カンファレンスで、開発者のコストと運用遅延を大幅に削減するプロンプトキャッシングという革新的な機能を発表しました。この機能は、モデルによって最近処理された入力トークンを自動的に識別してキャッシュし、これらのキャッシュされたトークンに対して最大 50% の価格割引を提供します。これは、同じコンテキストを頻繁に使用するアプリケーションにとって大きな恩恵です。

「私たちは懸命に取り組んできました」と openai プラットフォーム製品リードの gudmont 氏は述べています。「2 年前を振り返ると、gpt-3 が圧倒的な市場リーダーでした。現在、当社はコストを 1,000 分の 1 に削減することに成功しています。2 年でこれほど大幅なコスト削減を達成できるテクノロジーは他に思いつきません。」。」

この大幅なコスト削減により、あらゆる規模の企業やスタートアップ企業、特にコストの問題で立ち上げが遅れていたプロジェクトに新しいアプリケーションを模索する道が開かれます。

02 ビジュアルファインチューニング: 新時代のビジュアル人工知能

もう 1 つの重要な発表は、openai の最新の大規模言語モデルである gpt-4o に対する視覚的な微調整機能の導入です。この新機能により、開発者は画像とテキストを活用してモデルの視覚的な理解をカスタマイズできるようになります。この機能の影響は広範囲に及び、自動運転車、医療画像処理、視覚検索機能などの分野に大きな影響を与える可能性があります。

openaiによると、東南アジアの食品配達・配車サービス会社grabはすでにその技術を利用して地図サービスを改善しているという。わずか 100 件の例で、grab は車線カウントの精度で 20% の向上、速度制限標識の位置で 13% の向上を達成しました。この現実世界のアプリケーションは、ビジュアル微調整によってビジュアルトレーニングデータの小さなバッチを活用して、さまざまな業界にわたる人工知能サービスの可能性を大幅に向上させる方法を示しています。

03 インスタント api: 会話型 ai のギャップを埋める

openai はインスタント api のパブリックベータ版も開始しました。これは、開発者が、特に音声読み上げアプリケーションにおいて、低遅延のマルチモーダルエクスペリエンスを作成できるようにする新しいサービスです。これは、開発者が chatgpt の音声制御機能をアプリに追加し始めることができることを意味します。

api の可能性を実証するために、openai は昨年のカンファレンスで披露した旅行計画アプリ wanderlust の更新版を披露しました。インスタント api を活用することで、ユーザーはアプリに直接話しかけて、自然な会話形式で旅行を計画できます。

旅行計画は一例にすぎませんが、インスタント api はさまざまな業界で音声起動アプリケーションの幅広い可能性を開きます。顧客サービスから教育およびアクセシビリティツールに至るまで、開発者は、より直観的で応答性の高い ai を活用したエクスペリエンスを作成するための強力な新しいリソースを利用できるようになりました。「製品を設計するときは常に、基本的にスタートアップと企業について考えます」とグドモント氏は説明します。「そのため、アルファテストでは、多くの企業が api、新製品の新しいモデルを使用しています。」

インスタント api は本質的に、音声アシスタントやその他の会話型 ai ツールを構築するプロセスを簡素化し、文字起こし、推論、テキストから音声への変換のために複数のモデルを組み合わせる必要がなくなります。健康とフィットネスのコーチングアプリ healthify や言語学習プラットフォーム speak などの早期採用企業は、インスタント api を自社の製品に統合しています。 instant api の料金体系は、音声入力が 1 分あたり 0.06 ドル、音声出力が 1 分あたり 0.24 ドルと決して安くはありませんが、それでも音声ベースのアプリケーションを作成しようとしている開発者にとっては大きな価値があると考えられます。

04 モデルの蒸留: 人工知能の普及における新たな章

openai は、モデル蒸留テクノロジーもリリースしました。これは、openai の最も革新的な進歩であると考えられます。このテクノロジーを使用すると、開発者は o1-preview や gpt-4o などの高度なモデルの出力を活用して、gpt-4o mini などのより効率的なモデルのパフォーマンスを強化できます。

このイノベーションにより、中小企業はより低い計算コストで大規模モデルに匹敵する機能を実現できるようになり、ai 業界の長年の矛盾、つまりリソースを大量に消費するシステムとアクセスしやすいが機能が限られたシステムとの間の矛盾が解決されます。たとえば、小規模な医療技術スタートアップ企業はモデル蒸留技術を活用して、地方の診療所向けに ai を活用した診断ツールを開発できます。同社は、標準装備で動作するだけでなく、より大型のモデルに近い診断精度を提供する軽量モデルをトレーニングすることができ、リソースが限られた地域での医療を改善することが期待されています。 (wiji、tencent technology が特別編集)

ニュース

openai が控えめな開発者カンファレンスを開催: コストを大幅に削減し、リアルタイム api パブリック ベータを開始

01 プロンプト キャッシュ: 開発者向けのコスト節約ツール

02 ビジュアルファインチューニング: 新時代のビジュアル人工知能

03 インスタント api: 会話型 ai のギャップを埋める

04 モデルの蒸留: 人工知能の普及における新たな章

導入

私の連絡先情報

openai が控えめな開発者カンファレンスを開催: コストを大幅に削減し、リアルタイム api パブリックベータを開始

01 プロンプトキャッシュ: 開発者向けのコスト節約ツール