ニュース

OpenAI、一部の ChatGPT Plus ユーザーに高度な音声モードを展開

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

· 新しいオーディオ機能により、ユーザーは ChatGPT に話しかけてリアルタイムの応答をすぐに受信したり、ChatGPT が話している間に中断したりすることができます。ビデオや画面共有などのより高度な機能は後日導入される予定です。

7 月 31 日、OpenAI は一部の ChatGPT Plus ユーザーに高度な音声モードの開始を発表し、秋にはすべての ChatGPT Plus ユーザーに公開する予定です。

OpenAI は、新世代の人工知能音声アシスタントの開発を推進しています。新しいオーディオ機能により、ユーザーは ChatGPT に話しかけてリアルタイムの応答をすぐに受け取ることができるほか、会話中に ChatGPT を中断することもできます。音声パターンは、音声のさまざまなイントネーションによって伝えられる情報を区別します。より自然に聞こえ、音を使ってさまざまな感情を伝えます。

新しい音声モードは、音声、テキスト、ビジョン機能を組み合わせた OpenAI の GPT-4o モデルを利用しています。フィードバックを集めるために、OpenAI は当初、音声プレミアム機能を ChatGPT Plus の「少数のユーザー グループ」に展開していますが、OpenAI はこの秋にすべての ChatGPT Plus ユーザーが利用できるようになると述べています。

OpenAIは、リリース基準を満たすには時間がかかるとして、音声通話エクスペリエンスの開始を6月下旬から7月に延期した。 OpenAIは、45の言語をカバーする100以上の外部レッドチームとともにGPT-4oの音声機能をテストしたと述べた。同社は、プライバシーを保護し、このモデルがディープフェイク音声の作成に使用されるのを防ぐなど、いくつかのセキュリティメカニズムを組み込んでおり、声優と協力して4つのプリセット音声を作成していると述べた。 。 の音。

OpenAIが最初にGPT-4oを発表したとき、女優のスカーレット・ヨハンソンによく似た「スカイ」と呼ばれる音声を使用したことで反発に直面した。スカーレット・ヨハンソンは、モデルに声を使用することを許可するようOpenAIから連絡を受けたが、断ったと声明を発表した。 OpenAIはジョンソン氏の声ではないと否定したが、Skyの使用を停止した。

OpenAIはまた、音楽やその他の著作権で保護されたオーディオを生成するリクエストを識別してブロックするフィルターを採用し、法律違反や有害なコンテンツの生成を防ぐためにテキストモデルで使用されているのと同じセキュリティメカニズムをGPT-4oに適用したとも述べた。 「暴力的なコンテンツや著作権で保護されたコンテンツのリクエストをブロックするためのガードレールを設置しています。さらに、ビデオや画面共有などのより高度な機能も後日公開される予定です。」