OpenAI запускает расширенный голосовой режим для некоторых пользователей ChatGPT Plus

OpenAI представляет расширенный голосовой режим для некоторых пользователей ChatGPT Plus

2024-08-01

· Новые аудиофункции позволяют пользователям разговаривать с ChatGPT и немедленно получать ответы в режиме реального времени или прерывать разговор ChatGPT. Более продвинутые функции, такие как видео и совместное использование экрана, будут представлены позже.

31 июля OpenAI объявила о запуске расширенного голосового режима для некоторых пользователей ChatGPT Plus и планирует открыть его для всех пользователей ChatGPT Plus осенью.

OpenAI стимулирует разработку нового поколения голосовых помощников с искусственным интеллектом. Новая функция звука позволит пользователям разговаривать с ChatGPT и немедленно получать ответы в режиме реального времени, а также прерывать ChatGPT, пока он говорит. Речевые модели различают информацию, передаваемую разными интонациями речи. Он звучит более естественно и использует звук для передачи различных эмоций.

Новый речевой режим основан на модели OpenAI GPT-4o, которая сочетает в себе возможности речи, текста и зрения. Чтобы собрать отзывы, OpenAI первоначально предоставляет голосовые премиум-функции «небольшой группе пользователей» ChatGPT Plus, но OpenAI заявляет, что этой осенью они станут доступны всем пользователям ChatGPT Plus.

OpenAI отложила запуск голосовых вызовов с конца июня на июль, заявив, что потребуется время, чтобы соответствовать стандартам выпуска. OpenAI заявила, что протестировала речевые возможности GPT-4o с более чем 100 внешними красными командами, охватывающими 45 языков. Компания заявила, что встроила несколько механизмов безопасности, таких как защита конфиденциальности и предотвращение использования модели для создания дипфейковых голосов. Она работала с актерами озвучивания для создания четырех предустановленных голосов. GPT-4o не имитирует и не генерирует голоса других людей. . звук из.

Когда OpenAI впервые запустила GPT-4o, она столкнулась с негативной реакцией за использование голоса под названием «Небо», который очень напоминал голос актрисы Скарлетт Йоханссон. Скарлетт Йоханссон опубликовала заявление, в котором говорится, что OpenAI связалась с ней, чтобы позволить модели использовать свой голос, но она отказалась. OpenAI отрицает, что это был голос Джонсона, но приостановила использование Sky.

OpenAI также заявила, что приняла фильтры для идентификации и блокировки запросов на создание музыки или другого аудио, защищенного авторскими правами, и применила те же механизмы безопасности, которые используются в текстовых моделях, к GPT-4o, чтобы предотвратить нарушение законов и создание вредоносного контента. «У нас есть защитные меры для блокировки запросов на контент, содержащий насилие или защищенный авторским правом». Кроме того, позже будут реализованы более продвинутые функции, такие как совместное использование видео и экрана.

Новости

OpenAI представляет расширенный голосовой режим для некоторых пользователей ChatGPT Plus

Введение

моя контактная информация