новости

подарочный пакет openai: доступны голос и дистилляция моделей в реальном времени, продавайте лучшие продукты и зарабатывайте больше денег

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

автор|джессика

сегодня первый devday openai в 2024 году прошел в скромной обстановке в павильоне gateway на пирсе 2 в сан-франциско.

в отличие от бурного официального объявления в прошлом году, новость о дне разработчика в этом году появилась только один раз в x-аккаунте разработчиков openai два месяца назад, поэтому многие люди об этом не знали.

участники — это в основном приглашенные клиенты и избранные разработчики, работающие на переднем крае. место проведения держалось в секрете до последнего момента, загадочное расписание не было раскрыто до сегодняшнего дня, а прямой трансляции не было.

перед встречей сэм альтман быстро написал в твиттере:

«сегодня запускаются некоторые новые инструменты для разработчиков!

с прошлого devday по этот: стоимость токена с gpt-4 до 4o mini упала на 98%, количество токенов в нашей системе выросло в 50 раз, модельный интеллект добился отличного прогресса, и было немного драма в процессе.

я с нетерпением жду прогресса от этого devday к следующему. путь к agi еще никогда не был таким ясным. "

как ранее сообщал о платформе x ромен юэ, директор по опыту разработчиков компании, devday в этом году не представила никаких новых моделей и сосредоточилась только на улучшениях api.

и openai действительно включил в себя серию api-интерфейсов реального времени, оперативное кэширование, дистилляцию моделей, тонкую визуальную настройку, оптимизацию игровой площадки, а также расширил сферу применения o1 api и увеличил лимит скорости для разработчиков в этот настоящий «день разработчика». важные обновления инструментов.

цены на эти новые api не совсем дешевые. многие разработчики отмечают, что сочетание цены и возможностей делает их привлекательными. этот искренний подарочный пакет для разработчиков преподносится сразу, и openai по-прежнему хочет заработать как можно больше денег, продавая лучшие продукты.

источник изображения: @swyx |

1

api реального времени: создайте собственное приложение «она» за один шаг

самая привлекательная на сегодняшний день функция realtime api позволяет разработчикам вызывать gpt-4o-realtime-preview, базовую модель расширенного голосового режима chatgpt, для создания быстрого и естественного голосового общения в приложениях. поддерживает 6 предустановленных голосов для голосового взаимодействия с малой задержкой.

раньше при создании голосовых помощников разработчикам приходилось полагаться на несколько моделей для выполнения разных задач: сначала использовать модель распознавания речи, такую ​​​​как whisper, для расшифровки звука в текст, затем передавать текст в языковую модель для вывода и, наконец, генерировать речь. посредством модели преобразования текста в речь. мало того, что процесс сложен, но эмоции и акцент могут быть легко потеряны, и возникают значительные задержки.

api реального времени требует только одного вызова для завершения всего процесса разговора. значительно улучшите естественность и оперативность разговоров за счет потоковой передачи аудиовхода и вывода. он использует постоянное соединение websocket для обмена сообщениями с gpt-4o и поддерживает вызовы функций, которые могут быстро реагировать на запросы, выполнять такие операции, как размещение заказов или предоставление персонализированных услуг. он также может автоматически обрабатывать прерывания, такие как расширенный голосовой режим, чтобы обеспечить более плавную работу пользователя. он очень подходит для поддержки клиентов, изучения языка и других сценариев, требующих высокой интерактивности.

на месте сотрудники продемонстрировали голосовой помощник, созданный через api реального времени, который помог более чем 100 разработчикам в аудитории «позвонить и оформить заказ на 400 клубники с доставкой».