новости

openai проводит скромную конференцию разработчиков: значительное сокращение затрат и запуск публичной бета-версии api в реальном времени

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

основные моменты:

  1. во вторник openai провела свою вторую конференцию разработчиков в сан-франциско в сдержанной обстановке. сми не были приглашены на нее, и никаких новых продуктов выпущено не было.

  2. эта конференция разработчиков пройдет в сан-франциско, лондоне и сингапуре соответственно, а две другие пройдут 30 октября и 21 ноября.

  3. openai запустила четыре новых инструмента для разработчиков, сместив акцент с прямой конкуренции в приложениях для конечных пользователей на расширение возможностей экосистемы разработчиков.

  4. в настоящее время более 3 миллионов разработчиков использовали модель openai для разработки приложений, продемонстрировав привлекательность и конкурентоспособность своей платформы.

согласно новостям от 2 октября, прошедшая неделя была полна проблем для openai, включая уход высшего руководства и важные мероприятия по сбору средств, но компания переориентировалась на привлечение внимания к своей конференции разработчиков 2024 года (devday). разработчики используют свой ии. модели для создания инструментов. генеральный директор openai сэм альтман, который в последнее время привлек много внимания средств массовой информации, не появился на конференции разработчиков.

на состоявшейся в понедельник пресс-конференции директор по продукту openai кевин вейл заверил присутствующих сми, что хотя технический директор компании мира мурати (mira murati) и главный научный сотрудник бао боб макгрю недавно объявили о своем уходе, но это изменение не повлияет на прогресс компании. «я начну с того, что боб и мира — невероятные лидеры», — сказал уэр с большим уважением. «они оказали на меня глубокое влияние, и они сыграли важную роль в том, чтобы мы оказались там, где мы находимся сегодня. планирует замедлиться. скорость нашего развития».

в прошлом году openai провела в сан-франциско, сша, первую конференцию разработчиков (devday 2023), которая произвела фурор в отрасли. компания сделала большое объявление во время 45-минутного выступления, на котором присутствовало большое количество представителей сми. она запустила ряд новых продуктов и инструментов, включая gpt-4 turbo с поддержкой контекста 128 кб, снижение цен на api, новый api-интерфейс assistants. и gpt-4 turbo для визуальных функций, api dall·e 3 и значительно улучшенная модель json, а также злополучные gpt и платформа gpt store, подобная app store. в качестве гостя также выступил генеральный директор microsoft сатья наделла.

оливье годеман, руководитель платформы openai, заявил, что компания больше не будет выпускать новые модели на конференциях разработчиков, позволяя моделям следовать собственным графикам исследований и безопасности. это изменение происходит на фоне критики openai за слишком быстрое продвижение технологии. openai, которая начинала как некоммерческая организация, сейчас находится в разгаре этапа реструктуризации, в результате которой некоммерческая организация может потерять контроль и превратиться в традиционный стартап – шаг, призванный помочь ей привлечь капитал, нанять и удержать таланты. но эти изменения «разрывают компанию на части», и мулати и главный научный сотрудник илья суцкевер ушли, потому что компания росла слишком быстро.

пережив кадровые изменения высокого уровня после прошлогодней конференции разработчиков, openai выбрала более сдержанный подход к проведению конференции разработчиков в этом году. по сравнению с прошлогодним мероприятием конференция разработчиков openai в этом году выглядит более сдержанной. ранее компания заявляла, что не будет приглашать к участию сми. по официальной информации, 2-я конференция разработчиков devday пройдет в сан-франциско, лондоне и сингапуре 1, 30 октября и 21 ноября соответственно. мероприятия включают технические семинары, групповые дискуссии, демонстрации продуктов и т. д. участники мероприятия могут принять участие после успешной подачи заявки на официальном сайте и оплаты регистрационного взноса в размере 450 долларов сша.

руководство openai заявило, что, хотя компания сталкивается со сменой руководства, в компании по-прежнему работают более 3 миллионов разработчиков, использующих ее модели искусственного интеллекта для разработки, что демонстрирует привлекательность и конкурентоспособность ее платформы. тем не менее, openai осознает растущую конкуренцию на рынке, особенно ценовое давление со стороны таких конкурентов, как meta и google. чтобы привлечь и удержать разработчиков, openai за последние два года снизила стоимость доступа к своему api на 99% — стратегия, которая может быть ответом на вызовы со стороны конкурентов.

openai не представила на этой конференции разработчиков новую передовую модель искусственного интеллекта. вместо этого она сосредоточилась на построении экосистемы, решив сосредоточиться на том, чтобы помочь разработчикам связаться друг с другом и получить более глубокое понимание новых функций и продуктов искусственного интеллекта. поскольку openai превращается из революционера отрасли в поставщика платформ, ее успех будет зависеть от ее способности развивать динамичную экосистему разработчиков. предоставляя более совершенные инструменты, снижая затраты и увеличивая поддержку, openai заложила прочную основу для дальнейшего роста и стабильности в области искусственного интеллекта. хотя прямое влияние этой стратегии может быть неочевидным, ожидается, что в конечном итоге она приведет к устойчивому и более глубокому внедрению ии в более широком спектре отраслей.

на этой конференции разработчиков openai представила четыре основные инновации: тонкую настройку видения, api реального времени, дистилляцию моделей и оперативное кэширование. эти новые инструменты знаменуют собой сдвиг стратегического фокуса openai от прямой конкуренции в приложениях для конечных пользователей к расширению возможностей экосистемы разработчиков.

01 оперативное кэширование: инструмент экономии денег для разработчиков

на конференции разработчиков openai анонсировала революционную функцию — оперативное кэширование, которая позволит значительно сократить затраты разработчиков и задержки в работе. эта функция может автоматически идентифицировать и кэшировать входные токены, недавно обработанные моделью, и предоставлять скидки до 50 % на эти кэшированные токены. это огромное преимущество для приложений, которые часто используют один и тот же контекст.

«мы усердно работали», — сказал гудмонт, руководитель продукта платформы openai. «оглянитесь назад, два года назад, gpt-3 был доминирующим лидером рынка. сегодня мы успешно снизили стоимость в 1000 раз. я не могу вспомнить какую-либо другую технологию, которая могла бы добиться такого значительного снижения затрат за два года. ."

такое значительное снижение затрат открывает предприятиям и стартапам всех размеров возможность исследовать новые приложения, особенно проекты, запуск которых был отложен из-за проблем с затратами. теперь это наконец-то возможно.

02 визуальная тонкая настройка: новая эра визуального искусственного интеллекта

еще одним важным объявлением является введение возможностей визуальной тонкой настройки для последней модели большого языка openai, gpt-4o. эта новая функция позволяет разработчикам использовать изображения и текст для настройки визуального понимания своих моделей. последствия этой функции имеют далеко идущие последствия и могут оказать существенное влияние на такие области, как беспилотные автомобили, медицинская визуализация и возможности визуального поиска.

openai сообщила, что компания grab, занимающаяся доставкой еды и такси в юго-восточной азии, уже использует эту технологию для улучшения своих картографических услуг. используя всего 100 примеров, grab добился улучшения точности подсчета полос на 20 % и улучшения местоположения знаков ограничения скорости на 13 %. это реальное приложение демонстрирует, как точная визуальная настройка может использовать небольшие объемы данных визуального обучения, чтобы значительно улучшить возможности служб искусственного интеллекта в различных отраслях.

03 instant api: заполнение пробела в диалоговом ии

openai также запустила общедоступную бета-версию своего мгновенного api. это новый сервис, который позволяет разработчикам создавать мультимодальные возможности с малой задержкой, особенно в приложениях преобразования речи в речь. это означает, что разработчики могут начать добавлять возможности голосового управления chatgpt в свои приложения.

чтобы продемонстрировать потенциал api, openai продемонстрировала обновленную версию приложения для планирования путешествий wanderlust, которое она показывала на прошлогодней конференции. используя мгновенный api, пользователи могут напрямую общаться с приложением, чтобы планировать свою поездку в естественной разговорной форме.

хотя планирование поездок — это лишь один из примеров, мгновенные api открывают широкий спектр возможностей для приложений с голосовым управлением в различных отраслях. от обслуживания клиентов до инструментов обучения и доступности — у разработчиков теперь есть мощные новые ресурсы для создания более интуитивно понятных и отзывчивых решений на основе искусственного интеллекта. «всякий раз, когда мы разрабатываем продукт, мы в основном думаем о стартапах и предприятиях», — объясняет гудмонт. «итак, в ходе альфа-тестирования у нас есть много предприятий, использующих api, новые модели для новых продуктов».

мгновенные api по своей сути упрощают процесс создания голосовых помощников и других диалоговых инструментов искусственного интеллекта, устраняя необходимость объединения нескольких моделей для транскрипции, вывода и преобразования текста в речь. первые пользователи, такие как приложение для тренировок по здоровью и фитнесу healthify и платформа для изучения языков speak, интегрировали мгновенные api в свои продукты. структура ценообразования instant api, хотя 0,06 доллара сша за минуту аудиоввода и 0,24 доллара сша за минуту аудиовывода, недешева, но все же может представлять значительную ценность для разработчиков, стремящихся создавать голосовые приложения.

04 дистилляция моделей: новая глава в популяризации искусственного интеллекта

openai также выпустила технологию дистилляции моделей, которая, возможно, станет ее самым революционным достижением. эта технология позволяет разработчикам использовать результаты продвинутых моделей, таких как o1-preview и gpt-4o, для повышения производительности более эффективных моделей, таких как gpt-4o mini.

это нововведение позволяет малому и микробизнесу достигать возможностей, сравнимых с крупными моделями, при меньших вычислительных затратах, тем самым разрешая давнее противоречие в индустрии искусственного интеллекта: разрыв между ресурсоёмкими и доступными, но ограниченно-функциональными системами. например, небольшой стартап в области медицинских технологий мог бы использовать технологию модельной дистилляции для разработки диагностических инструментов на базе искусственного интеллекта для сельских клиник. компания способна разработать легкую модель, которая не только работает на стандартном оборудовании, но и обеспечивает точность диагностики, приближающуюся к более крупным моделям, что, как мы надеемся, улучшит медицинскую помощь в районах с ограниченными ресурсами. (wuji, специально составлено tencent technology)