новости

openai devday «нет моделей — нет новых функций», чего еще ожидать разработчикам?

2024-10-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

изображение заголовка, созданное doubao
советы: взаимодействие с разработчиком, вызов api, большая модель искусственного интеллекта, киберпанк, детали высокой четкости.

в прошлом году openai провела конференцию разработчиков (devday 2023), вызвавшую переполох в отрасли, в сан-франциско, запустив ряд новых продуктов и инструментов, включая gpt-4 turbo, поддерживающий контекст 128 кб, снижение цен на api, новый api-интерфейс assistants, и gpt-4 turbo для визуальных функций, api dall·e 3 и значительно улучшенная модель json, а также злополучные gpt и платформа gpt store, подобная app store.

генеральный директор сэм альтман с уверенностью заявил: «мы надеемся, что вы сможете приехать снова в следующем году. по сравнению с новыми результатами, которые мы тщательно строим, то, что мы выпустили сегодня, покажется очень устаревшим», что снова повышает ожидания.

после того, как только что произошел новый раунд отставок высшего руководства, приближается ежегодное мероприятие openai devday 2024, и у всех в голове возникает вопрос: что будет дальше?

однако в этом году openai devday незаметно изменил свой тон. во-первых, было объявлено, что формат конференции будет изменен: от масштабного мероприятия до серии интерактивных сессий для разработчиков в стиле роуд-шоу.

что еще более удивительно, так это то, что, согласно официальным спойлерам, openai не выпустит свою основную флагманскую модель следующего поколения во время devday, а сосредоточится на обновлениях api и сервисов для разработчиков.

вкратце: модель следующего поколения все еще жарится в духовке, поэтому не будем о ней вообще упоминать.

devday больше не является модельной конференцией, на этот раз это действительно конференция «разработчиков».

1

чего еще ждут разработчики без gpt-5 devday?

хотя openai объявила, что не будет выпускать новое поколение флагманских моделей на devday в этом году, отрасль по-прежнему возлагает большие надежды на эту конференцию разработчиков. согласно предположениям, openai может сосредоточиться на запуске новых возможностей api, таких как долгосрочное рассуждение и вызов функций, одновременно расширяя возможности агента модели, чтобы предоставить разработчикам большую автономию и возможность интеграции с другими api.

api голосового режима 4o также очень ожидается.

silicon star также пообщалась с несколькими разработчиками, чтобы понять их реальные потребности в api. в центре внимания оказались мультимодальность и производительность.

talkme — это продукт toc для изучения языков для зарубежных рынков. генеральный директор цзя цзыцзянь рассказал silicon star, что разработчики искусственного интеллекта, выезжающие за границу, обычно выбирают api openai, и небольшое количество из них используют gemini и claude. основным api, используемым talkeme, является openai плюс поддержка gemini.

«gpt-3.5 turbo практически исключен, и все перейдут на 4o-mini или 4o для улучшения бизнес-логики. для более сложных продуктов saas вы можете рассмотреть gpt-4, который имеет более сильные возможности и относительно дороже».

o1 также в настоящее время находится на рассмотрении talkme, но из-за его высокой стоимости в настоящее время он ограничивается предварительным исследованием экспериментальных функций и не может быть использован в официальном производстве приложений toc.

«возможности o1 действительно очень сильны, но с инженерной точки зрения использование o1 для некоторых, 4o для некоторых и 4omini для некоторых может в основном охватить сценарий разработки».

что касается ожиданий от openai api, цзя цзыцзянь сказал, что есть три основных момента:

во-первых, это низкая задержка.

второй — мультимодальные возможности с низкой задержкой. «часть наших мультимодальных возможностей в настоящее время использует 4o, а некоторые — gemini».

третий момент — более стабильный вывод json. «публикация openai еще не настолько строга. скорее всего, в ней будут доминировать алгоритмы ученых. в результате вывод json openai не очень стабилен. во многих сценариях лучше написать свои собственные регулярные правила. для анализа выходного текстового содержимого. в этом измерении google хуже, чем openai. если все сделано хорошо, разработчикам будет полезнее, если будет стабильный вывод json».

что касается цены, «за исключением o1, остальные цены относительно дешевые».

чэнь ян, директор по производству двигателей cocos и менеджер lao cai miao, провел анализ с точки зрения отечественных продуктов искусственного интеллекта. он рассказал silicon stars, что с точки зрения текущих возможностей и скорости отклика openai по-прежнему является самым сильным. с другой стороны, отечественные разработчики больше уделяют внимание соблюдению требований и рентабельности инвестиций, в то время как отечественные qwen, doubao, minimax и такие модели, как wenxin, также догоняют их. , а соотношение цена/качество некоторых продуктов после скидок не слабее, чем у openai.

он сказал: «будущий спрос должен быть мультимодальным. традиционные http-запросы post будут постепенно устраняться. , будущий рынок должен учитывать комплексный эффект, сочетание asr, tts, webrtc и т. д., с этой точки зрения отечественные продукты имеют большие преимущества в интеграции, и есть шанс получить преимущество в ценовой войне».

yuhe technology ориентирована на корпоративные сценарии использования. технический партнер чи гуанъяо надеется, что обновление api openai может обеспечить улучшения в двух аспектах: встроенные инженерные возможности для уменьшения или обнаружения галлюцинаций для o1, обеспечивающие более гибкие варианты использования, позволяющие пользователям указывать; использовать ли в этом запросе возможности сложного рассуждения.

1

agi может подождать, но деньги не могут ждать

смещение фокуса devday согласуется с недавней стратегией openai, направленной на более поэтапные шаги в развитии генеративного ии.

в настоящее время компания оптимизирует свои флагманские модели gpt-4o и gpt-4o mini, стремясь оставаться впереди технологий в гонке за генеративный искусственный интеллект. по некоторым оценкам, openai, похоже, утратила свое абсолютное технологическое лидерство.

одной из причин является сложность получения качественных обучающих данных. по данным originality.ai, более 35% из 1000 крупнейших веб-сайтов мира заблокировали веб-сканер openai.

исследование data provenance project массачусетского технологического института показало, что около 25% данных из «высококачественных» источников не могут быть использованы при обучении моделей ии.

чтобы решить эти проблемы со сбором данных, openai подписала серию дорогостоящих лицензионных соглашений с издателями и брокерами данных.

другой аспект давления связан с расходами на эксплуатацию компании. по данным reuters, openai ожидает, что выручка в этом году достигнет 3,7 млрд долларов сша, а убытки составят 5 млрд долларов сша, которые в основном будут использованы для оплаты расходов на операционные услуги и заработной платы сотрудников. и аренда офисов. сюда не включены другие крупные расходы, такие как стимулирование сотрудников.

чтобы решить проблему финансирования, openai продвигает новый раунд финансирования. в начале сентября появились новости о финансировании, что openai может получить инвестиции в размере 6,5 миллиардов долларов сша при оценке в 150 миллиардов долларов сша. по словам источников, эта оценка зависит от того, сможет ли openai преобразовать свою корпоративную структуру в модель получения прибыли, аналогичную модели ее конкурентов anthropic и xai.

однако последние новости заключаются в том, что apple решила не участвовать в последнем раунде финансирования на сумму 6,5 миллиардов долларов сша. кроме того, уход на прошлой неделе главного технологического директора, главного научного директора и вице-президента по исследованиям также добавил неопределенности в openai.

хотя финансовый директор openai сара фрайар 27 сентября сообщила инвесторам, что этот раунд финансирования был переподписан и его планируется закрыть до конца месяца, переговоры о финансировании еще не завершены, и участники и конкретные суммы все еще могут измениться. .

акцент на api может быть связан с финансовым давлением, с которым сталкивается openai.

согласно исследовательским отчетам и соответствующим данным, опубликованным futuresearch, годовой доход openai составляет 3,4 миллиарда долларов сша, 76% из которых приходится на платных пользователей chatgpt (подписки chatgpt plus, chatgpt enterprise и chatgpt team), а услуги интерфейса api приносят 15% доходов компании. выручка составила около 510 миллионов долларов сша.

модель обслуживания на основе api когда-то помогла таким платформам, как aws, быстро расти. поскольку все больше и больше компаний используют api-интерфейсы amazon для разработки новых продуктов или услуг, создавая тем самым сетевой эффект, ценность ее экосистемы продолжает расти.

хотя текущий прямой доход openai от api невелик, в контексте замедления темпов роста chatgpt и того, что openai предпринимает все больше шагов по развитию генеративного ии, возможно, удастся предоставить более качественные api для компаний. компания открывает новые рыночные возможности и способствует сотрудничеству с другими предприятиями. .

без gpt-5 руководители ушли и превратились в коммерческую компанию. эта серия событий указывает на то, что коммерциализация стала насущной проблемой, которую сэму альтману предстоит решить.

в течение долгого времени сэм альтман использовал превосходные навыки манипулирования общественными настроениями, одновременно управляя собственным бизнесом, что сделало его лидером среди руководителей технологической отрасли.

но не удивляйтесь, если услышите, как он рассказывает о планах openai перейти к «модели прибыли» на openai devday в сан-франциско.