новости

ценовая война на крупные модели привела к отрицательной валовой прибыли

2024-09-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


внутренняя конкуренция за выбывание крупных моделей усиливается. этот раунд ликвидации продлится один или два года, и только несколько компаний базовой модели, обладающих реальной силой, смогут продолжать выживать.

статья | у цзюнюй, специальный обозреватель журнала «финансы»

редактор | се лилун

ценовая война за крупные модели на китайском рынке продолжается уже почти полгода. этот раунд ценовой войны достиг отрицательной валовой прибыли и в настоящее время не показывает никаких признаков прекращения. ведущие поставщики облачных технологий все еще планируют новый раунд снижения цен. этот раунд снижения цен будет реализован в конце сентября этого года.

в мае этого года китайские поставщики облачных технологий начали ценовую войну за вычислительную мощность для вывода больших моделей. облачные сервисы bytedance volcano engine, alibaba cloud, baidu smart cloud и tencent cloud последовательно снизили стоимость вычислительной мощности для вывода больших моделей более чем на 90%.

чтобы использовать большую модель, вам необходимо ввести язык подсказок и получить вывод содержимого посредством рассуждений. этот процесс будет вызывать api (интерфейс прикладного программирования, аналогичный переключателю воды и электричества) и платить в зависимости от количества потребленных токенов (токен — это текстовая единица большой модели, токен может быть словом, знаком пунктуации, числом, символ и др.). это все равно, что платить за воду и электричество.

после снижения цен потребление вычислительной мощности вывода действительно быстро растет. в августе этого года телеконференция baidu по доходам за второй квартал показала, что среднее количество ежедневных вызовов api baidu wenxin big model в мае составило 200 миллионов, а в августе среднесуточное потребление токенов увеличилось до 600 миллионов; август. оно выросло до 1 трлн. в августе этого года компания bytedance объявила, что по состоянию на июль среднесуточное использование токенов модели bytedance doubao превысило 500 миллиардов. по сравнению с маем среднесуточное использование токенов на компанию увеличилось в 22 раза.

цены на токены упали более чем на 90%. в краткосрочной перспективе это снизит доходы поставщиков облачных услуг. однако поставщики облачных технологий надеются использовать этот метод, чтобы снизить порог проб и ошибок для корпоративных клиентов, что приведет к более чем 10-кратному экспоненциальному росту потребления вычислительной мощности и, в конечном итоге, к достижению долгосрочного роста доходов.

ценовая война за вычислительную мощность на внутреннем рынке больших моделей длится уже полгода. на данный момент существуют три основных факта:

во-первых, предполагаемая ценовая война за вычислительную мощность уже привела к отрицательной валовой прибыли. недавно руководители многих поставщиков облачных услуг, в том числе alibaba cloud и baidu smart cloud, сообщили нам, что до мая этого года валовая прибыль отечественных вычислительных мощностей для вывода крупномасштабных моделей превышала 60%, что по сути было таким же, как и в прошлом году. чем у международных аналогов. после того, как крупные производители последовательно снизили цены в мае этого года, валовая прибыль вычислительных мощностей для вывода упала до отрицательных значений.

во-вторых, по сравнению с моделями openai тех же характеристик цена отечественных моделей обычно составляет всего 20–50%. валовая прибыль отечественных больших моделей гораздо ниже, чем у openai. в исследовательском отчете futuresearch, международной организации по исследованию рынка, в августе этого года говорится, что валовая прибыль флагманской модели openai серии gpt-4 составляет примерно 75%, а валовая прибыль основной модели серии gpt-4o составляет примерно 55%. общая валовая прибыль openai составляет не менее 40%.

в-третьих, недостаточные возможности модели являются важной причиной ценовых войн. ключевой человек, отвечающий за крупный модельный бизнес поставщика облачных услуг, считает, что в настоящее время существует разрыв между возможностями отечественных флагманских моделей и флагманскими моделями openai серии gpt-4, поэтому клиентов следует поощрять к попыткам совершать ошибки посредством снижения цен. . поскольку цены на модели продолжают падать, цена больше не является главной проблемой для корпоративных клиентов. возможности и эффекты модели — это то, что больше всего волнует корпоративных клиентов.

необходимо вести ценовую войну

мы проверили цены на логические выводы для крупных моделей, объявленные alibaba cloud, volcano engine, baidu smart cloud, tencent cloud и официальным сайтом openai. по сравнению с моделями openai той же спецификации цена отечественных моделей обычно составляет всего 20–50%.

в качестве примера возьмем tongyi qianwen-max от alibaba, ernie-4.0-8k от baidu и hunyuan-pro от tencent. выходные цены трех моделей за миллион токенов составляют 120 юаней, 120 юаней и 100 юаней соответственно. выходная цена их эталонной флагманской модели openai gpt-4-turbo составляет 210 юаней за миллион токенов (цена, указанная на официальном сайте openai, составляет 30 долларов сша, которая была конвертирована на основе обменного курса доллара сша и юаня 1: 7). цена этих трех крупных отечественных моделей составляет всего около 50% от цены gpt-4-турбо.

в качестве примера возьмем qwen-long от alibaba, ernie-speed-pro-128k от baidu и внедрение hunyuan от tencent. выходные цены трех моделей за миллион токенов составляют 2 юаня, 0,8 юаня и 5 юаней соответственно. выходная цена дешевой модели openai openai gpt-4o-mini million tokens составляет 4,2 юаня (цена, указанная на официальном сайте openai, составляет 0,6 доллара сша, которая была конвертирована на основе обменного курса долларов сша и юаней 1:7). ). модели начального уровня alibaba и baidu стоят всего 48% и 19% от цены модели начального уровня openai.

ценовая война за крупные модели достигла отрицательной валовой прибыли, но это не помешало различным поставщикам облачных технологий продолжать снижать цены.

мы получили новости о том, что ведущие поставщики облачных услуг, такие как alibaba cloud, все еще планируют новый раунд снижения цен. этот раунд снижения цен будет реализован в конце сентября этого года. высокопроизводительные флагманские модели находятся в центре внимания этого раунда снижения цен.

главный человек, отвечающий за крупный модельный бизнес вышеупомянутых облачных поставщиков, считает, что в настоящее время мало возможностей для снижения цен на дешевые малогабаритные модели, а последний раунд снижения цен упал до «психологического итога». корпоративных клиентов. следующий шаг, на котором следует сосредоточиться, — будет ли каждая флагманская модель продолжать снижать цены. флагманская модель также будет подразделяться на экономичные версии, способные решить большинство проблем, а также на качественные и дорогие версии, решающие чрезвычайно сложные задачи.

вычислительная мощность больших моделей достигла отрицательной валовой прибыли, так зачем же продолжать снижать цены?

крупные производители облачных технологий смотрят на долгосрочную рыночную тенденцию — структура вычислительных мощностей облачных вычислений претерпевает радикальные изменения. захватить больше вычислительных мощностей для вывода — значит захватить больше дополнительных рынков. международная исследовательская организация idc прогнозирует, что совокупный годовой темп роста общей вычислительной мощности китая составит 16,6% в период с 2022 по 2027 год, а совокупный годовой темп роста интеллектуальной вычислительной мощности составит 33,9%. с 2022 по 2027 год в рамках интеллектуальных вычислительных мощностей доля вычислительной мощности для вывода вырастет до 72,6%, а доля вычислительной мощности для обучения снизится до 27,4%.

поставщики облачных услуг готовы отказаться от краткосрочных доходов ради ожидаемого долгосрочного роста. в краткосрочной перспективе вычислительные мощности для вывода не приносят большого дохода. технический специалист китайского поставщика облачных технологий пояснил, что согласно модели выручка каждой компании не превысит 1 миллиард юаней в 2024 году, что ограничено на рынке с десятками миллиардов доходов в год. поставщики облачных технологий готовы смириться с краткосрочными потерями доходов и потерями бизнеса в ближайшие один-два года. все делают ставку на то, что количество вызовов крупных моделей увеличится в геометрической прогрессии как минимум в 10 раз в ближайшие один-два года. в конечном счете, долгосрочный рост доходов может компенсировать краткосрочные потери доходов.

далее он пояснил, что в этом процессе стоимость вычислительной мощности будет постепенно снижаться по мере роста потребительского спроса. у крупного модельного бизнеса еще есть возможность со временем добиться положительной прибыли. даже если ставка не сбудется, группа производителей моделей погибнет в ценовой войне, а выжившие производители подберут себе осколки.

разные поставщики облачных услуг также руководствуются разными конкурентными соображениями, когда сталкиваются с ценовыми войнами: volcano engine, alibaba cloud и baidu smart cloud участвуют в ценовой войне, которую необходимо вести.

volcano engine в настоящее время не входит в пятерку лучших на рынке общедоступных облаков китая, но в 2023 году ее выручка вырастет более чем на 150%. большие модели — это важная возможность догнать облачный рынок. тан дай, президент volcano engine, упомянул нам в мае этого года, что в марте этого года он обнаружил в кремниевой долине, что предпринимательство в области приложений искусственного интеллекта в соединенных штатах демонстрирует тенденцию ранней стадии мобильного интернета в китае с 2012 по 2014 год. «небольшая команда, запускающая приложения искусственного интеллекта, быстро добилась дохода и финансирования. китайский рынок может продемонстрировать эту тенденцию в будущем. но предпосылка состоит в том, что цена вывода должна быть снижена, а порог для проб и ошибок должен быть снижен».

alibaba cloud занимает первое место на рынке общедоступных облаков китая. столкнувшись со снижением цен со стороны конкурентов, alibaba cloud должна принять соответствующие меры. лю вэйгуан, генеральный менеджер подразделения публичного облака alibaba cloud, в июне этого года проанализировал, что alibaba cloud прошла несколько этапов внутренних выводов и расчетов и обнаружила два противоречия:

  • во-первых, после снижения цен существующий доход уменьшится, а дополнительный доход увеличится. в идеале дополнительный доход может покрыть существующий доход.

  • во-вторых, как реагировать, если конкуренты снизят цены более агрессивно. окончательный вывод заключается в том, что масштаб теперь важнее прибыли. alibaba cloud хочет использовать крупные модели для увеличения проникновения облачных вычислений во всю отрасль.

baidu intelligent cloud считает ии своей основной стратегией. в июле этого года технический директор baidu по крупным моделям прямо сказал нам, что большие модели — это битва, в которой необходимо победить, и ценовую войну необходимо вести любой ценой. эта стратегия дала реальные результаты. темпы роста доходов baidu smart cloud во втором квартале 2024 года выросли до 14%, самого высокого показателя за последние два года. руководство baidu сообщило во втором квартале 2024 года о доходах, что доля доходов от крупных моделей baidu intelligent cloud увеличилась с 4,8% в четвертом квартале 2023 года до 9% во втором квартале 2024 года.

специалист по стратегическому планированию искусственного интеллекта из ведущей китайской технологической компании проанализировал, что volcano engine поддерживается bytedance, а рекламный бизнес материнской компании может представлять собой переливание крови. volcano engine не входит в пятерку лидеров облачного рынка и надеется захватить большую долю рынка посредством ценовых войн. alibaba cloud в основном состоит из четырех основных компонентов публичного облака (вычисления, хранилище, сеть и база данных). низкая цена будет способствовать потреблению бизнес-данных клиентов, тем самым стимулируя продажи вышеупомянутых базовых облачных продуктов. крупные модели являются основной стратегией baidu. baidu была первой компанией, которая развернула крупный модельный бизнес в китае. когда другие конкуренты решают начать ценовую войну, baidu должна последовать этому примеру.

цена не является решающим фактором

обратная сторона ценовых войн на основе больших моделей и отрицательной валовой прибыли заключается в том, что низкая цена не является основным фактором, определяющим, будут ли корпоративные клиенты использовать большие модели.

главный человек, отвечающий за крупный модельный бизнес вышеупомянутых поставщиков облачных услуг, считает, что поставщики облачных вычислений не могут рассчитывать на долгосрочное сжигание денег и убытков для содействия внедрению индустрии крупных моделей. низкопроизводительная и дешевая модель не имеет смысла. недостаточные возможности модели являются важной причиной ценовых войн с отрицательной валовой прибылью. поскольку цены на отечественные модели значительно упали, цена больше не является наиболее важным фактором для корпоративных клиентов. возможности и эффекты модели — это то, что больше всего волнует корпоративных клиентов.

ит-директор страховой компании согласился. он прямо заявил, что в настоящее время доля ит-расходов в финансовой и страховой отрасли в доходах компаний составляет около 3–5%. если исключить 80% расходов на аппаратное обеспечение, то только 20% расходов на ит фактически используются для цифровой трансформации. при использовании новой технологии, такой как большие модели, необходимо рассчитывать соотношение затрат и выхода. помимо явных затрат на модели, необходимо также учитывать неявные затраты: крупные модели должны быть совместимы с существующими ит-системами, требуется управление данными для подготовки бизнес-данных для крупных моделей, а также необходимо нанять группу менеджеров по продуктам, которые разбираются в искусственном интеллекте. больше всего его беспокоят возможности модели и практические эффекты.

центр исследований фундаментальных моделей (crfm) стэнфордского университета проводит долгосрочные глобальные рейтинги тестирования больших моделей. рейтинг крупномасштабных тестов многозадачного понимания языка (mmlu) по состоянию на 17 сентября показывает, что в первую десятку производителей моделей входят серия claude 3.5 от ai-стартапа anthropic (инвестируемая amazon), серия llama3.1 от meta и openai (серия gpt-4, принадлежащая microsoft investment) и серия gemini 1.5, принадлежащая google. на данный момент среди крупных китайских моделей в десятке лучших находится только tongyi qianwen 2 instruct (72b), принадлежащая alibaba.

технический персонал крупных моделей многих китайских облачных поставщиков выразил caijing ту же точку зрения: на рынке крупных моделей стратегия низкой производительности и низкой цены нежизнеспособна. идеальная ситуация – создать здоровый и устойчивый замкнутый цикл бизнеса, опирающийся на высокую производительность и разумные цены.

более ценный тест — openai. по состоянию на сентябрь этого года openai имеет 1 миллиард активных пользователей в месяц и 11 миллионов платных пользователей (включая 10 миллионов платных индивидуальных подписчиков и 1 миллион корпоративных подписчиков). в мае этого года руководство openai объявило о годовом доходе компании (годовой доход равен доходу за текущий месяц × 12. компании-разработчики программного обеспечения, работающие по подписке, ежемесячно продлевают пользовательскую подписку и имеют стабильные ожидания дохода, поэтому они часто используют годовой уровень дохода). достигнуто 3,4 миллиарда долларов сша (пересчитано по обменному курсу доллара сша и юаня 1:7, примерно 24,1 миллиарда юаней).

в последнем исследовательском отчете futuresearch, международной организации по исследованию рынка, структура доходов компании рассчитана на основе годового дохода и структуры платных пользователей, объявленных openai: 10 миллионов индивидуальных подписчиков принесли доход в размере 1,9 миллиарда долларов сша, что составляет 56%; подписчики предприятий принесли доход в размере 710 миллионов долларов сша, что составляет 21%, вызовы api принесли доход в размере 510 миллионов долларов сша, что составляет 15%.

даже после нескольких раундов снижения цен openai все еще может поддерживать относительно здоровую валовую прибыль. в апреле этого года цена флагманской модели openai gpt-4-turbo была снижена на 67%. в августе этого года выходная цена основной модели openai gpt-4o была снижена на 30%. в исследовательском отчете, опубликованном futuresearch в августе этого года, говорится, что валовая прибыль флагманской модели openai серии gpt-4 составляет примерно 75%, а валовая прибыль основной модели серии gpt-4o составляет примерно 55%. общая валовая прибыль openai составляет не менее 40%.

openai имеет уникальную среду роста. он не только имеет достаточную вычислительную мощность, но также имеет огромное количество пользователей to c (для потребительских клиентов), а также находится на крупнейшем в мире рынке программного обеспечения to b (для корпоративных клиентов).

успешный опыт openai за последние два года показывает, что он полагается на большие вычислительные мощности для «грубой силы, чтобы творить чудеса». китайским компаниям не хватает вычислительных мощностей и среды финансирования, таких как openai. вычислительная мощность является ключевым недостатком китайских производителей моделей.

технический специалист китайского поставщика облачных технологий объяснил, что за последний год или около того китайские поставщики облачных вычислений заплатили более чем в 1,5 раза большую стоимость покупки ии-чипов nvidia, что привело к поддержанию высокой стоимости вычислительной мощности модели. это повлияет на верхний предел производительности больших моделей, а также затруднит промышленное внедрение больших моделей. по словам дилера серверов, стоимость серверов с восемью картами, оснащенных ai-чипами серии nvidia h100/h800, на китайском рынке в 2023 году однажды превысила 3 ​​миллиона юаней за единицу, что более чем в 1,5 раза превышает официальную цену nvidia.

как китайским компаниям найти подходящий им путь развития, когда вычислительные ресурсы ограничены, а стоимость вычислений высока? это требует тщательного планирования и адаптации.

в последние два года разработка больших моделей следовала закону масштабирования (закон, предложенный openai в 2020 году, дословно переводится как «закон масштабирования») — производительность модели в основном связана с объемом вычислений, количеством параметров модели и объем обучающих данных.

основной человек, отвечающий за крупный модельный бизнес вышеупомянутых поставщиков облачных услуг, отметил, что основной принцип заключается в улучшении качества и количества данных в соответствии с ограничениями закона о масштабировании и соответствующим образом уменьшении параметров модели (moe (mixture of experts)). стратегия проектирования также может использоваться для смешивания нескольких моделей (профессиональная модель для повышения производительности). архитектура повышает производительность модели и снижает затраты на логические выводы. когда дело доходит до реализации конкретной бизнес-стратегии, есть два варианта.

  • во-первых, улучшите производительность модели и уменьшите ее размер за счет увеличения качества/количества данных, оптимизации алгоритмов и архитектуры. это может эффективно снизить потребление вычислительной мощности, улучшить эффективность основных приложений и адаптироваться к основному рыночному спросу.

  • во-вторых, принять более точную и сегментированную модель продуктовой стратегии. вместо того чтобы полагаться на несколько моделей для решения всех проблем, позвольте разным моделям решать разные проблемы. например, пусть экономически эффективная модель выйдет на экономический рынок, а высококачественная модель — на рынок высокого класса.

три модели openai в этом году — gpt-4, gpt-4turbo и gpt-4o — развивались в этом направлении. параметры модели gpt-4o меньше, чем у gpt-4, но она позволяет точно решать большинство повседневных задач. gpt-4 turbo используется для решения более сложных задач. последняя предварительная версия openai o1 имеет самую высокую производительность. она прошла обучение с подкреплением и больше не является отдельной моделью. прежде чем выдать ответ, она будет постоянно думать, чтобы расширить возможности модели. выходная цена одного миллиона токенов для этих трех моделей составляет соответственно 70 юаней, 210 юаней и 420 юаней (цены, указанные на официальном сайте openai, составляют 10 долларов сша, 30 долларов сша и 60 долларов сша, которые были конвертированы на основе по курсу доллара сша и юаня 1:7).

нокаутирующее ускорение

ценовая война с отрицательной валовой прибылью ускоряет ликвидацию рынка крупных моделей. многие инсайдеры отрасли выразили caijing такое же мнение. этот раунд ликвидации продлится один или два года, и только 3-5 компаний базовой модели смогут продолжать выживать.

ань сяопэн, исполнительный член китайского комитета 100 по информатизации и директор исследовательского центра облачных интеллектуальных технологий alibaba, сказал caijing в июле этого года, что большие модели требуют постоянных инвестиций, возможности иметь 10 000 или даже 100 000 карт и коммерческой отдачи. многие компании не имеют таких возможностей. в будущем на китайском рынке останется всего три-пять производителей базовых моделей.

разработка крупных моделей требует приобретения чипов и серверов, а также аренды земли для строительства центров обработки данных. эти инвестиции могут даже достигать десятков миллиардов юаней в год. эти затраты будут отражены в капитальных затратах технологических компаний. отчет microsoft о прибылях и убытках за четвертый квартал 2024 финансового года показал, что почти все капитальные затраты в размере 19 миллиардов долларов сша за этот месяц были потрачены на вычислительные мощности. в прошлом году (с третьего квартала 2023 года по второй квартал 2024 года) капитальные затраты alibaba, tencent и baidu достигли 23,2 млрд юаней, 23,1 млрд юаней и 11,3 млрд юаней соответственно, увеличившись на 77,1%. 154,1% и 46,9% соответственно. это результат инвестиций в вычислительные мощности.

в дополнение к десяткам миллиардов юаней постоянных инвестиций в вычислительную мощность, крупный бизнес модельного вывода также требует субсидий в размере одного миллиарда юаней в год. руководитель китайского поставщика облачных технологий проанализировал, что отрицательная валовая прибыль от крупных вызовов модели означает, что чем больше вызовов будет сделано в краткосрочной перспективе, тем больше будут потери. согласно текущему потреблению вычислительной мощности для вывода, несколько ведущих облачных поставщиков, участвующих в ценовой войне, будут субсидировать потребление вычислительной мощности для вывода больших моделей более чем на один миллиард юаней в 2024 году.

alibaba cloud, volcano engine, baidu smart cloud и tencent cloud могут полагаться на крупную модель группы в борьбе с ценовыми войнами, но крупным стартапам сложно выжить. вышеупомянутые специалисты по стратегическому планированию искусственного интеллекта ведущих технологических компаний китая считают, что alibaba cloud и volcano engine имеют самую сильную кровь в этом раунде ценовых войн. alibaba может зарабатывать деньги в облаке, а volcano engine владеет рекламным бизнесом bytedance по переливанию крови. в ценовой войне baidu не так хороша, как alibaba и bytedance. однако большая модель wenxin от baidu имеет мощные технологии и будет иметь группу клиентов, готовых платить за эту технологию. это поможет baidu пережить ценовую войну.

крупные модельные стартапы должны полагаться на крупных производителей и финансирование, чтобы выжить в краткосрочной перспективе. технический специалист крупной начинающей модельной компании рассказал caijing в сентябре этого года, что zhipu ai, baichuan intelligence, dark side of the moon, zero one thing и minimax, «пять маленьких тигров» отечественных больших моделей, вложены в от алибаба. один из методов инвестирования заключается в том, что сумма инвестиций выплачивается в виде вычислительной мощности, а инвестируемая компания использует вычислительную мощность alibaba cloud. смогут ли «пять маленьких тигров» продолжать выживать, в определенной степени зависит от того, продолжит ли али инвестировать.

технический персонал вышеупомянутых ведущих поставщиков облачных технологий и технический персонал вышеупомянутых компаний-стартапов крупных моделей также считают, что стартапы крупных моделей на китайском рынке столкнутся с испытаниями в ближайшие два года. им прорваться на рынок базовых моделей. в будущем может быть три выхода: либо чтобы стать компанией по разработке моделей государственных и корпоративных проектов, вы должны либо обратиться к вертикальной отраслевой модели to b, либо к рынку приложений to. с. фактически дифференциация рынка уже началась. zhipu ai выигрывает большое количество тендеров на правительственные и корпоративные проекты, в то время как dark side of the moon фокусируется только на рынке to c.

редактор | цинь лисинь