Новости

«Мясник цен» DeepSeek начинает еще одну большую ценовую войну моделей. Будет ли кто-нибудь следить за этим на этот раз?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Репортер новостей Цземянь Чэнь Чжэньфан |

Редактор новостей интерфейса Сун Цзянань

DeepSeek, крупный модельный «мясник цен», в очередной раз начал резкое снижение цен.

Недавно компания объявила, что плата за ввод API будет скорректирована до 0,1 юаня/миллион токенов, а плата за вывод составит 2 юаня/миллион токенов. Это означает, что цена API больших моделей снизится еще на порядок.

Исследуя причину снижения цен, DeepSeek пояснил, что в сценариях использования API больших моделей значительная часть вводимых пользователем данных повторяется. Например, слова-подсказки пользователя часто содержат некоторые части, которые неоднократно цитируются, или в нескольких раундах диалога содержание предыдущих раундов должно вводиться повторно в каждом раунде.

В ответ на вышеупомянутые проблемы DeepSeek предлагает решение, использующее технологию контекстного кэширования жесткого диска для кэширования содержимого, которое, как ожидается, будет повторно использоваться в будущем в распределенном массиве жестких дисков. Если во входных данных есть дубликаты, дублирующиеся части необходимо только прочитать из кэша без вычислений. Это также является причиной снижения цен на крупные модели на этот раз.

DeepSeek отметил, что технология контекстного кэширования жесткого диска может не только сократить задержку обслуживания, но и значительно снизить конечные затраты на использование.

DeepSeek также является первым крупным производителем моделей в мире, который в больших масштабах использует кэширование жесткого диска в сервисах API. В основном это связано со структурой MLA, предложенной DeepSeekV2 — улучшая эффект модели, она сильно сжимает размер контекстного KVCache, что значительно снижает пропускную способность передачи и необходимую для хранения емкость, поэтому его можно кэшировать на недорогих жесткие диски.

Кроме того, сервис DeepSeekAPI рассчитан на ежедневную пропускную способность в 1 триллион, и для пользователей не существует текущих ограничений или ограничений по одновременному использованию.

Это не первый раз, когда компания снижает цены. С мая этого года революционер DeepSeek взял на себя инициативу в развязывании ценовой войны API.

Еще 25 апреля DeepSeek оценил API в 1 юань/миллион входных токенов и 2 юаня/миллион выходных токенов. 6 мая DeepSeek опубликовал исходный код с открытым исходным кодом.МОМодель имеет более низкие параметры и более широкие возможности. API уменьшен до 1 юаня/миллион входных токенов и 2 юаней/миллион выходных токенов. Цена указана приблизительно.ГПТ Сотая часть 4 Турбо.

Это снижение цен быстро вызвало реакцию всей отрасли: Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud и т. д. объявили о снижении цен одно за другим.

Среди них Alibaba Cloud объявила, что базовая модель Qwen-Long компании Tongyi Qianwen упала на 97%, а цена после снижения составляет всего 0,0005 юаней/тысячу токенов. Baidu и Tencent последовательно объявили, что некоторые крупные модели бесплатны.

И за границей,OpenAIПосле выпуска GPT 4o было объявлено, что его можно будет использовать бесплатно, а стоимость вызовов API снизится вдвое.

Стоит отметить, что на мероприятии Volcano Engine 15 мая Тан Дай, президент Volcano Engine, объявил, что цена универсальной модели кресла-мешка pro-32k составляет всего 0,0008 юаней/тысячу токенов. те же характеристики на рынке обычно составляют 0,12 юаня. Тысячи жетонов в 150 раз дороже модели погремушки. Цены на модели погремушек на 99,3% ниже, чем в отрасли, что приводит к тому, что цены на большие модели приближаются к «эпохе санти».

Тан Дай отметил, что снижение затрат является одним из ключевых факторов продвижения крупных моделей на «стадию создания стоимости». Цена на рулоны больших моделей поможет компаниям ускорить бизнес-инновации с меньшими затратами.

В то время инсайдер Volcano Engine сообщил Jiemian News: «Настоящая причина снижения цен на большие модели Doubao заключается в том, что применение больших моделей на стороне предприятия еще не разработано, и сценариев слишком мало». отметил, что хотя в отрасли обсуждается использование крупных моделей ИИ, реконструирующих бизнес, но в повседневной работе и жизни редко можно ощутить реализацию возможностей крупных моделей: «Снижение цен существенно снижает порог использования».

С точки зрения сокращения, снижение входных цен обычно выше, чем снижение выходных цен. Большинство продуктов по сниженной цене представляют собой облегченные версии моделей, которые подходят только для краткосрочного использования малыми и средними предприятиями и отдельными разработчиками с низкой частотой, небольшим объемом рассуждений и простыми задачами.

В целом, крупные модели все еще находятся на стадии освоения рынка. В настоящее время снижение цен на API — это скорее стратегия привлечения клиентов для производителей крупных моделей, позволяющая большему количеству компаний получить доступ к своим собственным бизнес-сценариям, способствовать применению крупных моделей в различных отраслях и еще больше ускорить коммерциализацию. Эта инициатива помогает привлечь разработчиков и партнеров, быстро создать экосистему, а также предоставляет более широкое пространство для инновационных приложений в различных областях.

Снижение цен или их бесплатность — это позволить большему количеству компаний и разработчиков быстрее использовать большие модели. Ведь предоставление возможности участвовать большему количеству людей — необходимое условие развития отрасли.

Однако очевидно, что сложно завершить замкнутый цикл коммерциализации крупных моделей, полагаясь только на бизнес API. «Ни одна крупная модельная компания не выживет, продавая API».

Фу Шэн, председатель и генеральный директор Cheetah Mobile, также считает, что значительное снижение цен по сути означает, что крупномасштабные стартапы должны найти новые бизнес-модели. Больше всего пострадали крупные компании с облачными сервисами, которые используют крупные модели для привлечения облачных клиентов. «Однако крупные модельные стартапы не имеют такого подхода». экосистемы и должны найти другую бизнес-модель.

В отличие от первого раунда снижения цен, перед лицом ценовой войны, инициированной DeepSeek, многие крупные модельные компании еще не предприняли дальнейших действий, и лишь немногие сделали соответствующие комментарии. Однако очередное снижение цен показывает, что приближается инклюзивная эра больших моделей и ожидается, что экосистема вертикальных приложений будет процветать и дальше.