소식

'가격도둑' DeepSeek이 또다시 대형 모델 가격 전쟁을 펼칠 예정이다.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jiemian 뉴스 기자 Chen Zhenfang |

인터페이스 뉴스 편집자 송지안 |

빅모델 '가격정육점' 딥시크(DeepSeek)가 또 한번 대대적인 가격 인하를 단행했다.

최근 회사는 API 입력 수수료를 0.1위안/백만 토큰으로 조정하고 출력 수수료를 2위안/백만 토큰으로 조정할 것이라고 발표했습니다. 이는 대규모 모델 API의 가격이 한 단계 더 낮아진다는 것을 의미합니다.

DeepSeek은 가격 인하 이유를 조사하면서 대형 모델 API의 사용 시나리오에서 상당한 비율의 사용자 입력이 반복된다고 설명했습니다. 예를 들어, 사용자의 프롬프트 단어에는 반복적으로 인용되는 부분이 있거나, 여러 라운드의 대화에서 매 라운드마다 이전 라운드의 내용을 반복적으로 입력해야 하는 경우가 있습니다.

위의 문제에 대응하여 DeepSeek은 상황별 하드 디스크 캐싱 기술을 사용하여 향후 분산 하드 디스크 어레이에서 재사용될 것으로 예상되는 콘텐츠를 캐시하는 솔루션을 지원합니다. 입력에 중복된 내용이 있는 경우 중복된 부분은 계산 없이 캐시에서 읽기만 하면 됩니다. 이번에 대형 모델 가격이 인하된 이유이기도 하다.

DeepSeek은 상황별 하드 디스크 캐싱 기술이 서비스 지연 시간을 줄일 뿐만 아니라 최종 사용 비용도 크게 줄일 수 있다고 지적했습니다.

DeepSeek은 API 서비스에 하드 디스크 캐싱을 대규모로 사용하는 세계 최초의 대형 모델 제조업체이기도 합니다. 이는 주로 DeepSeekV2가 제안한 MLA 구조에 기인합니다. 모델 효과를 향상시키면서 컨텍스트 KVCache의 크기를 크게 압축하여 저장에 필요한 전송 대역폭과 저장 용량을 크게 줄여 저비용으로 캐시할 수 있습니다. 하드 디스크.

또한 DeepSeekAPI 서비스는 일일 용량 1조로 설계되었으며 사용자에 대한 현재 또는 동시성 제한이 없습니다.

회사가 가격을 인하한 것은 이번이 처음이 아니다. 올해 5월부터 파괴자 DeepSeek가 API 가격 전쟁을 주도하는 데 앞장섰습니다.

4월 25일 초 DeepSeek는 API 가격을 1위안/백만 입력 토큰과 2위안/백만 출력 토큰으로 책정했습니다. 5월 6일, DeepSeek이 오픈소스를 공개했습니다.환경부이 모델은 더 낮은 매개변수와 더 강력한 기능을 가지고 있습니다. API는 1위안/100만 입력 토큰과 2위안/100만 출력 토큰으로 축소됩니다.(주) 4 터보의 100분의 1입니다.

이번 가격 인하는 Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud 등이 차례로 가격 인하를 발표하는 등 업계 전체의 반응이 빠르게 촉발되었습니다.

그중 알리바바 클라우드는 Tongyi Qianwen의 핵심 모델 Qwen-Long이 97% 하락했으며, 인하 후 가격은 0.0005위안/천 토큰에 불과하다고 발표했습니다. 바이두(Baidu)와 텐센트(Tencent)는 일부 대형 모델을 무료로 제공한다고 잇따라 발표했다.

그리고 해외에서는,오픈AIGPT 4o 출시 이후에는 무료로 사용할 수 있으며 API 호출 가격은 절반으로 인하될 것이라고 발표되었습니다.

5월 15일 Volcano Engine 행사에서 Tan Dai Volcano Engine 사장은 Pro-32k 빈백 범용 모델의 가격이 0.0008위안/천 토큰에 불과하다고 발표했습니다. 시중에 나와 있는 동일한 사양은 일반적으로 0.12위안/수천 개의 토큰이 빈백 모델 가격의 150배입니다. 빈백 모델 가격은 업계 대비 99.3% 저렴해 대형 모델 가격을 '센티 시대'로 끌어올렸다.

Tan Dai는 비용 절감이 대형 모델을 '가치 창출 단계'로 발전시키는 핵심 요소 중 하나라고 지적했습니다. 대형 모델 롤의 가격은 기업이 더 낮은 비용으로 비즈니스 혁신을 가속화하는 데 도움이 될 것입니다.

당시 화산 엔진 관계자는 Jiemian News에 "두바오 대형 모델의 가격 인하의 진짜 이유는 아직 기업 측의 대형 모델 적용이 개발되지 않았고 시나리오가 너무 적기 때문"이라고 말했다. 업계에서는 AI 대형 모델 활용을 논의하고 사업을 재구축하고 있지만 일상 업무와 생활에서는 대형 모델 역량 구현을 체감하는 경우가 거의 없다고 지적했다.

감소의 관점에서 볼 때 일반적으로 투입물 가격 감소는 산출물 가격 감소보다 높습니다. 할인된 가격의 제품은 대부분 경량 모델 버전으로 빈도가 낮고 추론량이 적으며 간단한 작업을 수행하는 중소기업 및 개인 개발자가 단기적으로 사용하는 데에만 적합합니다.

전반적으로 대형 모델은 아직 시장 개척 단계에 머물러 있다. 현재 API 가격 인하는 대형 모델 제조업체가 더 많은 기업이 자체 비즈니스 시나리오에 액세스할 수 있도록 하고 다양한 산업에서 대형 모델의 적용을 촉진하며 상용화를 더욱 가속화하기 위한 고객 확보 전략에 가깝습니다. 이 이니셔티브는 개발자와 파트너를 유치하고, 생태계를 빠르게 구축하며, 다양한 분야에서 혁신적인 애플리케이션을 위한 더 넓은 공간을 제공하는 데 도움이 됩니다.

가격을 낮추거나 무료로 만드는 것은 더 많은 회사와 개발자가 대형 모델을 빠르게 사용할 수 있도록 하는 것입니다. 결국 더 많은 사람들이 참여할 수 있도록 하는 것이 산업 발전의 전제 조건입니다.

그러나 API 사업에만 의존하여 대형 모델 상용화의 폐쇄 루프를 완성하는 것은 분명히 어렵습니다. “API를 팔아서 살아남는 대형 모델 회사는 없습니다.” 이전에 대형 모델 산업에 주목했던 한 FA(금융 컨설턴트)는 Jiemian News에 말했습니다.

Cheetah Mobile의 회장 겸 CEO인 Fu Sheng은 대규모 가격 인하가 기본적으로 대규모 스타트업이 새로운 비즈니스 모델을 찾아야 함을 선언한다고 믿습니다. 가장 큰 하락세를 겪은 곳은 클라우드 서비스를 제공하는 대기업이다. 그들은 클라우드 고객을 확보하기 위해 대형 모델을 사용한다. 생태계를 구축하고 다른 비즈니스 모델을 찾아야 합니다.

1차 가격 인하와 달리 DeepSeek이 시작한 가격 전쟁에 직면하여 많은 대형 모델 회사는 아직 후속 조치를 취하지 않았으며 관련 의견을 제시하는 사람도 거의 없습니다. 그러나 또 다른 가격 인하는 대형 모델의 포용 시대가 다가오고 있음을 의미하며, 수직적 응용 생태계가 더욱 번창할 것으로 예상됩니다.