notizia

"Price Butcher" DeepSeek lancia un'altra grande guerra dei prezzi dei modelli. Qualcuno darà seguito questa volta?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Giornalista di notizie Jiemian |. Chen Zhenfang

Redattore di notizie sull'interfaccia |

DeepSeek, il grande modello “macellaio di prezzi”, ha lanciato ancora una volta un forte taglio dei prezzi.

Recentemente, la società ha annunciato che la tariffa di input API sarà adeguata a 0,1 yuan/milione di token e la tariffa di output sarà di 2 yuan/milione di token. Ciò significa che il prezzo delle API di modelli di grandi dimensioni verrà ridotto di un altro ordine di grandezza.

Indagando sul motivo della riduzione del prezzo, DeepSeek ha spiegato che negli scenari di utilizzo delle API di modelli di grandi dimensioni, una parte considerevole degli input degli utenti viene ripetuta. Ad esempio, le parole suggerite dall'utente spesso hanno alcune parti che vengono citate ripetutamente oppure, in più cicli di dialogo, il contenuto dei cicli precedenti deve essere inserito ripetutamente in ogni ciclo.

In risposta ai problemi di cui sopra, DeepSeek consente una soluzione che utilizza la tecnologia di caching contestuale del disco rigido per memorizzare nella cache il contenuto che si prevede venga riutilizzato in futuro in un array di dischi rigidi distribuito. Se sono presenti duplicati nell'input, le parti duplicate devono solo essere lette dalla cache senza calcoli. Questo è anche il motivo della riduzione dei prezzi dei modelli di grandi dimensioni questa volta.

DeepSeek ha sottolineato che la tecnologia di caching contestuale del disco rigido può non solo ridurre la latenza del servizio, ma anche ridurre significativamente i costi di utilizzo finale.

DeepSeek è anche il primo grande produttore di modelli al mondo a utilizzare su larga scala il caching del disco rigido nei servizi API. Ciò è dovuto principalmente alla struttura MLA proposta da DeepSeekV2: migliorando l'effetto del modello, comprime notevolmente la dimensione del contesto KVCache, riducendo notevolmente la larghezza di banda di trasmissione e la capacità di archiviazione richiesta per l'archiviazione, in modo che possa essere memorizzato nella cache a basso costo dischi rigidi.

Inoltre, il servizio DeepSeekAPI è progettato con una capacità giornaliera di 1 trilione e non ci sono limiti attuali o di concorrenza per gli utenti.

Non è la prima volta che l'azienda taglia i prezzi. Da maggio di quest’anno, il disgregatore DeepSeek ha preso l’iniziativa di lanciare una guerra dei prezzi delle API.

Già il 25 aprile, DeepSeek prezzava l'API a 1 yuan/milione di token di input e 2 yuan/milione di token di output. Il 6 maggio DeepSeek ha rilasciato l'open sourceMinistero dell'IstruzioneIl modello ha parametri inferiori e capacità più potenti. L'API è ridotta a 1 yuan/milione di token di input e 2 yuan/milione di token di outputGPT Un centesimo di 4 Turbo.

Questa riduzione dei prezzi ha innescato rapidamente le reazioni dell’intero settore, con Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud, ecc. che hanno annunciato uno dopo l’altro tagli dei prezzi.

Tra questi, Alibaba Cloud ha annunciato che il modello principale Qwen-Long di Tongyi Qianwen è sceso del 97% e che il prezzo dopo la riduzione è di soli 0,0005 yuan/migliaia di token. Baidu e Tencent hanno successivamente annunciato che alcuni modelli di grandi dimensioni sono gratuiti.

E all'estero,IA apertaDopo il rilascio di GPT 4o, è stato annunciato che sarebbe stato gratuito e il prezzo delle chiamate API sarebbe stato dimezzato.

Vale la pena notare che durante un evento di Volcano Engine il 15 maggio, Tan Dai, presidente di Volcano Engine, ha annunciato che il prezzo del modello universale del pouf pro-32k è di soli 0,0008 yuan/migliaia di gettoni. Il prezzo dei modelli con le stesse specifiche sul mercato sono generalmente 0,12 yuan/migliaia di gettoni sono 150 volte il prezzo del modello a sacco. Il prezzo dei modelli di pouf è più economico del 99,3% rispetto al settore, portando il prezzo dei modelli di grandi dimensioni nell'era dei "centi".

Tan Dai ha sottolineato che la riduzione dei costi è uno dei fattori chiave che promuove il passaggio dei modelli di grandi dimensioni alla "fase di creazione di valore". Il prezzo dei rotoli di modelli di grandi dimensioni aiuterà le aziende ad accelerare l'innovazione aziendale a costi inferiori.

A quel tempo, un membro di Volcano Engine disse a Jiemian News: "La vera ragione della riduzione del prezzo dei modelli di grandi dimensioni di Doubao è che l'applicazione di modelli di grandi dimensioni sul lato aziendale non è stata ancora sviluppata e ci sono troppo pochi scenari He ha sottolineato che, sebbene l’industria stia discutendo dell’uso di modelli di intelligenza artificiale di grandi dimensioni per ricostruire il business, ma nel lavoro e nella vita quotidiana, è raro sentire l’implementazione delle capacità di modelli di grandi dimensioni “La riduzione dei prezzi abbassa sostanzialmente la soglia di utilizzo”.

Dal punto di vista della riduzione, la riduzione del prezzo di input è generalmente superiore alla riduzione del prezzo di output. La maggior parte dei prodotti a prezzo ridotto sono versioni di modelli leggeri, adatte solo per un utilizzo a breve termine da parte di piccole e medie imprese e singoli sviluppatori con bassa frequenza, poco ragionamento e compiti semplici.

Nel complesso, i modelli di grandi dimensioni sono ancora nella fase di coltivazione sul mercato. Al momento, la riduzione dei prezzi delle API è più una strategia di acquisizione di clienti per i grandi produttori di modelli per consentire a più aziende di accedere ai propri scenari di business, promuovere l’applicazione di modelli di grandi dimensioni in vari settori e accelerare ulteriormente la commercializzazione. Questa iniziativa aiuta ad attrarre sviluppatori e partner, stabilisce rapidamente un ecosistema e fornisce anche uno spazio più ampio per applicazioni innovative in vari campi.

Ridurre i prezzi o renderli gratuiti significa consentire a più aziende e sviluppatori di utilizzare rapidamente modelli di grandi dimensioni. Dopotutto, consentire a più persone di partecipare è un prerequisito per lo sviluppo del settore.

Tuttavia, è ovviamente difficile completare il ciclo chiuso della commercializzazione di modelli di grandi dimensioni facendo affidamento esclusivamente sul business API. "Nessuna grande azienda di modelli sopravvive vendendo API." Ha detto a Jiemian News un FA (consulente finanziario) che in precedenza aveva prestato attenzione al grande settore dei modelli.

Anche Fu Sheng, presidente e amministratore delegato di Cheetah Mobile, ritiene che i grandi tagli dei prezzi dichiarino sostanzialmente che le startup su larga scala devono trovare nuovi modelli di business. Quelli che hanno subito i cali più gravi sono le grandi aziende con servizi cloud che utilizzano modelli di grandi dimensioni per acquisire clienti cloud. "La lana viene dal maiale, quindi puoi permetterti la riduzione. Tuttavia, le startup modello di grandi dimensioni non ne hanno." ecosistema e deve trovare un altro modello di business.

A differenza della prima tornata di tagli dei prezzi, di fronte alla guerra dei prezzi avviata da DeepSeek, molte grandi aziende modello non hanno ancora dato seguito e poche hanno fatto commenti rilevanti. Tuttavia, un’altra riduzione dei prezzi dimostra che l’era inclusiva dei modelli di grandi dimensioni sta arrivando e che si prevede che l’ecosistema delle applicazioni verticali prospererà ulteriormente.