uutiset

"Price Butcher" DeepSeek käynnistää toisen suuren mallin hintasodan.

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jiemian Uutistoimittaja |. Chen Zhenfang

Käyttöliittymän uutistoimittaja | Song Jianan

DeepSeek, suuri malli "hintateurastaja", käynnisti jälleen suuren hinnanalennuksen.

Yhtiö ilmoitti äskettäin, että sen API-syöttömaksu muutetaan 0,1 yuania/miljoonaa tokenia kohti ja tuotantomaksuksi tulee 2 yuania/miljoona tokenia. Tämä tarkoittaa, että suurten mallisovellusliittymien hinta laskee vielä suuruusluokkaa.

Hinnan alennuksen syytä tutkiessaan DeepSeek selitti, että suurten mallisovellusliittymien käyttöskenaarioissa huomattava osa käyttäjien syötyksistä toistuu. Esimerkiksi käyttäjän kehotussanoissa on usein osia, joita lainataan toistuvasti, tai useilla keskustelukierroksilla edellisten kierrosten sisältö on syötettävä toistuvasti jokaisella kierroksella.

Vastauksena yllä oleviin ongelmiin DeepSeek mahdollistaa kontekstuaalista kiintolevyvälimuistitekniikkaa käyttävän ratkaisun, jonka avulla välimuistiin tallennetaan sisältöä, jota odotetaan käytettävän tulevaisuudessa uudelleen hajautetussa kiintolevyryhmässä. Jos syötteessä on kaksoiskappaleita, kaksoisosat tarvitsee vain lukea välimuistista ilman laskentaa. Tämä on myös syynä isojen mallien hinnanalennukseen tällä kertaa.

DeepSeek huomautti, että kontekstuaalinen kiintolevyn välimuistitekniikka ei voi vain vähentää palvelun latenssia, vaan myös vähentää merkittävästi loppukäyttökustannuksia.

DeepSeek on myös ensimmäinen suuri mallivalmistaja maailmassa, joka käyttää kiintolevyn välimuistia laajassa mittakaavassa API-palveluissa. Tämä johtuu pääasiassa DeepSeekV2:n ehdottamasta MLA-rakenteesta - samalla kun se parantaa mallin vaikutusta, se pakkaa huomattavasti kontekstin KVCache-kokoa, mikä vähentää huomattavasti tallennuksen vaatimaa lähetyskaistanleveyttä ja tallennuskapasiteettia, joten se voidaan tallentaa välimuistiin halvalla. kovalevyjä.

Lisäksi DeepSeekAPI-palvelu on suunniteltu 1 biljoonan päivittäiseen kapasiteettiin, eikä käyttäjille ole olemassa virta- tai samanaikaisuusrajoituksia.

Tämä ei ole ensimmäinen kerta, kun yritys laskee hintoja. Tämän vuoden toukokuusta lähtien häiriötekijä DeepSeek on ottanut johtoaseman API-hintasodan käynnistämisessä.

Jo 25. huhtikuuta DeepSeek hinnoitteli API:n hintaan 1 yuania/miljoonaa syöttötokenia ja 2 yuania/miljoona tuottotokenia. Toukokuun 6. päivänä DeepSeek julkaisi avoimen lähdekoodinMoEMallissa on pienemmät parametrit ja vahvemmat ominaisuudet. API on alennettu 1 yuania/miljoonaa lähtötokeneita kohti. Hinta on noinGPT sadasosa 4 Turbosta.

Tämä hinnanalennus sai nopeasti aikaan vastauksia koko toimialalta, kun Zhipu AI, Huoshan Engine, Baidu, Tencent, Alibaba Cloud jne. ilmoittivat hinnanalennuksista peräkkäin.

Niiden joukossa Alibaba Cloud ilmoitti, että Tongyi Qianwenin ydinmalli Qwen-Long on pudonnut 97%, ja hinta alennuksen jälkeen on vain 0,0005 yuania/tuhat rahaketta. Baidu ja Tencent ovat peräkkäin ilmoittaneet, että jotkut suuret mallit ovat ilmaisia.

Ja ulkomailla,OpenAIGPT 4o:n julkaisun jälkeen ilmoitettiin, että sen käyttö olisi ilmaista ja API-puhelun hinta puolittuisi.

On syytä huomata, että Volcano Enginen tapahtumassa 15. toukokuuta Volcano Enginen presidentti Tan Dai ilmoitti, että pro-32k papupussin yleismallin hinta on vain 0,0008 yuania/tuhat merkkiä samat tekniset tiedot markkinoilla on yleensä 0,12 yuania/ Tuhannet rahakkeet ovat 150 kertaa papupussimallin hinta. Säkkipussimallien hinnoittelu on 99,3 % halvempi kuin teollisuuden, mikä ajaa suurten mallien hinnat "sentien aikakauteen".

Tan Dai huomautti, että kustannusten alentaminen on yksi avaintekijöistä suurten mallien edistämisessä "arvonluontivaiheeseen". Suurten mallirullien hinta auttaa yrityksiä nopeuttamaan liiketoimintaa pienemmillä kustannuksilla.

Tuolloin Volcano Enginen sisäpiiriläinen kertoi Jiemian Newsille: "Todellinen syy Doubaon suurten mallien hinnanalennukseen on se, että suurten mallien soveltamista yrityspuolella ei ole vielä kehitetty ja skenaarioita on liian vähän." huomautti, että vaikka teollisuudessa keskustellaan tekoälyn suurten mallien käytöstä Rekonstruoimalla liiketoimintaa, mutta jokapäiväisessä työssä ja elämässä on harvoin kokea suurten malliominaisuuksien käyttöönottoa "Hintojen alentaminen alentaa olennaisesti kynnystä käyttöön."

Alentamisen näkökulmasta tuotantopanosten hinnanalennus on yleensä suurempi kuin tuotantohinnan aleneminen. Suurin osa edullisista tuotteista on kevyitä malliversioita, jotka soveltuvat vain lyhytaikaiseen käyttöön pienille ja keskisuurille yrityksille sekä yksittäisille kehittäjille alhaisella taajuudella, vähäisellä perustelumäärällä ja yksinkertaisilla tehtävillä.

Kaiken kaikkiaan suuret mallit ovat vielä markkinoiden viljelyvaiheessa. Tällä hetkellä API-hintojen alentaminen on enemmän suurten mallinvalmistajien asiakashankintastrategiaa, jotta useammat yritykset pääsevät käsiksi omiin liiketoimintaskenaarioihinsa, edistävät suurten mallien soveltamista eri toimialoilla ja nopeuttavat edelleen kaupallistamista. Tämä aloite auttaa houkuttelemaan kehittäjiä ja kumppaneita, luo nopeasti ekosysteemin ja tarjoaa myös laajemman tilan innovatiivisille sovelluksille eri aloilla.

Hintojen alentaminen tai vapauttaminen tarkoittaa sitä, että useammat yritykset ja kehittäjät voivat nopeasti käyttää suuria malleja.

On kuitenkin selvää, että suurten mallien kaupallistamisen suljettua silmukkaa on vaikea saada päätökseen pelkällä API-liiketoiminnalla. "Mikään iso malliyritys ei selviä myymällä API:ita." FA (taloudellinen konsultti), joka on aiemmin kiinnittänyt huomiota suureen malliteollisuuteen, kertoi Jiemian Newsille.

Cheetah Mobilen puheenjohtaja ja toimitusjohtaja Fu Sheng uskoo myös, että suuret hinnanalennukset julistavat periaatteessa, että suurten startup-yritysten on löydettävä uusia liiketoimintamalleja. Eniten pudotuksia ovat kärsineet pilvipalveluita tarjoavat suuret yritykset, jotka hankkivat pilviasiakkaita suurilla malleilla "Villa tulee sikasta, joten suurilla startupilla ei ole sellaista." ekosysteemiin ja täytyy löytää toinen liiketoimintamalli.

Toisin kuin ensimmäisellä hinnanalennuksella, DeepSeekin käynnistämän hintasodan edessä monet suuret malliyritykset eivät ole vielä seuranneet asiaa, ja harvat ovat esittäneet asiaankuuluvia kommentteja. Toinen hinnanalennus osoittaa kuitenkin, että suurten mallien osallistava aikakausi on tulossa ja vertikaalisen sovellusekosysteemin odotetaan kukoistavan edelleen.