Nvidian ympyrä ja tukahduttaminen

NVIDIA:n ympäröiminen ja tukahduttaminen |

2024-08-01

Teksti｜ Qiu Xiaofen

Qiu Xiaofenin ja Yang Xiaon haastattelu

Toimittaja｜ Su Jianxun Yang Xuan

vastustaa

Salainen WeChat-ryhmä leviää suullisesti AI-siruyritysten keskuudessa Shanghaissa. Ryhmän nimi on "Domestic Chip Group Warming Group". jopa kilpailijat vaihtavat tietoja ja vaihtavat liiketoimintaresursseja.

"Kotimainen siruryhmä lämmöstä" on rajannut aselevon vyöhykkeen, jossa kollegat voivat tilapäisesti tehdä aselevon ja auttaa toisiaan vain siksi, että kaikilla on yhteinen vihollinen: NVIDIA.

Nvidian olemassaolon vuoksi kotimaisten siruyritysten myynti on kokenut hieman nöyryytystä.

Li Ming (salanimi) on kotimaisen GPU-yrityksen myyjä. Tekoälybuumin alkaessa hän meni tapaamaan asiakkaita, mutta ei ehtinyt moikkaamaan.

"Mitä eroa on NVIDIA:n A100-siruun verrattuna? Mitä sinulla on NVIDIA:ssa (Tekijän huomautus: NVLink yhdistää useita GPU-siruja estääkseen GPU-tietojen siirtämisen suorittimeen laskentatehokkuutta parantavia laskelmia varten)

Li Mingin tiimi näki, etteivät he pystyneet tekemään vaikutusta asiakkaisiin tuotteillaan ja teknologioillaan, joten he alkoivat miettiä tapoja luottaa yhteyksiin ja löytää "voimakkaampia ihmisiä" lobbaamaan, mutta asiakkaat heiluttivat silti käsiään ja sanoivat: "Haluamme edelleen käyttää NVIDIA."

NVIDIA A100, jossa on 54 miljardia transistoria pakattuna 826 neliömillimetrin alueelle, on avain suurten tekoälymallien taikalaatikon avaamiseen.

Suuri mallikoulutus on kuin "eliksiirien jalostaminen" massiivisessa datassa, jonka tarkoituksena on selvittää datan muutosten mallit;NVIDIA-sirujen käyttäminen suurten mallien kouluttamiseen on kuin pyytäisi satoja miljoonia ihmisiä, joiden älykkyysosamäärä on 200, tekemään laskelmia, kun taas muiden sirujen vaikutus vastaa vain tuhansia ihmisiä, joiden älykkyysosamäärä on 100, tekemään laskelmia.

NVIDIA A100 -kuvat NVIDIA:n viralliselta verkkosivustolta

Kaikki huipputeknologiayritykset kiirehtivät ostamaan Nvidian. Kenellä on eniten NVIDIA high-end -grafiikkasuorittimia, on mahdollisuus kouluttaa älykkäämpiä suuria malleja.

Julkiset tiedot osoittavat, että OpenAI hallitsee tällä hetkellä eniten NVIDIA-luokan grafiikkasuorituksia, ainakin 50 000 kappaletta Google ja Meta omistavat myös Wanka-klustereita (noin 26 000, ja Internet on harvinaista). verkko Nvidian huippuluokan GPU Wanka -klustereilla Suurin on ByteDance (13 000).

NVIDIA monopolisoi globaalin teollisuusketjun parhaat resurssit – sillä on TSMC:n runsain kehittynyt siruvalmistuskapasiteetti, sillä on maailman suurin käyttäjäryhmä insinöörejä ja se hallitsee monien tekoälyyritysten laskentaa.

Absoluuttinen monopoli synnyttää usein tyytymättömyyttä, vihaa ja pakenemista.

"Kaikki, jotka tekevät suuria malleja nykyään, menettävät rahaa vakavasti! Vain yksi tekee rahaa! NVIDIA", alan sisäpiiriläinen sanoi vihaisesti."NVIDIAn voittomarginaali tekee kaikista asiakkaista epämukavaa ja vahingoittaa tekoälyteollisuutta!".

Taloudellinen raportti osoittaa, että Nvidian bruttokate oli 71 %, joista suosituilla tuotteilla A100 ja H100 on jopa 90 %. Laitteistoyrityksenä Nvidian bruttomarginaalit ovat itse asiassa korkeammat kuin Internet-ohjelmistoyritykset.

Korkeat hinnat ja valtavat voitot saivat Nvidian suurasiakkaat pakenemaan. Apple ilmoitti 30. heinäkuuta, että sen tekoälymalli oli koulutettu 8 000 Googlen TPU:lla, kun taas NVIDIAn sisältö oli 0. Heti kun uutinen julkaistiin, NVIDIAn osakekurssi laski yli 7 % 31. heinäkuuta, mikä on suurin pudotus menneisyyteen. kolme kuukautta, ja sen markkina-arvo haihtui 193 miljardia dollaria.Melkein menetin Pinduoduon.

NVIDIA-osakkeen hinnan laskukaavio viime vuonna

Kaikille kotimaisille GPU-yrityksille, jotka haluavat irrottaa palan Nvidiasta, vuosi 2022 on käännettävä Yhdysvalloissa Kiinassa, mutta ne kielletään nopeasti uudelleen:

Syyskuussa 2022 A100/H00:n vienti Kiinaan kiellettiin, ja NVIDIA julkaisi kastroidun version A800/H800:n lokakuussa 2023, A800/H800/L40S/RTX4090:n vienti Kiinaan kiellettiin kesäkuussa20; NVIDIA:n perustaja Huang Jenxun Se sanoi, että se ajaa kastroidut versiot L20- ja H20-siruista Kiinaan.

Kastroitu versio aiheutti kuitenkin alan voimakkaamman tuomitsemisen. Nvidian tuleva H20 on puolet Nvidian H100:n hinnasta, mutta sen suorituskyky on vain 1/3 entisestä. Tekoälyteollisuuden henkilö tuomitsi vihaisesti - " Eikö tämä ole vain rahan varastamista? Puhdasta IQ-veroa! "

Kun Nvidian asiakkaat tulivat tyytymättömiksi ja vihaisiksi, ne kotimaiset siruyritykset, jotka halusivat korvata Nvidian, "ravisivat" tästä tunteesta.

Aiemmin he saattoivat vain seurata Nvidian persettä ja syödä vähän kakkua. Puolijohdeanalyysiyrityksen TechInsightsin tietojen mukaan Nvidian markkinaosuus datakeskusten GPU-toimituksissa nousee jopa 98 prosenttiin vuonna 2023. Kotimaiset sirut ja kaikki sirujättiläiset yhteensä,Vain vajaat 2%.

Nyt kun kielto on tullut, täydellinen Nvidia on repeytynyt Kiinan markkinoilla. Kuka voi korvata Nvidian? Kotimaiset AI-sirujen valmistajat näkevät toivoa.

"Tänä vuonna 90 % NVIDIA:n markkinoista Kiinassa on vapautettu.Pystytkö tarttumaan siihen vai et, riippuu kyvystäsi.", sanoi kotimaisen GPU-yrityksen perustaja.

36 Krypton julkaisi kerran "Deep Krypton | CATL: Cracks in the Trillion Battery Empire" vuonna 2021. Tehoakkuteollisuudessa CATL on vertaansa vailla, ja kilpailijat katselevat sitä.

Nykyään Nvidia, joka on hallitseva toimija AI-sirujen alalla, on myös monien vertaisten mielestä piikki lihassa. Erona Nvidian ja Nvidian välillä on kuitenkin se, että sen esteet ovat korkeammat ja ero vastustajiin on. vielä leveämpi.

Yritämme löytää "halkeamia" NVIDIA:n vastustajien vastustuksen kautta, vaikka kotimaiset GPU- ja AI-sirujen valmistajat ovatkin heikkoja, he ymmärtävät Kiinan markkinoita paremmin ja heidän pelimenetelmänsä ovat lokalisoidumpia Intel, AMD jne. Vakiintuneilla sirujättiläisillä on riittävästi ammuksia Nvidian kohtaamiseen.

Lyhyellä aikavälillä Nvidiaa ei voiteta, mutta se ei pysy vahingoittumattomana. Tästä on tarkoitus tulla verinen sota.

Hajota

Jos haluat murtautua läpi, sinun on löydettävä vastustajasi heikkoudet.Yksi Nvidian heikkouksista: ylimielisyys.

Siruteollisuus on pohjimmiltaan To B -ohjelmistoteollisuutta. Asiakkaat tarvitsevat "liitännäisiä" palveluita sirujen valmistajilta, kuten laitteiston virheenkorjausta ja ohjelmistojen ja laitteistojen yhteensopivuutta.

Monet kotimaiset siruasiantuntijat kertoivat kuitenkin 36Kr:lle, että Kiinan markkinoilla, lukuun ottamatta suuria ostajia, joilla on miljardien mittakaava, kuten BAT ja Byte, useimpien muiden yritysten on lähes vaikea saada investointeja Nvidialta, vaikka niiden transaktiovolyymi saavuttaisi kymmeniä miljoonia Myynnin jälkeinen palvelu.

Toisin sanoen, kun NVIDIA-siruja käyttävillä kiinalaisinsinööreillä on epäilyksiä, he voivat luottaa vain itseensä etsiessään asiakirjoja NVIDIAn viralliselta verkkosivustolta tai mennä yhteisöön oppimaan itse.

Kun tehdään yhteistyötä NVIDIAn kanssa, kiinalaisten asiakkaiden erilaiset tarpeet eivät useinkaan täyty.Sirualan henkilö kertoi 36Kr:lle, että Nvidia mainostaa yleensä huippuluokan ja kalleimpia kokonaisratkaisuja Kiinassa, kun asiakkaat tekevät räätälöityjä pyyntöjä kortin ostamisen jälkeen itse tai etsi tehokas algoritmiyritys, joka tekee sen."

Tämä Nvidian lähestymistapa on kerännyt monia valituksia pieniltä ja keskisuurilta asiakkailta. "Nvidia suurena valmistajana ei enää kiinnitä niin paljon huomiota pieniin asiakkaisiin kuin ennen. Heidän tuotteillaan ei ole haastajia eikä heidän tarvitse tehdä lujasti töitä miellyttääkseen asiakkaita", sanoi edellä mainittu henkilö.

Mutta aiemmin NVIDIA-ekosysteemin nousu itse asiassa vahvisti palveluiden tärkeyden siruteollisuudelle: Vuonna 2006, kun CUDA-ekosysteemi juuri alkoi, NVIDIA-tuotteet eivät olleet yhtä hyviä kuin nykypäivän kotimaiset sirut. Mutta NVIDIA-tiimi aloitti ensin yliopistojen tieteellisistä tutkimusryhmistä ja tunkeutui sitten kunkin alasektorin startup-yrityksiin mukauttaakseen ohjelmistoja ja laitteistoja, ja vasta sitten siitä tuli suuri maa tänään.

NVIDIA H100 Lähde: NVIDIAn virallinen verkkosivusto

Myös kiinalaiset siruvalmistajat ovat ymmärtäneet tämän ja yrittävät aloittaa asiakaspalvelusta.

Eräs kotimainen AI-siruyritys, joka haluaa pysyä nimettömänä, on vuodesta 2023 lähtien yrittänyt tuoda t&k-työn taustahenkilöstöä etulinjaan tarjoamaan henkilökohtaisia palveluita – ei vain olemaan paikan päällä yhteistä koulutusta varten, vaan myös tarjoamaan asiakkaille oma T&K-henkilöstön ryhmä myyntitilauksen tekemisen jälkeen. Asiakasyksikköhinnat vaihtelevat muutamasta miljoonasta satoihin tuhansiin, ja neuvolasta saa 24/7.

Pelkkä paikallisten ja huomaavaisten palvelujen tarjoaminen ei riitä, kun NVIDIA vetäytyi Kiinasta.Siruteollisuus ei ole enää pelkkä taistelu itse sirutuotteiden välillä. , mutta myös testaa heidän käsityksensä aikaikkunasta. Kiinalaiset siruvalmistajat hyökkäsivät heihin kuin susilauma, ja kiivas tarjouskilpailu alkoi.

Huawei on tulossa kovimmin. Huawei teki aiemmin yhteistyötä iFlytekin kanssa vapauttaakseen "Spark All-in-One" -laitteen, joka oli varustettu "Ascend 910B" -laitteella.

Tämän sirun sanottiin kerran olevan "verrattavissa NVIDIA A100:aan" yhden kortin ominaisuuksien suhteen. Mitä ei tiedetä, on loistavan tapauksen vaikea puoli – 36 Krypton sai tietää, että Huawei ei epäröinyt maksaa työvoimakustannuksia ja lähetti satoja insinöörejä auttamaan iFlytekiä säätämään parametreja.

Huawei ja iFlytek julkaisevat Spark all-in-one -koneen, lähde: iFlytek

Vaikka teollisuudessa tätä kutsutaan "käsintehdyksi", monet suuret malliyritykset ja Internet-yritykset laajensivat oliivipuun oksaa Huaweille testattavaksi heti vertailutapauksen ilmestymisen jälkeen.

Kotimainen sirumyyntiyritys oli yllättynyt huomatessaan, että viime vuoden heinäkuusta lähtien Huawein korkean tason johto on nähtävissä missä tahansa julkisesti kilpailutetussa älylaskentakeskuksen projektissa. ”Huawei voi nyt lähettää satoja ihmisiä projektiin mennä palvelemaan ja jopa menettää rahaa joissakin avainprojekteissa saadakseen tuloja muista projekteista."

Edellä mainitulla nimettömällä siruyhtiöllä on myös 200 kovaa ydinmyyjää – hyvin harvinainen kokoonpano kotimaisessa siruteollisuudessa. Heidän myyntitiiminsä aloitti kolmelta kuumimmalta alalta suurten mallien toteutuksen, rahoituksen, lakien ja teollisuuden osalta, ja se esiintyi lähes kaikissa laskentatehoon liittyvissä näyttelyissä "Siruteollisuudessa resurssit ovat etusijalla. Jos juoksee hitaasti, kuolet "Kadonnut".

Myös piilotettu hintasota kotimaisista siruista on alkanut.

Sirualan henkilö kertoi 36Kr:lle, että heidän tavoitteenaan on saada lisää tilauksia benchmark-älykkäille laskentakeskuksille yksikköhinnasta riippumatta. 36 Krypton on havainnut, että kustannusten alentamiseksi jotkin kotimaiset yritykset eivät epäröi poistaa kalliita HBM-muistia (high-bandwidth memory) päättelykorteistaan ja jopaToimitetaan 50 % omakustannushintaa halvemmalla.

"Riippumatta siitä, kaikki toivovat silti murtautuvansa läpi eri sisääntulopaikoista ja kukin ottavansa pienen palan kakusta NVIDIAsta, jotta NVIDIA ei ole enää ainoa."

Mutta todellisuus on julma Mitä tulee tuotteisiin, kotimaisilla tekoälysiruilla on väistämättä erilaisia ongelmia.

Siruasiantuntija antoi esimerkin 36Kr:stä: Saman tietojoukon käsittely NVIDIAn A100-klusterilla voi kestää vain kymmenen päivää, mutta joidenkin kotimaisten sirutuotteiden käyttäminen voi kestää useita kuukausia.Kotimaisen sirulaitteiston kertymisaika on liian lyhyt, ja kehittyneistä prosesseista ja laitteistosta puuttuu puute, mikä johtaa alhaiseen tehokkuuteen.

Ohjelmistopuutteet ovat myös ilmeisiä. Toinen alan henkilö testasi ja havaitsi, että kun käytät kotimaisia siruja suurten mallien pyörittämiseen, jos haluat tehdä siinä enemmän hienoja sovelluksia, kun iso perusmalli on vaihdettu, kotimaiset sirut ovat alttiita kaatumisille "Monissa tapauksissa käytämme kotimaisia siruja." Periaatteessa pidät nenästäsi ja käytät sitä."

Nyt jokainen yritys on todella nähnyt selvästi käsillä olevan "piirin ja tukahduttamisen" strategian ja on vähitellen eriytynyt realistisemmiksi poluiksi:

Vaikka jotkut ryhmät jatkavat siirtymistä Wanka-klusteriin keskittyen koulutusskenaarioihin ja tiukasti NVIDIA:n kanssa, jota edustavat Moore Threads ja Huawei, mutta suurin osa ryhmittymistä päättää keskittyä enemmän suurten mallien käyttöön. pienet mallit eri toimialoilla Eri toimialojen toteuttaminen alkaa perusteluista, jotka eivät vaadi korkeaa laitteistoa ja ohjelmistoa, joita edustavat Suiyuan, Tianshu Zhixin jne.

(36Kr Huomautus: Suurilla malleilla on kaksi linkkiä: koulutus ja päättely: koulutus on prosessi, jossa etsitään malleja miljardeista tietokannoista."tehdä"Suuri malli;"käyttää"Suurten mallien prosessi on helpompi ja vaikeampiPienemmät laitteisto- ja ohjelmistovaatimukset, tiiviimpi yhteys teollisuuteen)

Moore Thread julkaisee Kua'e Wanka -klusterin vuoden 2024 tekoälykonferenssissa 36 krypton laukausta

"Emme jahtaa sokeasti Nvidiaa nyt. Meillä ei ole varaa kuroa kiinni, emmekä uskalla tehdä sokeasti siruja erittäin suurella laskentateholla", sirualan henkilö sanoi suoraan.

Kotimaisille siruvalmistajille realistinen näkökohta on, että NvidianPääpaino ei ole täällä, ja kotimaiset valmistajat ovat välttäneet Nvidian rintamasodan.

Aiemmin useimmat yritykset käyttivät NVIDIA-kuluttajatason pelinäytönohjainkortteja 4090 tehdäkseen päätelmiä kustannusnäkökohtien perusteella. Näillä korteilla oli paljon ongelmia: liiallinen virrankulutus, riittämätön muisti ja pois käytöstä. Nvidian viranomaiset eivät myöskään salli näiden kuluttajatason näytönohjainten käyttöä suurten mallipäätelmien tekemiseen.

Kotimaiset siruyritykset ovat tulleet NVIDIA:n aukkoon. Sekä Tianshu Zhixin että Suiyuan ajavat päättelykortteja, jotka kilpailevat 4090:n kanssa tänä vuonna, ja niiden myyntivaltteja ovat suuri muisti, alhainen virrankulutus ja vakaa tarjonta.

Kotimaiset siruvalmistajat ovat myös tehneet selväksi markkinasegmenttien tunnistamisen tärkeyden. Esimerkiksi joissakin virrankulutuksellisissa skenaarioissa keskitymme pienitehoisiin pieniin siruihin tai voimme sukeltaa erikoisskenaarioihin, kuten videon optimointiin tehdäksemme pientä mutta kaunista liiketoimintaa.

Jättiläisten taistelukenttä on jännittynyt.

Kun kotimaiset GPU-yritykset kirjoittavat PPT:hen "ylittää NVIDIA", se on enemmän kuin kaunis visio. Tätä yritysryhmää ei ole vakiinnutettu pitkään aikaan ja se on saavuttanut kotimaisen korvaamisen trendin Nvidiaa pidetään sekä kilpailijana että vertailukohtana.

Mutta mitä tulee Inteliin ja AMD:hen, jotka ovat iältaan verrattavissa Nvidiaan, ilmapiiri on vielä kireämpi.

“Sisäisesti pidämme Nvidiaa kuolevaisena vihollisenamme", AMD:n MI-sarjan tuotelinjan kehittäjä kertoi 36Kr.

Taipei Computer Showssa (Computex 2024) tämän vuoden kesäkuussa AMD:n perustaja Su Zifeng (hän on myös Nvidian perustajan Huang Jen-Hsunin serkku) myös selvensi ensimmäistä kertaa tulevaa AMD:n tuoterytmiä GPU-iteroimalla uutta. joka vuosi GPU-tuotteet noudattavat Nvidian päivitysrytmiä.

Melkein joka kerta, kun Nvidia julkaisee GPU:n, AMD ostaa sen markkinoilta ja purkaa sen välittömästi verratakseen sitä tuotteisiin, joita ei ole vielä julkaistu.

"Meidän on lisättävä tähän joitain ominaisuuksia (indikaattoreita) ja nostettava parametreja siellä." He tavoittelevat sitä, että "laitteisto ei voi jäädä NVIDIA:sta ja parametrit ovat hieman parempia", edellä mainittu henkilö mainitsi 36 Kryptonille.

Su Zifeng julkaisi Instinct MI325X:n tämän vuoden Taipei Computexissa

Vuodesta 2023 lähtien AMD:n kiinalaiset ekosysteemikumppanit saavat uusia ohjelmistooptimointivaatimuksia AMD:ltä lähes joka toinen päivä. Mainostaakseen grafiikkasuoritteitaan AMD:n johtajat vaativat joskus edullisemman CPU-osaston yhdistämään GPU:t tilausten tekemiseen, mikä vaarantaa, että suorittimia ei ehkä myydä.

“AMD:n ihmiset polttavat suitsukkeita ja palvovat Buddhaa joka päivä toivoen, että voimme parantaa ekologiaa”, ekologisen yrityksen johtaja sanoi, että hänen mukaansa tällä hetkelläKiinassa on jo yli 10 pilvitoimittajaa ja To B -asiakasta, AMD-sirujen mukauttamisessa ja tehosteen tarkistuksessa.

Verrattuna ahdistuneisiin kotimaisiin siruvalmistajiin, ulkomaisten sirujättiläisten etu on laitteistotasolla, että niillä on kehittyneet prosessit ja HBM-tuotantokapasiteetti jossain määrin.

Viralliset tiedot osoittavat, että AMD:n tuote (MI300X julkaistiin joulukuussa 2023) väitti aiemmin, että laskentateho on 1,2 kertaa Nvidia H100:n laskentateho;

Intelin tuote (Gaudi 3 julkaistiin huhtikuussa 2024) ylittää myös reilusti H100:n energiatehokkuudessa ja päättelysuorituskyvyssä. Tietysti se on myös halvempi AMD:n GPU-hinta on noin 70-80% Nvidian vertailutuotteista.

Mutta kaikki valmistajat, jotka ovat aggressiivisia Nvidian kanssa, kohtaavat yhteisen ongelman:Riippumatta siitä, kuinka vahva laitteistomme on, se jää heikon ohjelmiston varjoon, aivan kuten piipun puutteet.

Aikakaudella, jolloin grafiikkasuoritteita voitiin käyttää vain graafiseen laskentaan, NVIDIA:n lanseeraama ohjelmistoalusta CUDA vastasi kehittäjille ohjelmointirajapintojen tarjoamista, mikä antoi heille mahdollisuuden kirjoittaa laskentaohjelmia vapaasti GPU:lle tutuimman ohjelmointikielellä. kanssa.

"Sallikaa minun antaa sinulle vertaus. Miksi CUDA ei voi ylittää sitä? Tuntuu kuin oppisit kieltä ja olisit työskennellyt tällä kielellä niin monta vuotta. Jos pyydän sinua vaihtamaan kieltä, tunnetko olosi epämukavaksi? oletko valmis?" Siruyhtiön työntekijä antoi 36 Kr esimerkin.

CUDA on Nvidian ohjelmistoekosysteemin syvin este.Jopa Intel ja AMD, jotka ovat suuria yrityksiä, eivät voi ohittaa muita lyhyessä ajassa.

Intelin GPU-tiimin entinen työntekijä kertoi 36Kr:lle, että he olivat ottaneet käyttöön yli 3 000 insinööriä ympäri maailmaa ja investoineet kolme tai neljä vuotta, mutta paransivat tarkkuutta vain 0 %:sta 4 %:iin – he käyttivät Intelin siruja muotokuvan muuntamiseen ja odottivat. Pitkän ajan kuluttua tieto katosi siihen pisteeseen, että "se ei ollut enää ihmisen kasvot".

Intelin toimitusjohtaja Kissinger julkaisee Gaudin sirusarjan

"Kana ja muna" -virhe tulee jälleen esiin. Juuri siksi, että monet ihmiset eivät käytä AMD- ja Intel-grafiikkasuorittimia ja vielä harvemmat käyttävät niitä vastaavia ohjelmistoalustoja (ROCm, oneAPI), joten kenenkään on vaikea hyödyntää todellista laitteistokykyään.

"NVIDIAn CUDA:ssa on aina ollut niin monia kehittäjiä, jotka ovat toistaneet algoritmeja, auttaneet NVIDIAa tekemään johtopäätöksiä ja harjoittelemaan erittäin tehokkaasti. Tämän seurauksena NVIDIAlla on aina ollut neuvotteluvoimaa ja se tietää aina, mitä sen seuraavan sirun pitäisi tehdä, mutta tämä on AMD. Se on päänsärky sekä Intelille että Intelille", AMD-ekosysteemiyhtiön toimitusjohtaja sanoi suoraan.AMD:n ohjelmistotyökalu ROCm on "kuten NVIDIAn CUDA 20 vuotta sitten".

Mutta loppupään asiakkaille tämä riski syntyy.

Suuren mallin tarkistaminen on luontaisesti kokeilu, jossa on epävarmuutta. Jos haluat silti käyttää sitä sirulla, jota ei ole vahvistettu, se vastaa kahden hallitsemattoman muuttujan yhdistämistä - Nvidiasta luopuminen tarkoittaa, että joudut maksamaan valtavat siirtokustannukset epävarmuus.

Tästä huolimatta Nvidian saartaminen ja tukahduttaminen on edelleen taistelu, joka on taisteltava AMD:n ja Intelin puolesta.

Maailmanlaajuinen siruarkkitehtuuri on jaettu kolmeen osaan: X86-arkkitehtuuri ohjaa PC-kenttää, ja sitä hallitsevat Intel ja AMD, ja NVIDIA hallitsee tekoälymarkkinoita.

Lähes puolentoista vuoden aikana sen jälkeen, kun uusi tekoälyvallankumous aloitti aikakauden, Nvidia ylitti kerran 3 biljoonan dollarin markkina-arvon rajan, mikä vastaa nyt 7 Intelin + AMD:n yhdistettyä markkina-arvoa.

20 vuoden kuluttua sirujättiläisten Nvidian "piirittäminen ja tukahduttaminen",Se oli toinen ahdistunut taistelu, ja se oli myös myöhäinen vastahyökkäys.

todellinen halkeama

Kun kotimaiset AI-siruyritykset muodostavat muurahaisarmeijan, AMD ja Intel menevät täysin pois. Onko Nvidia todella järkyttynyt tällaisen piirityksen edessä?

NVIDIA-imperiumin halkeamat leviävät hiljaa.

Signaali, jonka suhteen Nvidian on oltava valppaana, on se, että OpenAI, Google, Microsoft... nämä suuret asiakkaat, jotka ovat lataaneet Nvidiaa AI-uskonsa vuoksi, ovat ottamassa ensimmäisen askeleen "anti-Nvidian" suuntaan.

Itsekehitetyt pelimerkit ovat shakkipeli, jota useat yritykset ovat suunnitelleet pitkään. Googlen TPU-tiimin entinen ydintyöntekijä kertoi 36Kr:lle, että Google, joka käyttää 1/4 maailman laskentatehosta,"Emme välttämättä osta ulkoisia siruja vuoden loppuun mennessä."

Aiemmin Googlen itse kehittämä TPU perustui enemmän kustannusnäkökohtiin. Esimerkiksi Nvidia nostaisi hintoja tai tarjonta ei olisi tarpeeksi vakaa. Nyt Googlen ydinstrategia on radikaalimpi."Melkein hinnasta riippumatta."

OpenAI:lla on lukemattomia valmisteluja He aikovat kerätä jopa 7 biljoonaa dollaria rakentaakseen uuden AI-siruimperiumin.

Kotimaassa 36 Kr oppi myös monista lähteistä--Tällä hetkellä Nvidian suurimmat kotimaiset ostajat Alibaba, Byte ja Baidu tutkivat pohjimmiltaan salaa siruja suuriin mallikoulutukseen.

Ulkomaisten pilvivalmistajien, suurten mallivalmistajien ja tähtisiruvalmistajien tuotekehitys, 36 Kr kattava tiedonkeruu ja kartoitus

Itse kehitetyt sirut ovat kuitenkin pitkän tähtäimen ratkaisu näille suurille asiakkaille. Toinen lyhyen aikavälin suunnitelma näille suurille asiakkaille on kokeilla Nvidian kilpailijoiden tuotteita ja vähentää heidän riippuvuuttaan Nvidiasta.

AMD on tämä Plan B. AMD:n sisäpiiriläinen kertoi 36 Kr:lle,AMD:n GPU-tuotteet ovat jo avanneet suuria asiakasmarkkinoita Euroopassa, Yhdysvalloissa, Etelä-Koreassa ja muissa paikoissa...Microsoft on ostanut kymmeniä tuhansia AMD-tuotteita, ja myös Tesla, Midjourney, U.S. National Laboratory ja Korea Telecom ovat ottaneet tuotteet vastaan erissä.

Kiinassa AMD Ecosystemin työntekijä Chen Wen sanoi, että satoja tietyn mallin AMD-kiihdytinkortteja toimitetaan vuonna 2023. Vaikka niitä ei ole paljon, "mutta tätä AMD-tuotetta ei ole koskaan löydetty Kiinasta ennen."

AMD:n aiempien optimististen arvioiden mukaan datakeskusten GPU:t tuovat AMD:lle jopa 2 miljardin dollarin tuloja vuoden 2024 loppuun mennessä.

Vaikka kiinalaisten siruvalmistajien muurahaisarmeija ei ole vielä muodostanut merkittävää uhkaa Nvidialle, sen kipinät ovat vähitellen saamassa vauhtia.

36Kr sai tietää, että nyt kotimaisten koulutus- ja päättelysirujen myynti on hypännyt uudelle tasolle - ilahduttava ja myönteinen signaali on, että Internet-yritykset ja suuret malliyritykset, jotka tunnetaan Kiinan vaikeimmin voitettavana tilauksena, ovat alkaneet sijoittaa kotimaisiin siruihin Valmistaja avasi suunsa.

36 Kr:n mukaan tällä hetkelläAscend Chip on kamppaillut murtautuakseen Internet-yritysten järjestelmään, mukaan lukien Baidu.

Lisäksi kotimaiset tekoälyyritykset, kuten Zhipu AI, MiniMax ja Step Star, kouluttavat kaikki suuria malleja biljoonien parametrien kanssa. Kun NVIDIAn huippuluokan sirut ovat kuitenkin rajallisia, suuret malliyritykset valitsevat yleensä "sekakoulutuksen" (eli NVIDIA +). muut sirut), kutenZhipu AI:n klusteri varaa lähes puolet Shengteng-siruista.

Lisäksi Tianshu Zhixinin ja Suiyuanin päätelmätuotteet ovat toimittaneet kymmeniä tuhansia kappaleita. Toimituskanavat sisältävät suuria kotimaisia älykkäitä laskentakeskuksia Kunlun Chip Tässä kahden viimeisimmän sukupolven päättelysirujen kumulatiiviset toimitukset ovat 30 000-50 000 kappaletta, joista puolet on lähetyksiä Baidusta ja ulkoisista kanavista.

"Nvidian nykyiset hinta- ja tarjontatasot ovat testauksen rajalla, voivatko kaikki tehdä sen ja miten.", alan sisäpiiriläinen sanoi suoraan.

NVIDIAn perustaja Huang Jenxun Picture Source Visual China

Jos tarkastellaan pidemmälle seuraavaa kolmesta viiteen vuoteen, uusia uhkia Nvidialle ilmaantuu vähitellen.

Alan markkinoille on ilmaantunut myös upouusia AI-siruarkkitehtuureja kuin GPU:t – esimerkiksi Piilaakson siruyhtiö Groq, joka lanseerasi aiemmin LPU-arkkitehtuurin, väittää ajavansa suuria kielimalleja "kymmenen kertaa nopeammin" kuin Nvidian GPU:t;

On myös Silicon Valley -siru Etched, joka on julkaissut suuren mallin ASIC-sirun, joka väittää olevansa "suuruusluokkaa nopeampi" kuin Nvidian GPU: t. Näitä startup-yrityksiä tukevat tähtisijoituskokoonpanot, kuten OpenAI.

36Kr sai tietää, että Kiinassa on tänä vuonna syntynyt upouusia tekoälysirujen startup-yrityksiä. Esimerkiksi Shanghai tuki hiljattain salaa kahta uutta AI-siruyritystä.

Kotimaisen TPU-yrityksen Zhonghao Xinyingin toimitusjohtaja Yang Gongyifan sanoi, että GPU:n yleinen käyttöaste on itse asiassa ilmeinen, vaikka uudet arkkitehtuurit, kuten TPU ja ASIC, eivät ole kovin monipuolisia , niiden transistorit Käyttöaste voi nousta 60-100 %:iin "Seuraavien kolmen tai viiden vuoden aikana tulee varmasti olemaan suuri määrä AI-siruja GPU-arkkitehtuurin ulkopuolella kotimaassa ja ulkomailla."

Pienikin riittää ravistamaan jättimäistä NVIDIAa.

"Luuletko, että NVIDIAlla ei näytä olevan kilpailijoita ulkopuolelta? Se ei todellakaan pidä paikkaansa", NVIDIAn työntekijä kertoi 36Kr. Kuten Huang Renxun usein sanoo: "Meillä on vain 30 päivää ennen konkurssia."

NVIDIA on valmistautunut yli kymmenen vuotta, ja sitten törmäsi nerokkaaseen yritykseen, kuten OpenAI, ja he yhdessä katalysoivat NVIDIAn ihmettä. Aiemmin puolijohdeteollisuudella ei ollut pulaa tarinoista jättiläisten ohittamisesta mutkissa.

Taistelun savu Nvidian piirittämiseksi ja tukahduttamiseksi on jo syttynyt.

loppu

uutiset

NVIDIA:n ympäröiminen ja tukahduttaminen |

Johdanto

yhteystietoni