Piilaakson jättiläinen tekee ydin, "lippu" on 2 miljardia dollaria

Piilaakson jättiläinen valmistaa ydintä, "lippu" on 2 miljardia dollaria

2024-08-01

"Chip Matters" on Tencent Technologyn puolijohdeteollisuuden tutkimussuunnitelma. Tämä numero keskittyy itse kehitettyjä AI-siruja kehittävien teknologiayritysten logiikkaan ja haasteisiin.

Kirjailija Xinchao IC A Niu

Toimittaja Su Yang

"NVIDIA-siruvaramme eivät enää pysy perässä." Suuren tekoälymalliyrityksen toimitusjohtaja sanoi suoraan.

Vientivalvonnan tiukentuessa Kiinan erikoisversioiden, kuten A800 ja H800, ostaminen on ollut vaikeaa. Sen sijaan ne on korvattu yhteensopivalla H20-versiolla maailma kutsuu sitä myös kastroiduksi versioksi. Siitä huolimatta H20 saattaa edelleen kohdata vientivalvontaa Yhdysvaltain kauppaministeriön vientivalvontamääräysten päivityksessä tämän vuoden lokakuussa.

Financial Times lainasi kahta nimetöntä Nvidiaa lähellä olevaa lähdettä sanoneen, että useat kiinalaiset yritykset olivat tilaneet yhteensä 5 miljardin dollarin arvoisia siruja Nvidialta. Samaan aikaan joitain kotimaisia siruja on tullut suurten teknologiavalmistajien näkökenttään, mutta prosessien, yhteenliittämisen ja muiden syiden vuoksi suorituskykyyn ja toimitushaasteisiin on edelleen aukkoja.

Tätä taustaa vasten monet suuret yritykset ovat aloittaneet oman tutkimuksensa ja kehittäneet peräkkäin TSMC-virtasiruja, jotka kattavat useita prosessisolmuja, kuten 5nm ja 7nm, varmistaakseen omien AI-sirujensa toimitusvarmuuden.

Vientivalvonta on kuin kaksiteräinen miekka, joka estää laskentatehon kaulan ja rajoittaa NVIDIA:n kasvua Etenkin asiakkaiden itsensä tutkimuksen yhteydessä NVIDIAn liikevaihto Manner-Kiinassa on alkanut muuttua. Tilivuonna 2022 kiinalaisten asiakkaiden osuus Nvidian markkinatuloista oli 25 prosenttia, mutta tilivuonna 2024 tämä osuus on pudonnut yksinumeroiseksi.

Nvidian osalta Manner-Kiinan piirakka on kutistumassa, ja myös Piilaakso on muuttumassa. Suuret asiakkaat, kuten Google, Apple, Meta, Amazon ja Tesla, yrittävät kaikki mennä molempiin suuntiin, käyttämällä Nvidian siruja samalla kun he tekevät omaa tutkimustaan.

Mikä logiikka on suurten kiinalaisten ja amerikkalaisten valmistajien itsekehittämien sirujen takana. Voivatko Punaisellemerelle tulvivat teknologiayritykset onnistua laskeutumaan itse kehittämillä siruilla?

01 Kova valuutta tuntuu turvalliselta vain, kun pidät sitä kädessäsi

Nykyisessä suurten mallien ja generatiivisen tekoälyn villitystilassa laskentatehosirut ovat kova valuutta teknologiayritysten käsissä, ja CoreChao IC on seurannut tätä "laskentatehon tarttumisen" hulluutta ja jännitystä artikkelissa "The Sky-high Price H100 Flows". mustalle markkinoille".

Korttien pitäminen omissa käsissä on keskeinen syy siihen, miksi suuret valmistajat kehittävät omia sirujaan.

Qianxin Technologyn puheenjohtajan Chen Wein mukaan suurilla valmistajilla on kolme valttikorttia: taattu tarjonta, kustannusten alentaminen ja tarjouskilpailu.

Monet suuret kiinalaiset valmistajat, erityisesti Internet- ja tekoälyn suuret valmistajat, kohtaavat laskentatehon toimituskatkoksia milloin tahansa kehittyneiden sirujen viennin valvonnan taustalla. Jokaisen yrityksen kehittämät sirut ovat kuitenkin pääosin sisäiseen käyttöön, ja tekniset tiedot on räätälöity heidän omiin tuotteisiinsa, eivätkä ne ole yleistuotteita.

Jättiläisille, jotka "polttavat rahaa" kerätäkseen laskentatehoa, itsetutkimus on tapa vähentää kustannuksia. "Jos volyymi on riittävän suuri ja kysyntä riittävän suuri, harkitse itsetutkimusta, muuten se ei ehkä pysty todella vähentämään kustannuksia, sanoi Wu Zihao, entinen TSMC:n tehtaan rakentamisen asiantuntija.

Vuonna 2021 Musk lanseerasi Dojo-supertietokoneen, joka on rakennettu itse kehitetyllä AI-sirulla D1 kouluttamaan TeslanAutopilotti järjestelmä. Morgan Stanleyn viimeisimmän tutkimusraportin mukaan tämä järjestelmä säästää yhteensä 6,5 miljardia dollaria Nvidian A100:aan verrattuna.

Tekoälykysynnän kasvaessa Cloud Factoryn riippuvuus GPU:sta ylittää huomattavasti CPU:n riippuvuuden. Itsetutkimus on myös Cloud Factoryn tarjouskilpailukyky saada NVIDIA-tilauksia.

Amazonin läheinen henkilö kertoi Xinchao IC:lle, että NVIDIA-kortit eivät ole halpoja. kilpailla paremmin NVIDIAn kanssa. Hyvä neuvotteluvoima.

Julkiset tiedot osoittavat, että Amazon ei ainoastaan suunnittele omia laskentapalvelimiaan, tallennuspalvelimiaan ja reitittimiään, vaan myös kehittää omaa Graviton-palvelinsiruaan.

AWS julkistaa yleisen Graviton4-prosessorin

The Informationin mukaan Amazon jatkaa hintojen alentamista korvaamalla Nvidian Gravitonilla Asiakkaat, jotka vuokraavat Graviton-palvelimia, säästävät 10–40 prosenttia laskentakustannuksissa. Nvidian näkökulmasta, jos haluat säilyttää Amazonin, maailman suurimman pilvitehdasasiakkaan, sinun on istuttava pokeripöydässä ja neuvoteltava parempi hinta.

"Tällainen voittomyönnys ei välttämättä joskus heijastu täysin alennukseen, mutta se voi näkyä allokaatiossa."

Yllämainittujen sisäpiiriläisten mukaan maailman kärkivalmistajana Nvidia antaa suoraan erittäin intuitiivisen alennuksen yksikköhinnasta, sillä on suuri negatiivinen vaikutus tuotteen hinnoittelujärjestelmään, eikä se kuitenkaan edistä tuotteen hintasuojaa , he voivat päivittää yhteenliittämislaitteita, päivittää SSD-tallennustilaa, lisätä telinekokoonpanoja jne. tarjotakseen alennuksia suurille naamioituneille asiakkaille.

On myös yleisempi etuusmenetelmä - kapasiteetin kallistus ja ensikertalaisten oikeuksien tarjoaminen.

Ensimmäisen liikkujan edun ansiosta Amazon voi asettaa koko koneen hinnan korkeammaksi lyhyellä aikavälillä ja "säästää" (alennus) rahaa koko koneen palkkiosta ja sitä tukevien ohjelmistotyökaluketjujen kierrosta.

Tarjonnan varmistamisen, kustannusten vähentämisen ja tarjouskilpailun lisäksi jotkut suuret valmistajat haluavat varmistaa oman ainutlaatuisen kilpailukykynsä kehittämällä omia sirujaan.

Fengyun Societyn varapresidentti Chen Jing mainitsi, että NVIDIA:n myymät sirut soveltuvat yleiseen tietojenkäsittelyyn, mutta ovat myös suhteellisen kalliita. Tässä tapauksessa jotkut asiakkaat tarvitsevat vain tiettyjä toimintoja , he harkitsevat itseopiskelua.

"Minun tarvitsee vain tehdä suuria mallipäätelmiä, enkä tarvitse koulutustoimintoja. Tässä tapauksessa voin suunnitella erillisen sirun, jossa on yksinkertaiset toiminnot, mutta nopeampi ja halvempi hinta", Chen Jing sanoi. "Suurilla yrityksillä, kuten Googlella ja Microsoftilla, on omat ohjelmisto- ja laitteistospesifikaationsa. Kuinka hallita melua ja mikä energiankulutustaso tulisi saavuttaa. NVIDIA ei välttämättä pysty täyttämään standardeja. Se on helpompi suunnitella itse. "

Piilaakson jättiläisistä Google on erittäin huolissaan oman arkkitehtuurin, kustannusten ja siruteknologian eriyttämisestä. Se on kehittänyt omaa AI-tensoriprosessointiyksikköään (TPU) vuodesta 2016 lähtien saavuttaakseen paremman kustannustehokkuuden suuressa ja keskisuurissa koulutuksessa. ja johtopäätöksiä ja suorituskykyä niiden varmistamiseksipilvilaskentaTuotteilla on parempi ainutlaatuisuus ja tunnettuus.

Google julkaisee kuudennen sukupolven TPU "Trilliumin"

Googlen 4. sukupolven TPU:ta koskevien tietojen mukaan verrattuna samankokoisiin järjestelmiin TPU v4 on 1,7 kertaa tehokkaampi kuin NVIDIA A100 ja 1,9 kertaa energiaa säästävämpi.

Edellä mainittujen seikkojen lisäksi ekologisesta näkökulmasta on syvempi syy - murtaa CUDA-monopoli. NVIDIAn kehittämänä ohjelmointikielenä CUDA on tärkein syy siihen, miksi GPU-hintoja on nostettu "taivaaseen" ja asiakkaiden on hyväksyttävä se.

Jos pilvitehdas ei tee itsetutkimusta, vaikka se saisikin hyvän tilaushinnan, yli 95 % palvelinkeskuksen prosessoreista käyttää edelleen NVIDIA-grafiikkasuorittimia, ja koko pilvi AI-kysyntä on edelleen CUDA:n varassa. ekosysteemi. Loppujen lopuksi Nvidian kohtalo on Nvidian käsissä.

Kun Cloud Factory varustaa datakeskukset itsekehitetyillä siruilla ja kehittää monia taustalla olevia väliohjelmistoja ja binäärikäännöstoimintoja auttaakseen asiakkaita siirtymään omaan ekosysteemiinsä, sen yhteensopivuus CUDA-ohjelmien kanssa on korkeampi ja sen yksinomainen riippuvuus vähenee vähitellen.

"Tätä kaikki pilvitehtaat tekevät. Vaikka prosessorin osuus koko datakeskuksesta on alle 4%, heidän on silti pakko tehdä tämä Asian tunteva henkilö."

02 Jos on ihmisiä ja rahaa, lopetetaan se

"On ihmisiä, rahaa, asioita, ja samalla sillä on vielä tulevaisuuden potentiaalia, joten se voidaan lopettaa."

Legend Holdingsin varapuheenjohtaja Yu Hao uskoo, että sirujen itsetutkinnan tekevien suurten valmistajien logiikka on suhteellisen sujuvaa, mikä on selvä etu.

""Ihmisten" tulee olla "lahjakkaita" ihmisiä, joilla on käytännön kokemusta sirujen koko elinkaaren ajalta, ja "rahan" tulee olla "elävää rahaa", joka edelleen tuottaa laskentateholiiketoimintaan perustuvaa tuloa. valmistajat voivat luottaa tekoälyliiketoiminnan suljettuun kiertoon arvioidakseen tulevaisuuden näkymiä. Odotetun markkinoiden kasvun myötä laskentatehon kysyntä on mitattu ja ihmisten ja rahan strateginen koordinointi on saatu päätökseen, itse kehitetyt sirut. ovat tulleet luonnollisesti", Yu Hao kertoi Xinchao IC:lle.

Sisäänpääsymaksu itse kehitetyssä pokeripöydässä alkaa kuitenkin vähintään 2 miljardista dollarista. Tämän vuoden alussa mm.OpenAI Toimitusjohtaja Sam Altman jopa huhui hullusta suunnitelmasta kerätä 7 biljoonaa dollaria pelimerkkien rakentamiseksi, vaikka mukana ollut henkilö myöhemmin kiisti huhun.

Asiaan perehtyneen henkilön mukaan "Jokainen ensimmäisen sukupolven tuotteitaan toistava yritys maksaa vähintään 2 miljardia dollaria massatuotannon lisäämisestä, jos se lasketaan 7 nanometrin välisolmun perusteella."

Lisäksi itse kehitetyt sirut ovat enimmäkseen omaan käyttöön, eikä niiden tarvitse ottaa huomioon ekosysteemin rakentamisen vaikeutta. Ran Ciyuan lainasi Sky Eagle Capitalin kumppania sanoneen: "Erikoiskäyttösirujen arkkitehtonisen suunnittelun ei yleensä tarvitse olla erityisen monimutkaista, myös sovelluksen ominaisuudet ovat erittäin selkeät ja kehitys on suhteellisen nopeaa. Siksi monille Internet Yritykset, niiden erikoissirujen kehitys on selkeässä skenaariossa, ohjelmistoekosysteemin kehittämiseen ei tarvitse kuluttaa liikaa rahaa ja aikaa, ja myös prosessin IP on kypsä."

Teoria toimii, mutta miten voimme saada itseopiskelun toimimaan onnistuneesti?

Alan tietämyksen mukaan sirujen itsetutkimus voidaan jakaa front-end- ja back-end-osiin. Etuosa on looginen suunnittelu, joka on sirun perustoiminnot. Tausta on fyysinen suunnittelu, joka on kokonaisuus, joka toteuttaa kaikki toiminnot piiriin ja nauhoittaa ne.

Kaaviokaavio itse kehitetystä siruprosessista

Yleisesti ottaen ainoat mallit, jotka pienet tiimit voivat suorittaa itsenäisesti, ovat logiikkasirun etu- ja takaosa sekä itse ohjelmistotyökaluketju, mutta silti monissa malleissa on vain 5 % itse kehitettyjä omistettuja piirejä.

Edellä mainittu asian tunteva henkilö sanoi: "Jokainen markkinoilla tekee 1/5 itse ja pyytää muita tekemään loput 4/5. Tämä on melko kypsä ekosysteemi näiden piirien IP-osoitteiden hankkimiseksi huonoja kanavia, ja jotkut ovat huonojen kanavien kautta, kuten IP-suunnitteluvalmistajien, kuten ARM, lisensointi.

Monilla tiimeillä on kyky suunnitella itsenäisesti joitain piirejä, mutta koska heidän on voitettava IP, jolla on erittäin tiukka immateriaalioikeuksien suoja, vaikka ne olisi tehty, se todennäköisesti rikkoo tietokoneen arkkitehtuuria eikä sitä voida käyttää, tai jopa loukkaa muiden ihmisten IP-oikeuksia, tämä on myös ensimmäinen este, jonka kotimaiset valmistajat kohtaavat kehittäessään omia sirujaan.

On myös joitain asioita, joita itsetutkijaryhmä ei voi suunnitella, kuten jotkut NOC:n (Network on Chip) erittäin vaikeat rakenteet.

Suunnittelu on vain osa itse kehitettyä sirua. Se sisältää myös teippien poiston, massatuotannon jne. Prosessissa voi kohdata erilaisia ongelmia, kuten nauhan katkeaminen, massatuotantokapasiteetti jne., mutta ne eivät ole itsestään. -kehitetty. Lopulta sen on ratkaistava myös joukko tukikysymyksiä, mukaan lukien teollisen ketjun integroinnin toteuttaminen.

Ulkomaailman näkökulmasta omistettu logiikkasiru on noin 500 mm², ja yleiskäyttöinen GPU voi olla 800 mm², joka sisältää kymmeniä miljardeja tai jopa satoja miljardeja transistoreita katsotaan vektoriprosessoriksi, mutta sovellusskenaarioissa se vaatii myös varastoinnin, energiankulutuksen ohjauksen, virransyötön ja yleisten käyttöolosuhteiden suunnittelua ja toteuttamista.

Lisäksi tuotteiden perimmäisenä tavoitteena on luoda erilaisuutta, joka on tehtävä oheisrajapinnalle ja koko koneelle, ja eri SKU:t tulevat näkyviin koko kone.

Toisin sanoen, itse kehitetyissä siruissa on alan ketjuintegraation ja IP-ongelmien lisäksi otettava huomioon myös tuotteen SKU:t. Logiikkasirun suunnittelu ei riitä.

Anonyyminä pysyttelevä vanhempi henkilö kertoi Xinchao IC:lle: "Monilla kotimaisilla yrityksillä ei ole tuotesuunnittelukykyä sirujen valmistuksen jälkeen, heidän on mentävä useisiin paikkoihin testaamaan heidän insinöörinsä ja yrityksen BD:t sijaitsevat Inspurissa, Sugonissa jne Joka päivä Suurten valmistajien tietokeskukset toivovat, että toinen osapuoli voi jättää itselleen pistorasian, jos testi onnistuu, onnistumisia on todella vähän.

Massatuotanto on toinen haaste suunnittelun, teippauksen ja tuotteistamisen lisäksi. Pienten ryhmien on harkittava, voivatko he varata tuotantokapasiteettia?

"Tuotos on aina erittäin kriittinen luku Fab-tehtaille."

Ensiluokkaiset valmistajat ovat periaatteessa varanneet Fab-tehtaiden uusimman tuotantokapasiteetin DTCO-vaiheen (Design Technology Collaborative Optimization) aikana. monet EDA-valmistajat.

DTC määrittää seuraavan sukupolven prosessorien suorituskykyindikaattorit tietyissä solmuissa, kuten kuinka paljon rahaa voidaan säästää ja kuinka paljon suorituskykyä voidaan parantaa järkevällä layout-suunnittelulla 3nm solmussa.

"NVIDIA ja Apple ovat aina valmiita testaamaan edistyneimpiä valmistusprosesseja. Niin kauan kuin TSMC keksii huippuluokan valmistusprosessin, vaikka tuottoa ei tunneta ja suorituskyvyn lisäystä ei tunneta, eli ennen kuin taloudellinen malli ehtii Lasketaan, että he varaavat jo tuotantokapasiteettia DTCO:n yhteistyössä Fab-tehtaiden kanssa, mikä on perustavanlaatuinen syy ensiluokkaisten valmistajien saada tuotantokapasiteettia", Wu Zihao sanoi.

Jos yhteissuunnittelua ei ole alusta alkaen, Fab-tehdas ja Fabless-tiimi, Party A ja Party B, joutuvat vaihtamaan rooleja, koska kukaan ei uskalla käyttää sitä, Fab-tehdas voi edistää uutta prosessiaan vain pala kerrallaan , alkaen pienimmän riskin prosessista.

Esimerkiksi kaivoskonesirut ovat rakenteeltaan hyvin yksinkertaisia ja hyvin pieniä, joten ne soveltuvat hyvin alkutestaukseen Samsungin 3nm sirun ensimmäinen asiakas oli kaivoslaitetehdas Kiinasta.

Wu Zihao sanoi: "Kun Fabin tehdas on onnistuneesti testannut vettä niin pienillä asiakastilauksilla, se voi yrittää massatuotantoa PC-suorittimia, matkapuhelinsiruja ja lopuksi tekoälysiruja askel askeleelta."

Tällä hetkellä suuret kotimaiset valmistajat ovat investoineet ainakin miljardeja dollareita itse kehitettyihin siruihin. Jos start-up-yritys haluaa osallistua peliin, sillä on oltava tarpeeksi varhaisia asiakkaita tai sovellusalusta, joka tukee sirujen mukauttamista ja kokeilua, tai sillä on oltava riittävä pääoma tai vahvat rahoitusmahdollisuudet olla tavattu.

Chen Wei kertoi Xinchao IC:lle, että jos se on kaupallinen yritys, jolla ei ole halpoja työvoimavaroja eikä se ole riippuvainen kouluista tai tutkimuslaitoksista, se tarvitsee vähintään 500–1 miljardin RMB:n rahoitusta ennen massatuotantoa on tutkimuslaitos tai tutkimuslaitos, Muulla tuella työvoimakustannuksia voidaan alentaa paljon ja rahakynnystä hieman alhaisempi.

"Jos sinulla ei ole niin paljon rahaa, mutta tällä startupilla on erittäin vahvat kustannustenhallintaominaisuudet, se voi hyödyntää täysimääräisesti alku- ja loppupään yhteistyötä kustannusten alentamiseksi. Kaikki on varmistettava tuotetutkimuksen ja -kehityksen jatkuminen."

Fab-valinnan tärkeysjärjestyksen osalta asiaan perehtyneiden ihmisten mukaan startupit valitsevat aluksi TSMC:n tuotantokapasiteetin tilaamisen ja sitten GlobalFoundriesin, mutta GlobalFoundriesilla ei ole edistyksellisiä prosesseja ja pakkausta, ja sitten käännytään SMIC:n puoleen, vaan SMIC Alliin. kansainvälisesti varattavissa oleva tuotantokapasiteetti on ajoitettu seuraavalle vuodelle.

Sijoituslaitokset suhtautuvat tilanteeseen pidemmällä aikavälillä.

Yu Hao sanoi, että pelkästään kotimaisten itsekehitettyjen high-end-sirujen kohdalla on väistämätöntä kohdata pullonkauloja lyhyellä aikavälillä. Pitkällä aikavälillä riippuu edistyneen prosessilinjan kiillotuksen ja kapasiteetin laajentamisen nopeudesta, jota edustaa SMIC. perustuu pääasiassa sisäiseen kiertoon. Valmistajat, joilla on huippuluokan sirusuunnittelukyky, saattavat kuitenkin haluta harkita ulkomaille menemistä ja ulkoisen kierron käyttöä sisäisen kierron edistämiseksi.

03 Ei ole helppoa olla Nvidian "haudankaivaja"

Vanhat asiakkaat perustavat oman yrityksensä, ja Nvidia on aina se, joka loukkaantuu.

Tämä maailmanlaajuinen itsetutkimuksen aalto räjähtää enemmän kuin edellinen. Kypsien itsetutkimustulosten, kuten Google TPU:n ja Amazon Gravitonin, lisäksi. Viime aikoina koko teknologiapiiri on iskenyt "Sohu, maailman ensimmäinen Transformerille omistettu AI-siru".

Yhdysvaltalainen siruyritys Etched lanseeraa Transformer-spesifisen AI-sirun Sohun

Tämä siru upottaa Transformer-arkkitehtuurin suoraan siruun, ja sen päättelykyky ylittää huomattavasti GPU:iden ja muiden yleisten tekoälysirujen suorituskyvyn. Sen väitetään olevan 10 kertaa tehokkaampi kuin B200, huippuluokan siru, joka julkaistiin vasta vuonna. maaliskuuta tänä vuonna. Huhutaan, että 8 Sohu-sirulla varustetun palvelimen suorituskyky on verrattavissa 160 H100 GPU:n klusteriin ja se pystyy käsittelemään jopa 500 000 Llama 7B -merkkiä sekunnissa.

Syntyi "suosittu paistettu kana", ja Fabin tehdas ja sen yhteistyökumppanit olivat iloisia.

Yhtiön kerrotaan tehneen suoraan yhteistyötä TSMC 4nm -prosessin kanssa Sohu-sirujen valmistuksessa ja hankkinut riittävästi HBM- ja palvelintarvikkeita parhailta toimittajilta. Jotkut varhaiset asiakkaat ovat jo varanneet yhtiöltä kymmeniä miljoonia dollareita. Netizens antoi Etchedille lempinimen - "Nvidian haudankaivaja".

Mutta murretaanko myytti NVIDIAn "itsetutkimuksesta" nousevan savun vuoksi? itseasiassa ei.

Puolijohdeteollisuudessa on kuuluisa "Mr. Ben -sykli" - sirutyypit kehittyvät säännöllisesti yleistyksen ja mukauttamisen välillä - tietyllä ajanjaksolla yleinen rakenne myy parhaiten ja on suosittu käyttäjien keskuudessa, mutta tietyn vaiheen saavuttamisen jälkeen , yleiskäyttöiset rakenteet jäävät jälkeen vastaamaan erityistarpeisiin, ja erikoisrakenteet tulevat suosituiksi.

Ja NVIDIA edustaa oikeutetusti universaalin arkkitehtuurin aikakautta, joka sattuu olemaan edelleen huipussaan.

Wells Fargon tilastojen mukaan NVIDIA omistaa tällä hetkellä 98 % maailmanlaajuisista datakeskusten tekoälykiihdytysmarkkinoista ja on ehdottomassa määräävässä asemassa. Tämä tarkoittaa, että 98 % maailman väestöstä käyttää NVIDIAn CUDA C:tä "puristaakseen" kaikkien grafiikkasuorittimien suorituskyvyn, ja vain loput 2% -3% ihmisistä vaatii edelleen huonoa "vasaraa" lyödäkseen samaa. "naulata".

"Nyt, olipa sitten Amazon tai Intel, heidän itsensä valmistamat prosessorit eivät voi taloudellisesti tyydyttää pilvitoimittajan etujen maksimointia, joten he varmasti jatkavat NVIDIA-sirujen käyttöä suuria määriä, kunnes jonakin päivänä NVIDIA menettää kokonaan etunsa. karjanhoidon erikoistumisesta, asian tunteva henkilö sanoi.

Makaaminen ei kuitenkaan ole sopusoinnussa NVIDIA:n persoonallisuuden kanssa. Huang Renxun tietää, että hän "syntyi surussa ja kuolee onneen" vuosi sitten pitämässään puheessa Taiwanin yliopistossa , tai ei Kun muut käyttävät sinua ruoana, et usein tiedä, missä tilanteessa olet, mutta jatkat juoksemista riippumatta siitä, mitä.

Tällä kertaa koko Piilaakson itsetutkimuksen haasteen edessä Nvidia pelaa myös korttiaan.

Edellä mainittu vanhempi henkilö kertoi Xinchao IC:lle: "Nvidia ei ole enää yleiskäyttöinen GPU. Sen GPU-yksikössä voit nähdä suuren määrän Tensor-ytimiä matriisilaskelmien ratkaisemiseksi. Lisäksi voit nähdä muuntajamoottoreita, harvaa moottorit jne., olipa kyseessä sitten laitteistorakenne tai laitteisto-operaattoripäivitys, NVIDIA pyrkii joka vuosi kohti DSA-pohjaista suunnittelutrendiä.

DSA (Domain Specific Architecture) on tietyille aloille räätälöity ohjelmoitava prosessoriarkkitehtuuri, joka voi optimoida tiettyjen sovellusten suorituskyvyn ja kustannustehokkuuden. Tällä hetkellä Google, Tesla, OpenAI ja Cerebras ovat kaikki julkaisseet omat DSA-sirunsa tiettyjä sovelluksia varten.

Asiaan perehtyneiden ihmisten mukaan kaikki DSA-valmistajat huomaavat, että vaikka Nvidia ei muokkaa laitteistoa ja yleiskäyttöiset GPU:t päivittävät vain yhden operaattorin, DSA-valmistajien edut menetetään kokonaan. Näyttää siltä, että NVIDIAan verrattuna logiikkapiirin pinta-ala ei ole tarpeeksi suuri, mutta myös laitteen kapasiteetti ja nopeus eivät ole tarpeeksi suuria, laskentateho ei ole yhtä hyvä kuin NVIDIA, ja ohjelmistojen mukautumiskyky ei ole tarpeeksi hyvä mitä kaikki DSA-valmistajat kohtaavat Ongelma - Muben-sykli oli alun perin siirtymässä kohti DSA-aluekohtaista arkkitehtuuria ja räätälöintiä, mutta nyt se on palannut yleiskäyttöisten prosessorien aikakauteen.

Sen lisäksi, että Nvidia on katsonut peiliin DSA-valmistajien kanssa, se on myös laajentanut oliivihaaraa itsetutkimukseen Vuoden 2024 alussa se perusti uuden liiketoimintaosaston, jota johtaa puolijohdeveteraani Dina McKinney, erityisesti pilvilaskentaa, 5G-tietoliikennettä varten. , ja pelit Rakennamme räätälöityjä pelimerkkejä asiakkaille, auto- ja muilla aloilla.

Reuters lainasi asiaa tuntevien ihmisten sanoneen, että Nvidian johtajat ovat tavanneet Amazonin, Metan, Microsoftin, Googlen ja OpenAI:n edustajia keskustellakseen heille räätälöidyistä siruista Tietokeskussirujen lisäksi yritys pyrkii hankkimaan myös tietoliikenne- ja autoteollisuutta ja videopeliohjelma.

Aiemmin kerrottiin, että Nintendon tänä vuonna lanseeraama Nintendo Switch -pelikonsolin uusi versio on todennäköisesti varustettu NVIDIAn räätälöidyillä siruilla. Vaikka tämä sirusarja Lopulta se ei miehittänyt paikkaa mobiililaitteiden markkinoilla.

Kustannustehokkuuden hallitsemilla markkinoilla ei ole niin helppoa olla Nvidian haudankaivaja. Suurin osa aiemmista haudankaivureista epäonnistui - ne voidaan lopulta hankkia. Esimerkiksi Intel ja Google ostivat monia startup-yrityksiä, mutta useimmat muut yritykset eivät edes odottaneet hankintaa ja kuolivat suoraan.

Ehkä aloittavien yritysten on helpompi menestyä, jos he muuttavat näkökulmaansa.

"Älä ole esimerkiksi pakkomielle itse tekoälyprosessoriin. Sen sijaan, että kuluttaisit paljon aikaa DSA:n ihanteen täyttämiseen, on parempi harkita järjestelmätason ratkaisuja. Esimerkiksi oheislaitteita voidaan valmistaa tarjota palveluita tekoälyprosessorille ja ammattitallennustilalle, ammattianturit voivat myös saavuttaa saman tarkoituksen", sanoi asian tunteva henkilö.

Vuonna 2019 Nvidia ilmoitti ostavansa Mellanoxin 6,9 miljardilla dollarilla. Tämä arvostus oli niin korkea, että Nvidia ylitti koko kassavirtansa.

Tämä yritys ei kehitä portteja tai aurinkosähkömoduuleja, eikä se kehitä kytkimiä itse. Se valmistaa vain yhtä tuotetta - PHY "InfiniBand" -kytkimen alemman kerroksen nopeaan yhteenliittämiseen. Nvidialle, joka oli tuolloin innokas rikkomaan palvelimien yhteenliittämisen rajoitukset, tämä oli erittäin keskeinen oheisvaatimus. Riippumatta siitä, kuinka hyvä NVLink oli tuolloin, se oli aina lukittu yhden koneen ympärille. Mutta InfiniBand voi sallia kytkimien murtautua palvelinten välisen yhteenliittämisen pullonkaulan läpi ja yhdistää kaikki GPU:t suureksi klusteriksi.

Nykytilannetta katsottuna kotimainen tilanne kukoistaa ja itsekehitettyjen sirujen luodit joutuvat lentämään jonkin aikaa. Chen Wei uskoo, että pelin rakentaminen ei ole huono asia, mutta on välttämätöntä rakentaa huippuluokan peli, jotta vältytään teollisen kehityksen kriittisen ikkunan puuttumisesta.

Zhou Jiangong, Unfinished Researchin perustaja, laajensi tätä näkemystä edelleen. Hän uskoo, että tulevat sovellukset vaativat ammattimaisia, räätälöityjä ja pienikokoisia tekoälysiruja, jotka ylittävät huippuluokan perusmallien kysynnän. Avoimen lähdekoodin koulutus, pienemmät mallit halvemmalla tai hienosäätäminen ja suurten mallien tislaaminen sekä päättely tuovat kaikki runsaasti tilaa itsekehitetyille siruille. Lisäksi uusien teknologioiden nopeissa muutoksissa ja epäkypsässä vaiheessa yllä olevien sovellusten ympärille tulee olemaan suuri määrä itsetutkimusmahdollisuuksia.

"Älä tee asioita, jotka lopettavat Nvidian, vaan tee enemmän asioita kuin Nvidia."

uutiset

Piilaakson jättiläinen valmistaa ydintä, "lippu" on 2 miljardia dollaria

01 Kova valuutta tuntuu turvalliselta vain, kun pidät sitä kädessäsi

02 Jos on ihmisiä ja rahaa, lopetetaan se

03 Ei ole helppoa olla Nvidian "haudankaivaja"

Johdanto

yhteystietoni