uutiset

3 biljoonaa siruyritystä, yrittävätkö he myös selviytyä?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia aikoo valmistaa jälleen erityisiä AI-siruja Kiinan markkinoille.

Reutersin viimeisimmän raportin mukaan asiaan perehtyneet ihmiset sanoivat, että Intel kehittää Kiinan markkinoille uutta lippulaivaa AI-sirua, joka täyttää nykyisten Yhdysvaltain vientivalvonnan vaatimukset ja lisää uuden jäsenen kotimaiseen Nvidian erikoissiruvalikoimaan.

On syytä mainita, että Nvidia julkaisi "Blackwell" -sarjan tämän vuoden maaliskuussa, ja sen odotetaan valmistuvan myöhemmin tänä vuonna. Nvidian mukaan B200 on 30 kertaa nopeampi kuin edeltäjänsä tietyissä tehtävissä parhaista tällä hetkellä saatavilla olevista AI-siruista.

Tämä uusi erityinen lippulaivasiru liittyy myös B200:aan, ja Sources sanoi, että Nvidia tekee yhteistyötä Inspur Groupin kanssa, joka on yksi sen tärkeimmistä jakelukumppaneistaan, jotta se julkaisee ja jakelee tämän nimestä päätellen "B20". saattaa sisältää joitain B200:n ominaisuuksia.

Kun tämä B20 lasketaan, Nvidia on julkaissut hieman yli vuodessa seitsemän tai kahdeksan erikoissirua Kiinan markkinoille.

A800 ja H800

Yhdysvaltain hallitus ilmoitti 7. lokakuuta 2022 joukosta viennin valvontatoimenpiteitä, mukaan lukien tiettyjen puolijohdesirujen ja sirujen valmistuslaitteiden toimittamisen katkaiseminen Kiinaan.

Sen lisäksi, että se vaikuttaa tuotantolaitteisiin, kuten fotolitografiakoneisiin, se rajoittaa myös Kiinan pääsyä korkean laskentatason ja tekoälyn siruihin kehittyneissä prosesseissa, muun muassa kieltämällä yhdysvaltalaisia ​​yrityksiä, kuten Nvidiaa ja AMD:tä, myymästä tällaisia ​​siruja Kiinaan ja rajoittamalla myös Kiinan tekoälyä Siruyritykset suorittavat teippiä ulkomaisissa Fab-tehtaissa amerikkalaisella teknologialla.

Tämä vientirajoitus vaikutti sekä Nvidiaan että AMD:hen.

Nvidia sanoi rajoitusten käyttöönoton jälkeen, että kielto vaikutti sen A100- ja H100-siruihin, jotka on suunniteltu nopeuttamaan koneoppimistehtäviä, ja se voi haitata sen vuonna 2022 julkaistavan lippulaiva H100-sirun kehitystyön loppuunsaattamista. Se huomautti, että kyseisten sirujen myynti Kiinassa oli vuosineljänneksen aikana saavuttanut 400 miljoonaa dollaria, jos kiinalaiset yritykset päättävät olla ostamatta Nvidian korvaavia tuotteita, nämä rahat menetetään turhaan.

Miten siis tarkalleen ottaen Yhdysvaltojen vientirajoitukset rajoittavat Nvidia-siruja?

Yhdysvaltain kauppaministeriön 7. lokakuuta 2022 julkaisemien edistyneiden tietokoneiden integroitujen piirien vientirajoitussääntöjen (ECCN 3A090 ja 4A090) mukaan valvottujen tuotteiden luettelon on täytettävä seuraavat ehdot:

a. Integroidut piirit, joiden kaikkien tulojen ja lähtöjen tai ohjelmoitavien kaksisuuntainen siirtonopeus on vähintään 600 Gt/s, paitsi haihtuva muisti, ja mikä tahansa seuraavista integroiduista piireistä:

a.1. Yksi tai useampi digitaalinen prosessoriyksikkö, joka suorittaa konekäskyjä, kunkin toiminnon bittipituus kerrottuna TOPS:n prosessointisuorituskyvyllä ja kaikkien prosessoriyksiköiden summa on 4800 tai enemmän;

a.2. Yksi tai useampi digitaalinen "raakalaskentayksikkö" (lukuun ottamatta yksiköitä, jotka avustavat 3A090.a.1 kohdan TOPS-laskemiseen liittyvien konekäskyjen suorittamisessa), joiden bittipituus operaatiota kohti kerrotaan kaikkien laskentayksiköiden summalla TOPS-käsittelyn suorituskyky on 4800 tai enemmän;

a.3. Yksi tai useampi simulaatio, moniarvoinen tai monitasoinen "alkuperäinen laskentayksikkö", jonka prosessointiteho lasketaan TOPS kerrottuna 8:lla ja kaikkien laskentayksiköiden kokonaissumma saavuttaa tai ylittää 4800:n;

a.4 Mikä tahansa digitaalisten prosessoriyksiköiden ja "alkuperäisten laskentayksiköiden" yhdistelmä, jonka 3A090.a.1, 3A090.a.2 ja 3A090.a.3 mukaisesti laskettu summa on 4800 tai enemmän.

3A090.a kohdassa kuvattu integroitu piiri sisältää grafiikankäsittely-yksikön (GPU), tensorin prosessoriyksikön (TPU), hermoprosessorin, muistiprosessorin, näköprosessorin, tekstiprosessorin, apuprosessorin/kiihdytin, mukautuvat prosessointilaitteet, kenttäohjelmoitavat logiikkalaitteet. (FPLD) ja sovelluskohtaiset integroidut piirit (ASIC).

Ei ole vaikea nähdä, että tärkein on sirujen yhteenliittämisnopeuden raja Tämän asetuksen mukaan NVIDIA:n hot-selling A100 osui tarkasti rajan sisälle ja sen sirujen välinen siirtonopeus saavutti 600 Gt/s Jossain määrin ehkä Yhdysvaltain kauppaministeriö määritteli tämän rajoituksen A100:n perusteella.

Vientivalvontaa varten NVIDIA kastroi nopeasti korvaavan A100-A800:n Yhdysvaltojen kielto julkistettiin virallisesti 7. lokakuuta 2022, ja kuukautta myöhemmin NVIDIA esitti A800:n, joka mukautuu uusiin säännöksiin. mukautettava paikallisiin oloihin aiemmin, mutta nyt se on mukautettu poliittisiin olosuhteisiin.

Teknisten tietojen mukaan NVIDIA A800 käyttää samaa siruarkkitehtuuria kuin Ampere A100 GPU. Siitä on saatavana kolme versiota, kaksi 40 Gt:n ja 80 Gt:n PCIe-versiota ja 80 Gt:n SXM-versio. Nämä GPU:t tarjoavat jopa 9,7 TFLOP FP64:tä, 19,5 TFLOP FP64 Tensor Corea, 19,5 TFLOP FP32:ta, 156 TFLOP. (312 TFLOPs harva) TF32, 312 TFLOPs (624 TFLOPs harva) BFLOAT16 ja 624 TOPS (1248 TOPs harva) INT8 suorituskyky. 40 Gt:n versiossa on HBM2-muisti jopa 1,555 TB/s kaistanleveydellä, kun taas 80 Gt:n versiossa HBM2e jopa 2 TB/s kaistanleveydellä.

Tietysti rajoitettuun kysyntään vastaamiseksi kaistanleveys on väistämättä pienentynyt alkuperäisestä 600 Gt/s:sta 400 Gt/s:iin Nvidian tiedottaja sanoi lausunnossaan Reutersille: "A800 GPU otettiin käyttöön Kolmannen vuosineljänneksen tuotanto, vaihtoehto A100 GPU:lle kiinalaisille asiakkaille.

CCS Insightin analyytikko Wayne Lam kommentoi: "A800 näyttää olevan uudelleen pakattu A100 GPU, joka on suunniteltu välttämään kauppaministeriön viimeaikaiset kaupan rajoitukset", mutta huomautti, että 8 on onnenluku Kiinassa.

"Kiina on tärkeä markkina Nvidialle, ja on liiketaloudellisesti järkevää konfiguroida tuote uudelleen kaupan rajoitusten välttämiseksi", sanoi Lam, joka sanoi, että A800:n sirujen välisiä viestintäominaisuuksia on vähennetty huomattavasti tuhansia siruja käyttävissä datakeskuksissa.

Seuraavassa H100:ssa Nvidia seurasi esimerkkiä ja keksi H800:n. A100:ssa Nvidia pudotti grafiikkasuorittimen 600 Gt/s yhteenliittämisen 400 Gt/s:aan, ja se teki saman asian H100:n kanssa. Raporttien mukaan H800:n sirujen yhteenliittämisnopeus on pudonnut noin puoleen H100:n tasosta, eli 800 Gt/s:sta 400 Gt/s:iin. A800:aan verrattuna H800:n suorituskyky on loppujen lopuksi vain 33 % pienempi ja jälkimmäinen kokonaiset 50 % pienempi.

Tuolloin NVIDIA:n tiedottaja kieltäytyi paljastamasta H800:n ja H100:n välistä eroa Kiinan markkinoille ja sanoi vain, että "800-sarjan tuotteemme ovat täysin vientivalvontamääräysten mukaisia".

Kun ulkomaiset valmistajat ostavat kiihkeästi A100:aa ja H100:a, kotimaiset valmistajat voivat valita vain H800:n ja A800:n pienemmillä kokoonpanoilla. NVIDIAn erityinen siruversio on rajoittanut suurten kotimaisten tekoälymallien kehitystä jossain määrin.

H20 ja RTX 4090D

Kotimaisille yrityksille A800:ssa ja H800:ssa on huonoja puolia, että Internetin kaistanleveyden katkaisun jälkeen näiden kahden sirun suorituskyky on hieman huonompi ja myös harjoitusnopeus on paljon hitaampi ne ovat sekä hyviä että huonoja. Sen voi tilata Zhengcheng-kanavien kautta, mutta ulkomaisiin yrityksiin verrattuna sirujen hinta on korkeampi.

Mutta A800 ja H800 eivät myöskään kestäneet yli vuotta. Yhdysvaltain kauppaministeriö julkaisi 17. lokakuuta 2023 uudet valvontasäännöt, joilla säännellään kehittyneiden integroitujen tietojenkäsittelypiirien, puolijohteiden valmistuslaitteiden sekä supertietokonesovelluksia ja loppukäyttöä tukevien tuotteiden vientiä, julkaistu 7. lokakuuta 2022. Lisäpäivityksiä.

Pääasiallinen näistä ovat muutokset ohjausparametreissa. Väliaikainen viimeinen sääntö poistaa "yhdenliittämisen kaistanleveyden" parametrina ECCN 3A090:n mukaisten rajoitettujen sirujen identifioimiseksi ja sen sijaan korvaa sen parametrilla "yhdenliittämisen kaistanleveys" rajoitettujen sirujen tunnistamiseksi ECCN 3A090:n mukaisesti. siru ylittää kaksi ECCN 3A090:ssa kalibroitua parametria (3A090. a ja 3A090.b), vientiä rajoitetaan.

Yhdysvaltain kauppaministeriön asiakirjojen mukaan tarkistetut 3A090.a-sääntelyparametrit säätelevät integroituja piirejä, joissa on yksi tai useampi digitaalinen prosessointiyksikkö, ja näiden yksiköiden "kokonaiskäsittelyn suorituskyvyn" on oltava 4800 tai enemmän tai "kokonaiskäsittely suorituskyky" on 1 600 tai enemmän, ja "Suorituskykytiheys" on 5,92 tai enemmän. Uusi ECCN 3A090.b säätelee integroituja piirejä, joissa on yksi tai useampi digitaalinen prosessointiyksikkö, jolla on oltava jokin seuraavista ehdoista: "kokonaisprosessointiteho" on 2400 tai enemmän, mutta alle 4800 ja "suorituskykytiheys" 1,6 tai 1,6 tai enemmän, mutta vähemmän kuin 5,92, tai "kokonaiskäsittelyteho" on 1600 tai enemmän ja "suorituskykytiheys" on 3,2 tai enemmän kuin 3,2, mutta pienempi kuin 5,92.

Lisäksi sääntö luo lisensointipoikkeuksen, joka luo uuden "Licensing Exception Notice for Advanced Computing" kuluttajatason IC:ille, joiden tekoälyominaisuudet jäävät alle rajoittavan kynnyksen keskusten, joista toinen on siruja, joita ei ole suunniteltu tai myyty datakeskuskäyttöön, "kokonaiskäsittelyn suorituskyky" on 4800 tai suurempi.

Verrattuna 7.10.2022 annettuihin sääntöihin, uudet säännöt ovat jälleen laajentaneet valvonnan ulottuvuutta Kokonaiskäsittelyn tehokkuuden ja suoritustiheyden kaksoissäännön mukaan sekä kastroimattomat että kastroituneet tuotteet kuuluvat vientivalvontaan A800 ja H800 ovat vaikuttaneet, kun taas kielto koskee myös muita Nvidian tuotteita L40 ja L40S sekä kuluttaja-alan RTX 4090.

Tämä oli kova isku Nvidialle, mikä merkitsi sitä, että Nvidian tuolloin myymiä valtavirtatuotteita ei voitu myydä Kiinassa vientirajoitusten vuoksi. Sinun täytyy tietää, että aikaisempina vuosina konesaliliiketoiminnan tuotto oli Kiinan markkinoilta Nvidian kokonaistulot olivat noin 20–25 prosenttia, ja tilikauden 2024 neljännellä neljänneksellä Kiinan markkinoiden liikevaihto putosi yksinumeroiseksi.

Avuton Nvidia saattoi vain käyttää viidakkoveitseä uudelleen.

16. marraskuuta 2023, kuukausi uusien sääntöjen julkaisemisen jälkeen, NVIDIA julkaisi GPU-sirut erityisesti Kiinan markkinoille - H20, L20 ja L2 perustuvat NVIDIAn Hopper-arkkitehtuuriin, kun taas L20 ja L2 perustuvat Adaan arkkitehtuuri.

Niistä kaksi sirua L20 ja L2 on säädetty vastaavasti L40:n ja L4:n perusteella. Koska ne ovat vanhoja arkkitehtuureja eikä niitä käytetä yleisesti päättelyssä ja koulutuksessa, ne eivät ole saaneet paljon huomiota. H20 on mielenkiintoisempi, vaikka se on saanut 900 Gt/s täyden NVLinkin, koska uudet säädöt eivät enää rajoita Internetin nopeutta, analyytikko Dylan Petalin mukaan suorituskykyä on alennettu, vaikka H20 The nopeus voi nousta 90 %:iin, mutta sen suorituskyky todellisessa usean kortin yhteenliittämisympäristössä on silti vain lähellä 50 % H100:sta.

Kuluttajamarkkinoilla olevalle RTX 4090:lle NVIDIA lanseerasi myös korvaavan - RTX 4090D:n. Tämä erityinen USA:n vientirajoitusten mukainen siru on kastroitu CUDA-ytimen ja virrankulutuksen osalta. 12,8 %, myös virrankulutus on laskenut 450 W:sta 425 W:iin, mikä on 5,9 % vähennystä, kaikki muut ydintiedot pysyvät samoina.

Päätaajuuden lievästä noususta johtuen joissakin vertailutesteissä 4090D:n suorituskyky on vain noin 5 % alhaisempi kuin 4090:n. Tekoälysiruihin verrattuna tämä ero näyttää olevan hyväksyttävällä alueella.

Neljä erikoissirua peräkkäin vuoden 2023 lopulla ovat jossain määrin lieventäneet Nvidia Kiinan hämmennystä ja estäneet sitä loppumasta myytäväksi. Suuret yritykset ja pienet ja keskisuuret yritykset ovat kuitenkin tehneet siitä kahden rajoituskierroksen jälkeen alkanut etsiä muualta ulospääsyä on joko ostaa kotimaisia ​​siruja, rakentaa palvelimia ulkomailta tai ostaa H100/200 ja A100 epävirallisia kanavia pitkin, jolla ei ole muuta vaihtoehtoa kuin levitä kotimaisten valmistajien keskuuteen.

Lao Huangin veitsitaidot

Tee-se-itse-pelaajille, jotka tuntevat pelin GPU:t, Lao Huangin veitsitaidot eivät ole liian vieraita.

Otetaan suhteellisen tuore esimerkki, vuosi RTX 20 -sarjan julkaisun jälkeen, jotta tuotevalikoima voitaisiin erottaa paremmin ja vastata viereisen AMD:n RX5000-sarjan uusiin tuotteisiin, Nvidia lanseerasi RTX 20 Super -sarjan.

Vaikka ne perustuvat myös TU106- ja TU104-ytimiin, Nvidia on käyttänyt näitä kahta ydintä leikkaamaan viisi näytönohjainkorttia, nimittäin RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super ja RTX 2080. Niiden joukossa pienin ero on Teoreettinen ero TU106-ytimen RTX 2060 Superin ja RTX 2070:n välillä on vain noin 5 %, ja myös todelliset juoksupisteet ja pelitestit ovat hyvin lähellä. Voidaan sanoa, että Nvidia on vienyt kastraation äärimmilleen.

Nykyään NVIDIA:n Kiinalle valmistamat erityisesti modifioidut sirut eivät ole muuta kuin menneisyyden toistoa ja paluuta vanhaan bisnesaikaan.

Alussa mainitsemamme B20:n lisäksi Nvidia aikoo esitellä taitojaan myös kuluttajamarkkinoilla. Raporttien mukaan RTX 5090D:n, pienennetyn version RTX 5090:stä, odotetaan tulevan markkinoille tammikuussa 2025. odotetaan perustuvan Nvidian Blackwell-arkkitehtuuriin. TSMC:n 4NP-prosessin käyttö voi vähentää ydinmäärityksiä Yhdysvaltojen vientirajoitusten kiertämiseksi.

Nämä kaksi huhuttua sirua laskettuna Nvidialla on jo valtava erikoisvalikoima Kiinassa: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Jotkut ihmiset ovat varsin optimistisia näiden erikoisversioiden sirujen näkymistä. Tutkimusorganisaatio SemiAnalysis arvioi, että Nvidian odotetaan myyvän Kiinassa yli miljoona H20-sirua tänä vuonna yli 12 miljardin dollarin arvosta.

Mutta Nvidialla on edelleen paljon huolestuttavaa. Jeffriesin analyytikoiden raportin mukaan, kun Yhdysvallat suorittaa vuosittaisen puolijohdeviennin valvontansa lokakuussa, on "erittäin todennäköistä" kieltää Nvidian H20-sirujen myynnin Kiinaan. Analyytikko sanoi, että kielto voi johtua "tietyn tuotteen kautta". kiellot, alhaisemmat laskentakapasiteetin rajoitukset ja/tai rajoitettu muistikapasiteetti".

Lisäksi keinotekoisesti valmistetut vaatimustenmukaisuuskortit, kuten H20, perustuvat olennaisesti olemassa olevien ytimien kastraatioon. Sama pätee myös B20:n ytimeen, mutta nyt sitä voidaan käyttää vain halvempien erikoisten myymiseen. painoksia, ja myyntiaika on todennäköisesti vain yli vuosi, joten se on tappiollista, katsotpa sitä miltä tahansa.

Mutta Nvidialla ei ole ulospääsyä. Se voi vain yrittää parhaansa tasapainottaakseen sääntöjä ja markkinoita. Mutta kuinka monta yritystä Kiinassa on valmis maksamaan erikoisversioista, jotka katkeavat yhä uudelleen?