uutiset

Vanha Huang tekee jälleen yllättävän liikkeen!Ensimmäinen "erikoisversio" GB20-palvelin julkaistaan, joka saattaa tulla markkinoille ensi vuonna

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Uusi viisausraportti

Toimittaja: Toimitusosasto

[Johdatus uuteen viisauteen]Ulkomaiset tiedotusvälineet kertoivat, että Nvidia lanseeraa ensi vuonna Kiinan markkinoille räätälöidyn AI-sirun ja jopa kehittää sitä vastaavan palvelimen. Tämä on ensimmäinen kerta Nvidian historiassa.

Taistelu Nvidian ja Yhdysvaltain kauppaministeriön välillä on jälleen kärjistynyt!

Yhdysvaltain vientivalvonnan alaisena Lao Huang jatkaa vaihtoehtoisten strategioiden keksimistä, ja kissa-hiiri -peli on käynnissä.


Uusien vientivalvontamääräysten käyttöönoton jälkeen Lao Huang ei kyennyt tienaamaan Kiinan markkinoilla.

Tämän vuoden tammikuusta lähtien uudet vientisäännökset ovat olleet voimassa tasan vuoden ajan, ja Kiinan markkinoiden osuus Nvidian liikevaihdosta on pudonnut 17 prosenttiin. Kaksi vuotta sitten tämä luku oli vielä 25 %+.

Sääntelyn edessä Nvidia on jatkuvasti tuonut markkinoille Kiinalle räätälöityjä "erikoisversion" siruja. Nämä heikentyneen suorituskyvyn sirut eivät kuitenkaan usein mene hyvin.

Aiemmin huonosti alkaneen H20:n myynti oli juuri alkanut nousta, mutta Nvidia järkyttyi kuullessaan huonot uutiset...

Jefferiesin analyytikot paljastivat viime viikolla julkaisemassaan tutkimusraportissa, että Yhdysvaltain kauppaministeriö suorittaa puolijohteiden vientirajoitusten vuosittaisen katsauksen lokakuussa ja saattaa kieltää H20-sirujen viennin.

Valvonta kiihtyy edelleen, ja tällä kertaa Lao Huang laittoi parhaansa eteenpäin.

Se ei ainoastaan ​​julkaissut uuden lippulaivan AI-sirun B20, vaan huolestuneena siitä, ettei sitä ole helppo käyttää, se lanseerasi myös tukevan palvelimen GB20.


Nimestä ei ole vaikea arvata, että B20 on muunnelma Nvidian tämän vuoden maaliskuussa julkaisemasta Blackwell B200:sta.

Tähän mennessä nopeimpana GPU:na B200 pystyy käsittelemään tiettyjä tehtäviä jopa 30 kertaa nopeammin kuin edeltäjänsä. (esim. anna chatbotin luoda vastauksia)

Valitettavasti tällä ei ole mitään tekemistä "erikoisversion" B20-sirun kanssa...

B20, joka syntyi Yhdysvaltain vienninvalvontapolitiikan rajoitusten alaisuudessa, on tarkoitettu lähtötason tuotteeksi, jyrkästi päinvastoin kuin B200, jolla on alan johtava tekoäly.

Lähteen mukaan vaikka B20 on hitaampi kuin B200 AI-laskelmien käsittelyssä, suuren sirumäärän asentaminen yhdessä GB20-palvelimeen voi osittain korjata tämän puutteen.

Tämä varmistaa, että Nvidia säilyttää tietyn kilpailukyvyn kilpaillessaan kiinalaisten tuotteiden kanssa ja noudattaa samalla Yhdysvaltain vientivalvonnan edellyttämää sirujen laskentatehon ylärajaa.

Ohjauksessa pelataan "kissa-hiiri -peliä".

Vuoden 2022 lopusta lähtien Nvidia on toistuvasti konfiguroinut sirujaan Kiinan markkinoille suunnaten kiinalaisten asiakkaiden tarpeita, jotka tarvitsevat siruja LLM:n kehittämiseen, yrittäen pysyä houkuttelevana kiinalaisten asiakkaiden silmissä noudattaen samalla Yhdysvaltain säädöksiä.

Lokakuussa 2022 Yhdysvaltain hallitus kielsi Nvidian A100:n ja H100:n, sen tuolloin edistyneimpien tekoälysirujen, myynnin.

Muutamaa kuukautta myöhemmin Nvidia toi markkinoille kaksi vaihtoehtoista tuotetta, A800 ja H800, Kiinan markkinoille.

Alle vuotta myöhemmin Yhdysvaltain kauppaministeriö päivitti jälleen vientivalvontatoimenpiteitään ja asetti rajoituksia näille kahdelle sirulle.

Nvidia vastasi nopeasti,


Niistä H20-sirulla on rajoitettu suorituskyky, mutta suurempi yhteysnopeus Suuren kaistanleveyden ja ohjelmistotuen ansiosta se tuo paremman suorituskyvyn.

Vaikka alkuperäinen myynti oli heikkoa, yhä useammat kiinalaiset asiakkaat haluavat ostaa tämän sirun.

Neljän suoraan Nvidia-sirujen myyntiin Kiinassa osallistuvan henkilön mukaan kiinalaiset yritykset ovat tilaneet yli 500 000 H20-sirua, joiden kokonaisarvo on lähes 5,8 miljardia dollaria, ja ne toimitetaan vuonna 2024.

Tutkimusyhtiö SemiAnalysis on myös tehnyt optimistisia arvioita, että Nvidia myy Kiinassa tänä vuonna yli miljoona H20-sirua yli 12 miljardin dollarin arvosta.

Mutta kuten aiemmin mainittiin, tämä yritys kohtaa uusia uhkia kauppaosastolta. Kun määräyksiä muutetaan vuoden lopussa, H20 voidaan kieltää myyntiin.

Tämä kielto voi esiintyä monessa muodossa, mukaan lukien tuotekohtaiset kiellot, sirun laskentatehon vähentäminen tai muistikapasiteetin rajoittaminen.

Makrotausta on nimittäin sellainen, että Yhdysvaltojen odotetaan yleisesti jatkavan painostusta puolijohteisiin liittyviin vientivalvontaan.

Lähteiden mukaan Yhdysvallat haluaa Alankomaiden ja Japanin rajoittavan entisestään siruvalmistuslaitteiden toimitusta Kiinaan.


Lisääntyvän hallinnan alaisuudessa saattaa ilmestyä yhä enemmän "erikoisversioita".


Huhujen mukaan Nvidia kehittää myös uutta lippulaivapelinäytönohjainta, RTX 5090D:tä.


Näytönohjain on suunniteltu erityisesti Kiinan markkinoille, ja se on jatkoa RTX 4090D:lle, joka on ensimmäinen kuluttajalähtöinen näytönohjain, joka täyttää vientistandardit.

Sirun suorituskyky ei riitä, palvelin tarvitaan korvaamaan se

B20:n tarkkoja spesifikaatioita ei ole vielä määritetty, mutta varmaa on, että se ei varmasti riko Yhdysvaltain GPU-vientipolitiikan "kattoa".

Aivan kuten sen vanhat edeltäjät - aiemmin lanseeratut H20, L20 ja L2, näiden kolmen sirun suorituskyvyn voidaan sanoa olevan "eeppinen", mutta se on myös varustettu vain jäljellä olevalla NVLink-versiolla. kytkeä.

TPP & PD kaksi suurta indikaattoria kurkun lukitsemiseksi

Yhdysvalloissa on tiukat suorituskykysäännöt Kiinan GPU-viennille, ja se käyttää indikaattoria nimeltä "Total Processing Power" (TPP).

Tämä mittari ottaa huomioon TFLOPS:n ja GPU:n laskentatehon tarkkuuden. Tarkemmin sanottuna kertomalla TFLOPS (ilman harvalukuisuutta) tarkkuudella (bitteinä) saat TPP:n.

Nykyinen raja on 4800 TPP, mitä tämä tarkoittaa?

NVIDIA:n aiemmat tuotteet referenssinä: Hopper H100 ja H200 ovat ylittäneet tämän standardin. Molempien GPU:iden TPP on saavuttanut 16 000, mikä on yli kolme kertaa määritetty yläraja.


Jopa RTX 4090 ylittää rajan FP8:n laskentateholla 660,6 TFLOPS.

Tehokkain Nvidian pöytätietokoneen GPU, joka pysyy 4800 TPP:n rajan sisällä, on RTX 4090D, joka on rakennettu erityisesti vientirajoitusten mukaisesti.


Blackwell on asettanut uuden vertailukohdan tietojenkäsittelyn suorituskyvylle, sillä sen kaksisiruinen ratkaisu tuottaa todennäköisesti noin 4 500 TFLOPS FP8-laskentatehoa, mikä olisi 7,5 kertaa vientiraja.

Toisin sanoen B20:n suorituskyky on alle 1/7 Blackwell B200:n suorituskyvystä!

Paitsi että B20 kohtaa myös lisärajoituksia - "Performance Density" (PD) -rajoituksia.

Tämä rajoitus on erityisesti asetettu datakeskusten GPU:ille Yhdysvalloissa, eikä se vaikuta kuluttajien GPU:ihin.

PD-indikaattori saadaan jakamalla TPP-pisteet sirun koolla. Kiinaan vietyjen GPU:n PD ei saa olla suurempi kuin 6,0.

Tämän indikaattorin mukaan RTX 40 -sarjan GPU:ita (Ada Lovelace -arkkitehtuuri) ei voida enää käyttää datakeskuksissa.

Blackwell on selvästi parempi kuin Ada Lovelace tiheyden ja suorituskyvyn suhteen.

Toisin sanoen Nvidian on rajoitettava tiukasti B20:n suorituskykyä tai käytettävä suurempaa osaa siruista noudattaakseen asiaankuuluvia säännöksiä.

Tom's Hardwaren mukaan B20 tulee olemaan Nvidian A30- ja H20-alkutason AI-grafiikkasuorittimien seuraaja.

H20 esimerkkinä, sen FP16 laskentateho on vain 296 TFLOPS, TPP on 2368, PD on vain 2,90, kun taas H100/H200 on 1979 TFLOPS.


Samaan aikaan A30:n TPP-pistemäärä on 2640 ja PD-pistemäärä 3,20, mikä on hieman korkeampi kuin H20.

Voidaan nähdä, että Nvidian Kiinan markkinoille rakentamassa AI ​​GPU:ssa on suorituskyvyssä parantamisen varaa, mutta tila on hyvin rajallinen.

Parhaassa tapauksessa Nvidia saattaa pyrkiä luomaan GPU:n, jonka TPP on välillä 4000–4500 ja muottikoko 800 neliömillimetriä.

GB20: Yritä parhaamme säästääksesi B20:n suorituskykyä

Tehdäkseen tulevasta B20:stä tehokkaampaa Nvidia käyttää H20:n kanssa käyttämiään strategioita, kuten muistikapasiteetin päivittämistä, koska muistisirut eivät ole nykyisten vientirajoitusten alaisia.

Kahden palvelimen kehittämiseen osallistuneen henkilön mukaan Nvidia pyrkii lisäämään tiedonsiirtonopeutta muistin ja B20-prosessorien välillä, jotta suuret energiatietojoukot voidaan käsitellä nopeammin.

Sen lisäksi, että Nvidia käyttää myös NVLINK-tekniikkaansa (joka mahdollistaa nopean tiedonsiirron eri sirujen välillä) ja jäähdytysratkaisuja GB20-telinesuunnittelussa.

Tämän odotetaan lisäävän B20-sirujen käyttöä ja GB20-laskentaklustereiden tehokkuutta tekoälyn tehostamisessa, kaksikko lisäsi.

GB20-järjestelmän avulla asiakkaat voivat harjoittaa tekoälyä ja tehdä johtopäätöksiä ajamalla useita siruja rinnakkain tehokkaammin.

Ennen kuin GB20 paljastettiin, Tom's Hardware ennusti rohkeasti, että B20 olisi vaikeasti myytävä siru.

Mutta nyt GB20:n siunauksen myötä näyttää olevan uutta toivoa.

Viitteet:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- määräyksiä

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules