notizia

Il vecchio Huang fa un'altra mossa sorprendente!Viene lanciato il primo server GB20 in "edizione speciale", che potrebbe essere lanciato il prossimo anno

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Nuovo rapporto sulla saggezza

Redattore: Dipartimento editoriale

[Introduzione alla Nuova Saggezza]I media stranieri hanno dato la notizia che Nvidia lancerà l'anno prossimo un chip AI personalizzato per il mercato cinese e svilupperà anche un server adatto. Questa è la prima volta nella storia di Nvidia.

La battaglia tra Nvidia e il Dipartimento del Commercio degli Stati Uniti si è intensificata di nuovo!

Sotto i controlli sulle esportazioni statunitensi, Lao Huang continua a escogitare strategie alternative e si sta svolgendo un gioco del gatto e del topo.


Dopo l’implementazione delle nuove norme sul controllo delle esportazioni, Lao Huang non è stato in grado di guadagnare denaro nel mercato cinese.

A partire da gennaio di quest'anno, le nuove norme sull'esportazione sono state implementate esattamente per un anno e la percentuale del mercato cinese nelle entrate di Nvidia è scesa al 17%. Due anni fa, questo numero era ancora superiore al 25%.

Nonostante la regolamentazione, Nvidia ha lanciato continuamente chip in "edizione speciale" personalizzati per la Cina. Tuttavia, questi chip con prestazioni ridotte spesso non si vendono bene.

Le vendite dell'H20, che in precedenza avevano avuto un brutto inizio, avevano appena iniziato a salire, ma Nvidia rimase scioccata nel sentire la brutta notizia...

Gli analisti di Jefferies hanno rivelato in un rapporto di ricerca della scorsa settimana che il Dipartimento del Commercio degli Stati Uniti condurrà la sua revisione annuale delle restrizioni sull’esportazione di semiconduttori in ottobre e potrebbe vietare l’esportazione di chip H20.

La supervisione continua ad aumentare e questa volta Lao Huang ha fatto del suo meglio.

Non solo ha lanciato il nuovo chip AI di punta B20, ma temendo che non sarebbe stato facile da usare, ha anche lanciato il server di supporto GB20.


Non è difficile intuire dal nome che il B20 è una variante del Blackwell B200 rilasciato da Nvidia a marzo di quest'anno.

Essendo la GPU più veloce fino ad oggi, la B200 può elaborare determinate attività fino a 30 volte più velocemente rispetto al suo predecessore. (ad esempio, lascia che sia il chatbot a generare risposte)

Sfortunatamente, questo non ha nulla a che fare con il chip B20 in "edizione speciale"...

Il B20, nato sotto le restrizioni della politica di controllo delle esportazioni degli Stati Uniti, è destinato ad essere un prodotto entry-level, in netto contrasto con il B200 con prestazioni AI leader del settore.

Tuttavia, secondo la fonte, anche se il B20 sarà più lento del B200 nell'elaborazione dei calcoli dell'intelligenza artificiale, l'installazione di un gran numero di chip insieme nel server GB20 può in parte compensare questa lacuna.

Ciò garantirà che Nvidia mantenga un certo grado di competitività nella competizione con i prodotti cinesi, rispettando al tempo stesso il limite superiore della potenza di calcolo dei chip richiesto dai controlli sulle esportazioni statunitensi.

Sotto controllo, si svolge il "gioco del gatto e del topo".

Dalla fine del 2022, Nvidia ha ripetutamente riconfigurato i suoi chip per il mercato cinese, rivolgendosi alle esigenze dei clienti cinesi che necessitano di chip per sviluppare LLM, cercando di rimanere attraenti per i clienti cinesi pur rispettando le normative statunitensi.

Nell'ottobre 2022, il governo degli Stati Uniti ha vietato la vendita di A100 e H100 di Nvidia, i chip di intelligenza artificiale più avanzati dell'epoca.

Pochi mesi dopo, Nvidia ha lanciato due prodotti alternativi, A800 e H800, per il mercato cinese.

Meno di un anno dopo, il Dipartimento del Commercio degli Stati Uniti ha nuovamente aggiornato le sue misure di controllo delle esportazioni e ha imposto restrizioni su questi due chip.

Nvidia ha risposto rapidamente,


Tra questi, il chip H20 ha prestazioni limitate ma una velocità di connessione più elevata. Con una memoria a larghezza di banda elevata e un supporto software maturo, offre prestazioni migliori.

Sebbene le vendite iniziali siano state scarse, sempre più clienti cinesi scelgono di acquistare questo chip.

Secondo quattro persone direttamente coinvolte nelle vendite di chip Nvidia in Cina, le aziende cinesi hanno ordinato più di 500.000 chip H20 per un valore totale di quasi 5,8 miliardi di dollari e saranno consegnati nel 2024.

Anche la società di ricerca SemiAnalysis ha fatto stime ottimistiche secondo cui Nvidia venderà più di 1 milione di chip H20 in Cina quest'anno, per un valore di oltre 12 miliardi di dollari.

Ma come accennato in precedenza, questa attività deve affrontare nuove minacce da parte del Dipartimento del Commercio. Quando le normative verranno adeguate alla fine dell'anno, la vendita di H20 potrebbe essere vietata.

Tale divieto potrebbe assumere molte forme, compresi divieti specifici per prodotto, riduzione della potenza di calcolo di un chip o limitazione della sua capacità di memoria.

Dopotutto, il contesto macroeconomico è tale che in genere si prevede che gli Stati Uniti continueranno a esercitare pressioni sui controlli delle esportazioni legate ai semiconduttori.

Gli Stati Uniti vogliono che i Paesi Bassi e il Giappone limitino ulteriormente la fornitura di attrezzature per la produzione di chip alla Cina, dicono le fonti.


Sotto il crescente controllo potrebbero apparire sempre più "edizioni speciali".


Si dice che Nvidia stia anche sviluppando una nuova scheda grafica da gioco di punta, la RTX 5090D.


La scheda grafica sarà progettata specificamente per il mercato cinese ed è il seguito della RTX 4090D, la prima scheda grafica orientata al consumatore che soddisfa gli standard di esportazione.

Le prestazioni del chip non sono sufficienti, serve il server per compensare

Le specifiche specifiche del B20 non sono ancora state determinate, ma quello che è certo è che sicuramente non infrangerà il "tetto" della politica di esportazione delle GPU statunitensi.

Proprio come i suoi vecchi predecessori - i precedenti H20, L20 e L2, le prestazioni di questi tre chip possono essere definite "epiche". Non solo sono scarse, ma è anche dotato solo di una versione residua di NVLink. Collegare.

TPP e PD due indicatori principali per chiudere la gola

Gli Stati Uniti hanno rigide normative sulle prestazioni delle esportazioni di GPU cinesi e utilizzano un indicatore chiamato "Total Processing Power" (TPP).

Questa metrica tiene conto dei TFLOPS e della precisione della potenza di calcolo della GPU. Nello specifico, moltiplicando TFLOPS (senza sparsità) per precisione (in bit) si ottiene TPP.

Il limite attuale è fissato a 4800 TPP, cosa significa?

Prendendo come riferimento i precedenti prodotti NVIDIA: Hopper H100 e H200 hanno superato di gran lunga questo standard. Il TPP di entrambe le GPU ha raggiunto 16.000, ovvero più di tre volte il limite massimo specificato.


Anche l'RTX 4090 supera il limite con la sua potenza di calcolo FP8 di 660,6 TFLOPS.

La GPU desktop Nvidia più potente per rimanere entro il limite di 4800 TPP è la RTX 4090D, costruita appositamente per rispettare le restrizioni sull'esportazione.


Blackwell ha stabilito un nuovo punto di riferimento nelle prestazioni di calcolo, con la sua soluzione dual-chip che probabilmente produrrà circa 4.500 TFLOPS di potenza di calcolo dell’8° PQ, ovvero 7,5 volte il limite di esportazione.

In altre parole, le prestazioni del B20 saranno inferiori a 1/7 delle prestazioni del Blackwell B200!

Non solo, il B20 è soggetto anche a ulteriori restrizioni: le restrizioni "Densità di prestazione" (PD).

Si tratta di una restrizione imposta specificamente alle GPU dei data center negli Stati Uniti e le GPU consumer non ne sono interessate.

L'indicatore PD può essere ottenuto dividendo il punteggio TPP per la dimensione del chip. Il PD delle GPU esportate in Cina non deve essere superiore a 6,0.

Secondo questo indicatore, le GPU della serie RTX 40 (architettura Ada Lovelace) non possono più essere utilizzate nei data center.

Blackwell è ovviamente migliore di Ada Lovelace in termini di densità e prestazioni.

In altre parole, Nvidia deve limitare rigorosamente le prestazioni del B20 o utilizzare una percentuale maggiore di chip per conformarsi alle normative pertinenti.

Secondo Tom's Hardware, il B20 sarà il successore delle GPU AI entry-level A30 e H20 di Nvidia.

Prendendo H20 come esempio, la sua potenza di calcolo FP16 è di soli 296 TFLOPS, TPP è 2368, PD è solo 2,90, mentre H100/H200 è di 1979 TFLOPS.


Allo stesso tempo, l'A30 ha un punteggio TPP di 2640 e un punteggio PD di 3,20, leggermente superiore all'H20.

Si può vedere che la GPU AI costruita da Nvidia per il mercato cinese ha qualche margine di miglioramento nelle prestazioni, ma lo spazio è molto limitato.

Nella migliore delle ipotesi, Nvidia potrebbe cercare di creare una GPU con un TPP compreso tra 4000 e 4500 e una dimensione del die di 800 millimetri quadrati.

GB20: fare del nostro meglio per preservare le prestazioni di B20

Per rendere il prossimo B20 più efficiente, Nvidia sta impiegando le strategie utilizzate con l'H20, come l'aggiornamento della capacità di memoria poiché i chip di memoria non sono soggetti agli attuali controlli sulle esportazioni.

Secondo due persone coinvolte nello sviluppo del server, Nvidia sta lavorando per aumentare la velocità di trasferimento dei dati tra memoria e processori B20, in modo che grandi quantità di dati energetici possano essere elaborati più rapidamente.

Non solo, Nvidia utilizzerà anche la sua tecnologia NVLINK (che consente una comunicazione veloce tra diversi chip) e soluzioni di raffreddamento nel design del rack GB20.

Si prevede che ciò aumenterà l’utilizzo dei chip B20 e l’efficacia dei cluster di elaborazione GB20 nel potenziare l’intelligenza artificiale, hanno aggiunto i due.

Il sistema GB20 consentirà ai clienti di eseguire formazione e inferenza sull’intelligenza artificiale eseguendo più chip in parallelo in modo più efficiente.

Prima che il GB20 venisse scoperto, Tom's Hardware predisse coraggiosamente che il B20 sarebbe stato un chip difficile da vendere.

Ma ora, con la benedizione del GB20, sembra esserci una nuova speranza.

Riferimenti:

https://www.tomshardware.com/pc-components/gpus/nvidia-preparing-a-china-focused-variant-of-its-b200-blackwell-ai-gpu-to-comply-with-us-export- regolamenti

https://www.theinformation.com/articles/nvidias-new-china-chip-has-special-server-design-to-skirt-us-rules