notizia

3 trilioni di aziende di chip, stanno anche loro cercando di sopravvivere?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia prevede di produrre nuovamente chip AI speciali per il mercato cinese.

Secondo l'ultimo rapporto di Reuters, persone a conoscenza della questione hanno affermato che Intel sta sviluppando un nuovo chip AI di punta per il mercato cinese che soddisfa i requisiti degli attuali controlli sulle esportazioni statunitensi e aggiunge un altro membro alla linea speciale di chip Nvidia nazionale.

Vale la pena ricordare che Nvidia ha rilasciato la serie "Blackwell" a marzo di quest'anno, la cui produzione in serie è prevista entro la fine dell'anno. Secondo Nvidia, il B200 è 30 volte più veloce del suo predecessore in alcuni compiti dei migliori chip AI attualmente disponibili.

Anche questo nuovo speciale chip di punta è legato al B200. Le fonti hanno affermato che Nvidia collaborerà con Inspur Group, uno dei suoi principali partner di distribuzione in Cina, per lanciare e distribuire questo chip, provvisoriamente chiamato "B20". potrebbe avere alcune caratteristiche del B200.

Contando questo B20, in poco più di un anno Nvidia ha lanciato sette o otto chip speciali per il mercato cinese.

A800 e H800

Il 7 ottobre 2022, il governo degli Stati Uniti ha annunciato una serie di misure di controllo delle esportazioni, tra cui l’interruzione della fornitura di alcuni chip semiconduttori e apparecchiature per la produzione di chip alla Cina.

Oltre a influenzare le apparecchiature di produzione come le macchine per la fotolitografia, limita anche l'accesso della Cina a chip ad alta capacità di calcolo e di intelligenza artificiale mediante processi avanzati, vietando ad aziende statunitensi come Nvidia e AMD di vendere tali chip alla Cina e limitando anche l'intelligenza artificiale cinese. Le aziende produttrici di chip effettuano il tape-out nelle fabbriche Fab estere con tecnologia americana.

A causa di questa restrizione all'esportazione, sono state colpite sia Nvidia che AMD.

Nvidia ha affermato dopo l'introduzione delle restrizioni che il divieto ha interessato i suoi chip A100 e H100 progettati per accelerare le attività di apprendimento automatico e potrebbe ostacolare il completamento dello sviluppo del suo chip di punta H100 che sarà rilasciato nel 2022. La società ha sottolineato che le vendite dei chip interessati in Cina durante il trimestre hanno raggiunto i 400 milioni di dollari. Se le aziende cinesi decidessero di non acquistare i prodotti sostitutivi di Nvidia, questi soldi andrebbero perduti invano.

Quindi, in che modo esattamente le restrizioni alle esportazioni statunitensi limitano i chip Nvidia?

Secondo le regole di restrizione all'esportazione di circuiti integrati informatici avanzati (ECCN 3A090 e 4A090) emesse dal Dipartimento del Commercio degli Stati Uniti il ​​7 ottobre 2022, l'elenco degli articoli controllati deve soddisfare le seguenti condizioni:

a. circuiti integrati con velocità di trasferimento bidirezionale totale di tutti gli ingressi e le uscite, o programmabile, pari o superiore a 600 GB/s, diversa dalla memoria volatile, e uno qualsiasi dei seguenti circuiti integrati:

a.1. Una o più unità processore digitale che eseguono istruzioni macchina, la lunghezza in bit di ciascuna operazione moltiplicata per le prestazioni di elaborazione in TOPS e la somma di tutte le unità processore è 4800 o più;

a.2. Una o più "unità di calcolo grezze" digitali (escluse le unità che aiutano nell'esecuzione di istruzioni macchina relative al calcolo del TOPS di 3A090.a.1) la cui lunghezza in bit per operazione è moltiplicata per la somma di tutte le unità di calcolo Le prestazioni di elaborazione TOPS sono 4800 o superiori;

a.3. Una o più "unità di calcolo originali" di simulazione, multivalore o multilivello la cui prestazione di elaborazione è calcolata come TOPS moltiplicato per 8 e il totale di tutte le unità di calcolo raggiunge o supera 4800;

a.4 qualsiasi combinazione di unità di elaborazione numerica e "unità di calcolo originali" la cui somma calcolata conformemente a 3A090.a.1, 3A090.a.2 e 3A090.a.3 ammonta o più a 4800.

Il circuito integrato descritto in 3A090.a comprende unità di elaborazione grafica (GPU), unità di elaborazione tensore (TPU), processore neurale, processore di memoria, processore di visione, processore di testo, coprocessore/acceleratore, dispositivi di elaborazione adattiva, dispositivi logici programmabili sul campo. (FPLD) e circuiti integrati specifici per l'applicazione (ASIC).

Non è difficile notare che il limite più importante è il limite sulla velocità di interconnessione dei chip. Secondo questo regolamento, l'A100 più venduto di NVIDIA rientra esattamente nel limite e la sua velocità di trasferimento tra chip ha raggiunto i 600 GB/s In una certa misura, forse il Dipartimento del Commercio degli Stati Uniti ha designato questa restrizione sulla base dell’A100.

Per far fronte ai controlli sulle esportazioni, NVIDIA ha rapidamente castrato un sostituto dell'A100-A800. Il divieto statunitense è stato annunciato ufficialmente il 7 ottobre 2022 e un mese dopo, NVIDIA ha presentato l'A800 che si può dire che si adatta alle nuove normative. in passato doveva essere adattato alle condizioni locali, ma ora è adattato alle condizioni politiche.

Secondo le specifiche, la NVIDIA A800 utilizzerà la stessa architettura del chip della GPU Ampere A100. Sarà disponibile in tre versioni, due versioni PCIe da 40 GB e 80 GB e una versione SXM da 80 GB. Queste GPU forniranno fino a 9,7 TFLOP di FP64, 19,5 TFLOP di FP64 Tensor Core, 19,5 TFLOP di FP32, 156 TFLOP. (sparsità di 312 TFLOP) TF32, 312 TFLOP (sparsità di 624 TFLOP) BFLOAT16 e 624 TOPS (sparsità di 1248 TOP) INT8. La versione da 40 GB è dotata di memoria HBM2 con larghezza di banda fino a 1.555 TB/s, mentre la versione da 80 GB è dotata di memoria HBM2e con larghezza di banda fino a 2 TB/s.

Naturalmente, per soddisfare la domanda limitata, la larghezza di banda ha inevitabilmente subito un taglio, dagli originali 600GB/s a 400GB/s Un portavoce di Nvidia ha dichiarato in una dichiarazione a Reuters: "La GPU A800 è stata messa in funzione nel. terzo trimestre, un’alternativa alla GPU A100 per i clienti cinesi, l’A800 soddisfa i test espliciti del governo degli Stati Uniti per la riduzione del controllo delle esportazioni e non può essere programmato oltre tale standard.

L'analista di CCS Insight Wayne Lam ha commentato: "L'A800 sembra essere una GPU A100 riconfezionata progettata per evitare le recenti restrizioni commerciali da parte del Dipartimento del Commercio", sottolineando che 8 è un numero fortunato in Cina.

"La Cina è un mercato importante per Nvidia, ed è una buona idea riconfigurare il prodotto per evitare restrizioni commerciali", ha affermato Lam, secondo cui le capacità di comunicazione inter-chip dell'A800 sono significativamente ridotte per i data center che utilizzano migliaia di chip.

Sul successivo H100, Nvidia seguì l'esempio e inventò l'H800. Sull'A100, Nvidia ha abbassato l'interconnessione da 600 GB/s della GPU a 400 GB/s, e ha fatto la stessa cosa con l'H100. Secondo i rapporti, la velocità di interconnessione del chip H800 è stata ridotta a circa la metà di quella dell'H100, ovvero da 800 GB/s a 400 GB/s. Rispetto all'A800, le prestazioni dell'H800 hanno un impatto maggiore. Dopotutto, il primo è ridotto solo del 33%, mentre il secondo è ridotto del 50%.

All'epoca, un portavoce di NVIDIA si rifiutò di rivelare la differenza tra l'H800 e l'H100 per il mercato cinese, affermando solo che "i nostri prodotti della serie 800 sono pienamente conformi alle normative sul controllo delle esportazioni".

Quando i produttori esteri acquistano freneticamente A100 e H100, i produttori nazionali possono scegliere solo H800 e A800 con configurazioni inferiori. La versione speciale del chip NVIDIA ha limitato in una certa misura lo sviluppo di grandi modelli IA domestici.

H20 e RTX 4090D

Per le aziende nazionali, A800 e H800 hanno qualità buone e cattive. La cosa brutta è che dopo aver interrotto la larghezza di banda di Internet, le prestazioni di questi due chip sono leggermente peggiori e anche la velocità di allenamento è molto più lenta sono sia buoni che cattivi. Può essere ordinato tramite i canali Zhengcheng, ma rispetto alle società straniere, il costo dei chip sarà più alto.

Ma anche l'A800 e l'H800 non sono durati più di un anno. Il 17 ottobre 2023, il Dipartimento del Commercio degli Stati Uniti ha emesso nuove norme di controllo per regolamentare l'esportazione di circuiti integrati informatici avanzati, apparecchiature per la produzione di semiconduttori e articoli che supportano applicazioni e usi finali di supercalcolo emesse il 7 ottobre 2022. Ulteriori aggiornamenti.

Principali tra questi sono i cambiamenti nei parametri di controllo. La regola finale provvisoria rimuove la "larghezza di banda di interconnessione" come parametro per identificare i chip limitati sotto ECCN 3A090, e la sostituisce invece con "larghezza di banda di interconnessione" come parametro per identificare i chip limitati sotto ECCN 3A090 se il. chip supera i due parametri calibrati in ECCN 3A090 (3A090.ae 3A090.b), l'esportazione sarà limitata.

Secondo i documenti del Dipartimento del Commercio degli Stati Uniti, i parametri normativi 3A090.a rivisti regoleranno i circuiti integrati con una o più unità di elaborazione digitale e la "prestazione di elaborazione totale" di queste unità deve essere 4800 o superiore, o "elaborazione totale prestazioni" è 1600 o superiore e "Densità prestazioni" è 5,92 o superiore. Il nuovo ECCN 3A090.b regolerà i circuiti integrati con una o più unità di elaborazione digitale che devono avere una delle seguenti condizioni: una "prestazione di elaborazione totale" pari o superiore a 2400 ma inferiore a 4800 e una "densità di prestazione" di 1,6 o 1,6 o più ma inferiore a 5,92, oppure le "prestazioni di elaborazione totali" sono 1600 o più e la "densità delle prestazioni" è 3,2 o superiore a 3,2 ma inferiore a 5,92.

Inoltre, la regola crea un’eccezione di licenza che crea un nuovo “Avviso di eccezione di licenza per l’informatica avanzata” per i circuiti integrati di livello consumer con capacità di intelligenza artificiale al di sotto della soglia restrittiva. L’eccezione si applica a due prodotti, uno progettato o i chip venduti per l’uso nei dati center, i secondi sono chip non progettati o venduti per l'uso in data center, hanno una "prestazione di elaborazione totale" di 4800 o superiore.

Rispetto alle norme del 7 ottobre 2022, le nuove norme hanno ampliato ancora una volta l'ambito del controllo In base alla doppia regola della prestazione di lavorazione totale e della densità della prestazione, sia i prodotti non castrati che quelli castrati sono inclusi nei controlli delle esportazioni nell'ambito, sono stati colpiti A800 e H800, mentre sono stati inclusi nel divieto anche altri prodotti Nvidia L40 e L40S per il mercato dei ragionamenti e RTX 4090 nel settore consumer.

Questo fu un duro colpo per Nvidia, il che significava che i prodotti principali venduti da Nvidia all'epoca non potevano essere venduti in Cina a causa dei controlli sulle esportazioni. Dovete sapere che negli anni precedenti le entrate del business dei data center provenivano dal mercato cinese circa le entrate complessive di Nvidia dal 20% al 25% e nel quarto trimestre dell'anno fiscale 2024, a causa dei controlli sulle esportazioni, le entrate nel mercato cinese sono crollate a una sola cifra.

Indifesa, Nvidia poteva solo brandire di nuovo il machete.

Il 16 novembre 2023, un mese dopo il rilascio delle nuove regole, NVIDIA ha lanciato i chip GPU appositamente per il mercato cinese: H20, L20 e L2 H20 è basato sull'architettura Hopper di NVIDIA, mentre L20 e L2 sono basati su Ada architettura.

Tra questi, i due chip L20 e L2 sono stati adattati rispettivamente in base a L40 e L4. Poiché sono architetture vecchie e non sono comunemente utilizzate nel ragionamento e nella formazione, non hanno ricevuto molta attenzione. L'H20 è più interessante Anche se ha ottenuto 900GB/s NVLink completi grazie alle nuove normative che non limitano più la velocità di Internet, le prestazioni sono molto scontate secondo l'analista Dylan Petal, anche se l'utilizzo effettivo dell'H20 The La velocità può raggiungere il 90%, ma le sue prestazioni nell'attuale ambiente di interconnessione multischeda sono ancora vicine solo al 50% di H100.

Per l'RTX 4090 nel mercato consumer, NVIDIA ha lanciato anche un sostituto: l'RTX 4090D nel dicembre dello scorso anno. Questo chip speciale che è conforme ai controlli sulle esportazioni statunitensi è stato castrato in termini di CUDA core e consumo energetico. 12,8%, anche il consumo energetico è ridotto da 450 W a 425 W, una riduzione del 5,9%, tutte le altre specifiche principali rimangono le stesse.

A causa del leggero aumento della frequenza principale, in alcuni test benchmark, le prestazioni del 4090D sono inferiori solo del 5% circa rispetto a quelle del 4090. Rispetto ai chip AI, questo divario sembra rientrare nel range accettabile.

I quattro chip speciali consecutivi alla fine del 2023 hanno alleviato in una certa misura l'imbarazzo di Nvidia China e le hanno impedito di rimanere a corto di beni da vendere. Tuttavia, dopo due cicli di restrizioni, le grandi imprese e le piccole e medie imprese lo hanno fatto hanno iniziato a guardare altrove. La via d'uscita è acquistare chip nazionali, costruire server all'estero o acquistare H100/200 e A100 attraverso canali non ufficiali, che non hanno altra scelta se non quella di diffondersi tra i produttori nazionali.

L'abilità con il coltello di Lao Huang

I giocatori fai-da-te che hanno familiarità con le GPU da gioco non avranno molta familiarità con le abilità con i coltelli di Lao Huang.

Prendiamo un esempio relativamente recente, un anno dopo il rilascio della serie RTX 20, per differenziare meglio la linea di prodotti e rispondere al lancio di nuovi prodotti della vicina serie RX5000 di AMD, Nvidia ha lanciato la serie RTX 20 Super.

Sebbene siano basate anche sui core TU106 e TU104, Nvidia ha utilizzato questi due core per ritagliare cinque schede grafiche, vale a dire RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super e RTX 2080. Tra queste, il divario più piccolo è tra Il divario teorico di prestazioni tra il core TU106 RTX 2060 Super e l'RTX 2070 è solo del 5% circa, e anche i punteggi effettivi e i test di gioco sono molto vicini. Si può dire che Nvidia ha portato la castrazione all'estremo.

Al giorno d'oggi, i chip appositamente modificati prodotti da NVIDIA per la Cina non sono altro che una ripetizione del passato e un ritorno al vecchio business.

Oltre al B20 menzionato all'inizio, Nvidia ha intenzione di mostrare le sue capacità anche nel mercato consumer. Secondo i rapporti, il lancio della RTX 5090D, una versione ridotta della RTX 5090, è previsto per gennaio 2025. dovrebbe essere basato sull'architettura Blackwell di Nvidia. L'uso del processo 4NP di TSMC potrebbe ridurre le specifiche principali per aggirare le restrizioni all'esportazione degli Stati Uniti.

Contando questi due chip, Nvidia ha già un'enorme gamma speciale in Cina: A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Alcuni sono piuttosto ottimisti riguardo alle prospettive di questi chip in edizione speciale. L'organizzazione di ricerca SemiAnalysis stima che Nvidia dovrebbe vendere più di 1 milione di chip H20 in Cina quest'anno, per un valore di oltre 12 miliardi di dollari.

Ma Nvidia ha ancora molto di cui preoccuparsi. Secondo un rapporto degli analisti di Jeffries, quando gli Stati Uniti condurranno la revisione annuale dei controlli sulle esportazioni di semiconduttori in ottobre, è "molto probabile" vietare le vendite di chip H20 di Nvidia in Cina. L'analista ha affermato che il divieto potrebbe avvenire attraverso "prodotti specifici". divieti, limiti inferiori di capacità di elaborazione e/o capacità di memoria limitata" da implementare.

Inoltre, le schede di conformità prodotte artificialmente come H20 si basano essenzialmente sulla castrazione dei nuclei esistenti. Lo stesso vale per B20. Avrebbe potuto essere utilizzato come nucleo di H200 e B200, ma ora può essere utilizzato solo per vendere speciali più economici. edizioni , ed è probabile che la durata delle vendite sia solo superiore a un anno, quindi è un'attività in perdita, non importa da come la si guardi.

Ma Nvidia non ha via d'uscita. Può solo fare del suo meglio per bilanciare le regole e il mercato. Ma quante aziende in Cina sono disposte a pagare per i chip in edizione speciale che vengono tagliati più e più volte?