notizia

raro!Rapporto: rilascio dell'ultimo chip AI di Nvidia ritardato a causa di difetti di progettazione

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Il chip AI più avanzato della nuova serie di chip Blackwell di Nvidia potrebbe subire un ritardo nel rilascio.

Secondo The Information, citando persone che hanno familiarità con la questione, il prossimo chip di intelligenza artificiale di Nvidia lo faràRitardi di tre mesi o più dovuti a difetti di progettazione.

Ciò potrebbe influenzare clienti come Meta Platforms, Google e Microsoft, che hanno ordinato collettivamente chip per un valore di decine di miliardi di dollari.

Nvidia non ha voluto commentare l'annuncio del ritardo, ma ha detto che i clienti stanno testando campioni dei chip Blackwell e che "la produzione dovrebbe aumentare" entro la fine dell'anno.

Non è comune che i principali difetti di progettazione vengano scoperti prima della produzione di massa

Secondo The Information, alcune persone coinvolte nella produzione dei chip Blackwell avrebbero affermato che nelle ultime settimane sono emersi problemi di progettazione Blackwell.Perché gli ingegneri di TSMC hanno scoperto il difetto mentre si preparavano per la produzione di massa.

Il chip GB200 contiene due GPU Blackwell collegate ed un'unità di elaborazione centrale Grace. Il difetto riguarda un chip del processore (un pezzo di silicio utilizzato per ospitare i circuiti del chip) collegato a due GPU Blackwell. L'ostacolo riduce la quantità di chip che TSMC può produrre per Nvidia e potrebbe persino causare l'interruzione della produzione da parte dell'azienda.

Secondo i rapporti, Nvidia sta conducendo una nuova produzione di prova con il produttore di chip TSMC.Per non lasciare che la macchina limiti,TSMC ha riavviato la produzione di un altro prodotto di alto profilo che si sta avvicinando alla produzione di massa per risolvere il problema.Anche questa situazione è rara.

Gli analisti ritengono che sia molto insolito che i principali difetti di progettazione vengano scoperti prima della produzione di massa. Perché nella fase iniziale sono necessari più test e simulazioni di produzione per garantire la fattibilità del prodotto e un processo di produzione regolare.

Secondo il piano originale, TSMC inizierà la produzione di massa dei chip Blackwell nel terzo trimestre e inizierà a consegnarli a Nvidia nel quarto trimestre. Huang ha dichiarato a maggio che la società prevede di spedire grandi quantità di Blackwell entro la fine dell'anno.

Questo problema di difetto di progettazione potrebbe ritardare i chip principali di Blackwell (B200 e GB200) di 3 mesi o più e la produzione di massa di Blackwell sarà ritardata fino al primo trimestre del prossimo anno. Dopo aver ricevuto i chip, in genere i fornitori di servizi cloud impiegano circa tre mesi per mettere in funzione i loro cluster su larga scala.

Le aspettative dei colossi sono state deluse e non è ancora chiaro quando arriverà la merce.

Blackwell può essere descritto come il "chiaro di luna bianco" nelle menti delle aziende tecnologiche, che trasporta le grandi speranze dei giganti.

Se i prossimi chip AI come B100, B200 e GB200 subiranno un ritardo di tre mesi o più, i clienti di Nvidia potrebbero rimanere delusi.

Questi clienti includono Microsoft, Meta e OpenAI, ecc. Hanno grandi aspettative per i chip AI di Nvidia e prevedono di utilizzare i "supercomputer" sviluppati da Nvidia per produrre generazioni future di modelli linguistici su larga scala, assistenti Meta AI e altre funzioni automatizzate.

Secondo The Information, persone a conoscenza della questione avrebbero affermato che Meta aveva effettuato ordini per un valore di almeno 10 miliardi di dollari, mentre Microsoft aveva aumentato la dimensione degli ordini del 20% nelle ultime settimane. Microsoft prevede di avere 55.000-65.000 chip GB200 pronti per OpenAI entro il primo trimestre del 2025.

Ovviamente la data in cui Microsoft ha ricevuto questi ordini è diventata sconosciuta.

I rack dei server NVLink potrebbero essere interessati

Il difetto di progettazione influenzerà anche la produzione e la consegna dei rack di server Nvidia NVLink, poiché le aziende che lavorano sui server devono attendere nuovi campioni di chip prima di finalizzare la progettazione dei rack di server.

In precedenza, l'analista di Tianfeng International Ming-Chi Kuo aveva sottolineato che non ci sono dubbi sul vantaggio in termini di potenza di calcolo del GB200 NVL36, ma deve anche affrontare molte sfide di progettazione e produzione senza precedenti. La risposta è dubbia se possa garantire spedizioni su larga scala come previsto .

Ciascun cabinet di GB200 NVL36 consuma circa 80 kW di potenza. Secondo un sondaggio condotto da AMAX nell'aprile di quest'anno, attualmente meno del 5% dei data center nel mondo può supportare server da 50 kW per cabinet. Pertanto, prima di acquistare GB200 NVL36, è necessario assicurarsi che ci sia spazio sufficiente per l'installazione.
La versione ad armadio singolo del GB200 NVL72 consuma 130 kW per armadio e non può essere prodotta in serie a breve termine.