uutiset

harvinainen!Raportti: Nvidian uusimman AI-sirun julkaisu viivästyy suunnitteluvirheiden vuoksi

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidian uuden Blackwell-sirusarjan edistynein AI-siru saattaa viivästyä julkaisussa.

The Informationin mukaan asiaan perehtyneisiin ihmisiin viitaten Nvidian tuleva tekoälysiruKolmen kuukauden tai enemmän viivästyksiä suunnitteluvirheiden vuoksi.

Tämä voi vaikuttaa asiakkaisiin, kuten Meta Platformsiin, Googleen ja Microsoftiin, jotka ovat yhdessä tilaaneet kymmenien miljardien dollarien arvoisia pelimerkkejä.

Nvidia ei kommentoinut viivästystä koskevaa ilmoitusta, mutta sanoi, että asiakkaat testaavat näytteitä Blackwell-siruista ja "tuotannon odotetaan nousevan" myöhemmin tänä vuonna.

Ei ole yleistä, että suuria suunnitteluvirheitä havaitaan ennen massatuotantoa

The Information lainasi Blackwell-sirun tuotantoon osallistuneita ihmisiä sanoneen, että Blackwellin suunnitteluongelmia on ilmaantunut viime viikkoina.Koska TSMC:n insinöörit löysivät vian valmistautuessaan massatuotantoon.

GB200-siru sisältää kaksi kytkettyä Blackwell GPU:ta ja Grace-keskusyksikön. Vika koskee prosessorisirua (piinpala, jota käytetään sirun piirien sijoittamiseen), joka on kytketty kahteen Blackwell GPU:hun. Este vähentää sirujen määrää, jonka TSMC voi tuottaa Nvidialle, ja saattaa jopa saada yrityksen pysäyttämään tuotannon.

Raporttien mukaan Nvidia suorittaa uutta koetuotantoa siruvalmistajansa TSMC:n kanssa.Jotta kone ei rajoita,TSMC on käynnistänyt uudelleen toisen korkean profiilin tuotteen tuotannon, joka lähestyy massatuotantoa ongelman ratkaisemiseksi.Tämäkin tilanne on harvinainen.

Analyytikot uskovat, että on erittäin epätavallista, että suuria suunnitteluvirheitä havaitaan ennen massatuotantoa. Koska useita tuotantokoeajoja ja simulaatioita tarvitaan alkuvaiheessa tuotteen toteutettavuuden ja sujuvan valmistusprosessin varmistamiseksi.

Alkuperäisen suunnitelman mukaan TSMC aloittaa Blackwell-sirujen massatuotannon kolmannella neljänneksellä ja alkaa toimittaa niitä Nvidialle viimeisellä neljänneksellä. Huang sanoi toukokuussa, että yritys aikoi lähettää suuria määriä Blackwelliä myöhemmin tänä vuonna.

Tämä suunnitteluvirhe voi viivästyttää Blackwellin pääsirujen (B200 ja GB200) tuotantoa vähintään kolmella kuukaudella, ja Blackwellin massatuotanto viivästyy ensi vuoden ensimmäiseen neljännekseen. Sirujen vastaanottamisen jälkeen pilvipalveluntarjoajilla kestää tyypillisesti noin kolme kuukautta ottaa suuret klusterinsa käyttöön.

Jättiläisten odotukset ovat pettyneet, ja vielä on epäselvää, milloin tavarat saadaan perille.

Blackwelliä voidaan kuvata "valkoiseksi kuutamoksi" teknologiayritysten mielissä, joka kantaa jättiläisten suuria toiveita.

Jos tulevat AI-sirut, kuten B100, B200 ja GB200, viivästyvät vähintään kolme kuukautta, Nvidian asiakkaat voivat olla pettyneitä.

Näitä asiakkaita ovat muun muassa Microsoft, Meta ja OpenAI. Heillä on suuret odotukset Nvidian AI-siruille, ja he aikovat käyttää Nvidian kehittämiä "supertietokoneita" tuottaakseen tuleville sukupolville suuria kielimalleja, Meta AI -avustajia ja muita automatisoituja toimintoja.

The Information lainasi asiaa tuntevien ihmisten sanoneen, että Meta oli tehnyt tilauksia vähintään 10 miljardin dollarin arvosta, kun taas Microsoft oli kasvattanut tilauskokoaan 20 % viime viikkoina. Microsoft suunnittelee saavansa OpenAI:lle 55 000–65 000 GB200-sirua vuoden 2025 ensimmäiseen neljännekseen mennessä.

Ilmeisesti päivämäärä, jolloin Microsoft vastaanotti nämä tilaukset, on tullut tuntemattomaksi.

Tämä saattaa vaikuttaa NVLink-palvelintelineisiin

Suunnitteluvirhe vaikuttaa myös Nvidia NVLink -palvelintelineiden tuotantoon ja toimitukseen, sillä palvelimilla työskentelevien yritysten on odotettava uusia sirunäytteitä ennen palvelintelineiden suunnittelun viimeistelyä.

Aiemmin Tianfeng Internationalin analyytikko Ming-Chi Kuo huomautti, että GB200 NVL36:n laskentatehoedusta ei ole epäilystäkään, mutta se kohtaa myös monia ennennäkemättömiä suunnittelu- ja tuotantohaasteita .

Jokainen GB200 NVL36 -kaappi kuluttaa noin 80 kW tehoa AMAXin tämän vuoden huhtikuussa tekemän tutkimuksen mukaan tällä hetkellä alle 5 % maailman datakeskuksista pystyy tukemaan 50 kW:n palvelimia kaappia kohden. Siksi ennen GB200 NVL36:n ostamista sinun on varmistettava, että asennusta varten on tarpeeksi tilaa.
GB200 NVL72:n yksikaappiversio kuluttaa 130 kW kaappia kohden, eikä sitä voida valmistaa massatuotantona lyhyellä aikavälillä.