uutiset

Nvidian uuden AI-sirun julkaisu viivästyy vähintään kolmella kuukaudella, ja se vaikuttaa jättiläisiin, kuten Microsoft, Google ja Meta.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kohokohdat:

Tencent Technology News, 3. elokuuta: Ulkomaisten tiedotusvälineiden mukaan Nvidian uusin tekoälyprojekti kohtasi suunnitteluvirheen. Kahden siru- ja palvelinlaitteiston tuotantoon osallistuvan lähteen mukaan tämä onnettomuus viivästää julkaisuaikaa vähintään kolmella. kuukausia tai jopa kauemmin.

Muutoksen odotetaan vaikuttavan useisiin suuriin asiakkaisiin, kuten Metaan, Googleen ja Microsoftiin, jotka ovat ennakkotilaaneet sirusarjaa kymmenien miljardien dollarien arvosta.

NVIDIA on ilmoittanut Microsoftille, joka on yksi suurimmista asiakkaistaan, ja toiselle suurelle pilvipalveluntarjoajalle tällä viikolla, että sen uusimpien Blackwell-sarjan tekoälysirujen toimitus viivästyy Microsoftin sisäisten työntekijöiden ja toisen asian tuntevan henkilön mukaan. .

Nvidia lanseerasi Blackwell-sarjan virallisesti tämän vuoden maaliskuussa, ja toimitusjohtaja Huang Jenxun ilmoitti optimistisesti toukokuussa, että se aikoo toteuttaa tämän sarjan sirujen laajamittaiset toimitukset vuoden sisällä. Prosessi kuitenkin koki takaiskun suunnitteluvaikeuksien jälkeen. Blackwell-sirun tuotantoon suoraan osallistuvien ihmisten mukaan Nvidia työskentelee siruvalmistajansa TSMC:n kanssa suorittaakseen uuden testituotannon intensiivisen kierroksen voittaakseen nykyiset tekniset esteet.

Tätä silmällä pitäen Blackwell-sirujen suurien toimitusten odotetaan siirtyvän ensi vuoden ensimmäiselle neljännekselle. On syytä huomata, että kun pilvipalveluntarjoajat saavat sirut, suurten siruklustereiden käyttöönotto ja aktivoiminen kestää vielä noin kolme kuukautta.

Suunnittelu- ja tuotantohaasteet ovat lisänneet huolta Nvidian tilanteesta, etenkin kun Yhdysvaltain oikeusministeriö tutkii valituksia väitetystä kilpailunvastaisesta käyttäytymisestä. Tästä huolimatta Nvidia säilyttää edelleen johtavan asemansa alalla sirujensa merkittävien suorituskykyetujen ansiosta.

Osakkeenomistajilla on suuria toiveita Blackwell-sarjasta, ja Keybanc Capital Marketsin analyytikot ennustavat, että sirusarjan odotetaan nostavan Nvidian datakeskusten liikevaihtoa vuoden 2024 47,5 miljardista Yhdysvaltain dollarista yli 200 miljardiin dollariin vuonna 2025. Huang Jen-Hsun sanoi tulospuhelun aikana toukokuussa: "Todistamme Blackwellin tuovan huomattavia tuloja tänä vuonna!"

Nvidian tekoälypalvelinsiru, grafiikkaprosessoriyksikkö (GPU), on pitkään ollut OpenAI:n kaltaisten kehittäjien keskeinen liikkeellepaneva voima keskustelu- ja videotekoälyn alalla. Samalla nämä GPU:t auttavat pilvipalvelujättiläisiä, kuten Microsoftia, saavuttamaan merkittävää myyntikasvua vuokraamalla siruresursseja muille kehittäjille.

Jos tulevat tekoälysirut B100, B200 ja GB200 viivästyvät vähintään kolme kuukautta, se voi häiritä joidenkin asiakkaiden käyttöönottosuunnitelmia, jolloin he eivät pysty ajamaan suuria siruklustereita datakeskuksissa vuoden 2025 ensimmäisellä neljänneksellä. .

Raskaat asiakkaat, kuten Microsoft, OpenAI ja Meta, odottavat innolla Nvidian uusia siruja, joiden tavoitteena on käyttää näitä teknologioita päivittääkseen ja kehittääkseen seuraavan sukupolven suuria kielimalleja, jotka ovat ChatGPT:n, Meta AI -avustajan ja innovatiivisen automaation takana oleva ydinohjelmisto. toimintoja.

Nämä yritykset korostavat, että tarvitaan enemmän laskentatehoa, jotta ohjelmistojen suorituskyvyssä saavutetaan suuria harppauksia, jotta voidaan vastata tarkemmin monimutkaisiin kyselyihin, automatisoida monivaiheisia tehtäviä tai luoda erittäin realistista videosisältöä. Heillä on suuria toiveita Nvidian seuraavan sukupolven tekoälysirujen suhteen, erityisesti niiden suorituskyvyn hyppyjen suhteen, kun ne integroidaan supertietokoneklusteriin.

Nvidian tiedottaja oli varovainen viivästyneisiin toimituksiin liittyviin lausuntoihin ja sanoi vain, että "tuotannon edistymistä nopeutetaan suunnitellusti" myöhemmin tänä vuonna.

Microsoftin, Googlen, Amazonin ja Metan viralliset edustajat päättivät olla kommentoimatta. TSMC:n tiedottaja ei vastannut kommenttipyyntöön.

On syytä huomata, että Nvidian suurilla asiakkailla on suuria toiveita GB200-sirun suhteen ja heillä on kunnianhimoisia suunnitelmia. Äskettäin Google, Meta ja Microsoft ovat paljastaneet valtavan investointinsa datakeskuksiin ja tekoälysiruihin. Tämä harvinainen liike ei vain nostanut Nvidian osakekurssia väliaikaisesti, vaan myös herätti markkinoiden huolta näiden yritysten investointien tuottosyklistä ja tuottonäkymistä. Keskusteltu laajasti.

Blackwell iso tilaus

Kahden sirutuotannon lähteen mukaan Google on tilannut yli 400 000 GB200-sirua. Yhdessä siihen liittyvien palvelinlaitteistojen kanssa tilauksen kokonaishinta voi olla reilusti yli 10 miljardia dollaria, mutta tarkka toimitusaika on edelleen epäselvä. Sitä vastoin Googlen investoinnit siruihin, laitteisiin ja omaisuuteen ovat tänä vuonna nousseet noin 50 miljardiin dollariin, mikä on yli 50 % enemmän kuin vuotta aiemmin.

Samaan aikaan Meta tekee myös suuria liikkeitä, ja sen kokonaistilausten odotetaan olevan vähintään 10 miljardia dollaria. Vaikka Microsoft ei julkistanut tilausten kokonaiskokoa, se on tehnyt tilauksiin 20 % asteittaisia ​​muutoksia viime viikkoina. Suoraan tietävien ihmisten mukaan Microsoft valmistautuu varustamaan OpenAI:ta 55 000–65 000 GB200-sirulla vuoden 2025 ensimmäiseen neljännekseen mennessä.

Asiaan perehtynyt henkilö kertoi, että Microsoft suunnitteli alun perin toimittavansa Blackwell-pohjaiset palvelimet OpenAI:lle ensi vuoden tammikuuhun mennessä, mutta nyt se saattaa joutua säätämään maaliskuuhun tai alkukevääseen.

Kaksi Blackwell-sirun valmistusprosessiin osallistunutta sisäpiiriläistä sanoi, että sirun suunnitteluongelmia on ilmennyt viime viikkoina, ja TSMC:n insinöörit löysivät keskeisiä puutteita massatuotannon valmisteluvaiheessa. Erityisesti ongelma keskittyy prosessorisiruun, joka yhdistää kaksi Blackwell GPU:ta. Tämän piikomponentin vika vaikuttaa suoraan kokonaistuloon, mikä tarkoittaa, että TSMC:n Nvidialle toimittamien sirujen määrä on rajoitettu. Tällaiset ongelmat saavat usein yritykset keskeyttämään tuotantonsa.

Tämän vuoksi NVIDIA muuttaa kiireellisesti suunnittelusuunnitelmaa ja sen on suoritettava tuotantotestit uudelleen TSMC:ssä varmistaakseen, että ongelma on ratkaistu ennen massatuotantoprosessin aloittamista.

Asiaan perehtyneiden ihmisten mukaan Nvidia on paljastanut ainakin yhdelle pilvipalveluntarjoajalle, että nykyisten vaikeuksien selviytymiseksi ja tuotteiden toimituksen nopeuttamiseksi yhtiö harkitsee vaihtoehtona lanseeraamassa vain yhdellä Blackwell-sirulla varustettua versiota. .

epätavallinen viive

TSMC suunnitteli alun perin käynnistävänsä Blackwell-sirujen massatuotannon kolmannella vuosineljänneksellä ja odotti aloittavansa massatoimitukset Nvidian asiakkaille neljännellä neljänneksellä. Nyt on kuitenkin odotettavissa, että Blackwell-sirujen massatuotanto viivästyy neljännelle vuosineljännekselle. Jos uusia ongelmia ei ilmene tulevaisuudessa, palvelimia toimitetaan suuria määriä seuraavilla vuosineljänneksillä.

Haketuotannon viivästykset eivät ole harvinaisia. Asiaan perehtyneiden ihmisten mukaan myös Nvidia kohtasi viivästyksiä lippulaivansa GPU:n varhaisissa versioissa vuonna 2020, mutta sen markkinavaikutus oli tuolloin vielä vähäinen ja asiakkaiden odotukset tilauksista eivät olleet korkealla, joten välitön vaikutus datakeskukseen ja siru sijoitustulot olivat rajalliset.

On kuitenkin epätavallista, että suuri suunnitteluvirhe havaitaan juuri ennen massatuotantoa. Normaaleissa olosuhteissa sirusuunnittelutiimi tekee tiivistä yhteistyötä valmistajien, kuten TSMC:n, kanssa ja käy läpi useita tuotantotestaus- ja simulaatiokierroksia varmistaakseen, että tuote on kypsä ja luotettava ennen suurten tilausten hyväksymistä.

TSMC:n sisäisten työntekijöiden mukaan maailman johtavana siruvalmistajana TSMC on harvoin keskeyttänyt tuotantolinjaansa suunnitellakseen uudelleen tätä massatuotantoon tulevaa tuotetta. GB200-sirujen laajamittaisen tuotantosuunnitelman vuoksi TSMC on varannut tuotantoresursseja etukäteen, mutta nämä resurssit jäävät käyttämättä, kunnes ongelma on ratkaistu.

Lisäksi suunnitteluvirhe on vaikuttanut myös Nvidian NVLink-palvelintelineiden tuotantoon ja toimitusaikatauluun, koska asianomaisten yritysten on odotettava uusia sirunäytteitä telinesuunnittelun valmistumista varten. (Koottu/Golden Deer)