nachricht

nvidias „quelle des niedergangs“: modernste chips, je leistungsstärker die leistung, desto schwieriger ist die herstellung

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor |. gao zhimo

herausgeber |. harte ki

wenn nvidias „quelle des niedergangs“ in einem satz zusammengefasst werden könnte, wären es hochmoderne chips. je stärker die leistung, desto schwieriger ist ihre herstellung.

am mittwoch meldete nvidia zwar starke quartalsumsätze und gewinne, stellte aber auch fest, dass herstellungsschwierigkeiten bei neuen chips zu geringeren gewinnmargen geführt hätten und dass das unternehmen im letzten quartal rücklagen in höhe von 908 millionen us-dollar gebildet habe. davon betroffen fiel der aktienkurs am donnerstag um 6,4 %.

das unternehmen gab in einer erklärung zu, dass gpus mit blackwell-architektur probleme mit der ausbeute haben und einen teil des b200-prozessordesigns neu gestalten müssen, um die ausbeute zu verbessern. daher wird die massenproduktion der gpu mit blackwell-architektur auf das vierte quartal 2024 verschoben:

„wir haben das design der blackwell-gpus angepasst, um die produktionsausbeute zu verbessern. der produktionsplan von blackwell wird im vierten quartal beginnen und bis zum geschäftsjahr 2026 andauern.“

wir gehen davon aus, dass blackwell-produkte im vierten quartal einen umsatz in milliardenhöhe generieren werden. "

zur genauen ursache des problems machte nvidia keine angaben. analysten und branchenmanager glauben jedoch, dass die technischen herausforderungen in erster linie auf komplexe probleme im herstellungsprozess zurückzuführen sind, die sich aus dem design des blackwell-chips ergeben.

die analyse ergab, dass die enorme größe und das komplexe design von blackwell zu einer beispiellosen komplexität bei der herstellung geführt haben. defekte an komponenten können dazu führen, dass der chip verschrottet wird, was sich negativ auf die ausbeute und den gewinn auswirkt. darüber hinaus können unterschiede in den wärmeausdehnungskoeffizienten verschiedener teile des chips auch zu einer verformung des gehäuses führen, was die leistung und zuverlässigkeit beeinträchtigt.

um die ausbeute zu verbessern, hat nvidia das blackwell-design angepasst und plant, die produktion wie geplant zu steigern. analysten glauben jedoch, dass die komplexität der einführung der neuen chip-verbindungstechnologie von tsmc und die mit der chipgröße verbundenen herausforderungen weiterhin die haupthindernisse für die massenproduktion von blackwell sein werden.

g. dan hutcheson, vizepräsident des branchenanalyseunternehmens techinsights, sagte:

„das problem besteht darin, die chips zusammenzuarbeiten und die ausbeute zu verbessern. wenn die ausbeute jedes teils des chips nicht hoch genug ist, kann schnell alles kaputt gehen.“

01

die komplexität von blackwell-chips

um seine führende position im bereich der chips für künstliche intelligenz zu behaupten, setzt nvidia (nvda) auf das prinzip „größer ist besser“. allerdings führt eine größere größe zwar zu einer stärkeren leistung, bringt aber auch größere herstellungsschwierigkeiten mit sich.

der neueste ki-chip von nvidia, blackwell, wird von huang jen-hsun als „sehr, sehr große gpu“ beschrieben. im physischen sinne ist er tatsächlich die derzeit größte gpu. er besteht aus zwei blackwell-chips und verwendet den 4-nm-prozess es verfügt über 2080 milliarden transistoren – 2,6-mal so viel wie die vorherige generation.

ubs-analysten sagten anfang des monats in einem bericht, dass das hauptproblem, auf das nvidia bei blackwell gestoßen sei, die komplexität der einführung der neuen cowos-l-paketierungsmethode von tsmc sei.

semianalysis, ein fachmedium der halbleiterindustrie, berichtete, dass diese verpackungstechnologie einen rdl-interposer mit lokalen silizium-verbindungsbrücken (lsi) verwendet, um die kernpartikel zu verbinden, und dass die übertragungsrate etwa 10 tb/s erreichen kann brücken erfordern extrem hohe anforderungen. ein defekt in einer komponente kann dazu führen, dass der gesamte chip im wert von 40.000 us-dollar verschrottet wird, was sich auf ertrag und gewinn auswirkt.

darüber hinaus kommt es aufgrund der nichtübereinstimmung des wärmeausdehnungskoeffizienten (cte) zwischen dem gpu-chip, den lsi-brücken, dem rdl-interposer und dem motherboard-substrat zu chipverformungen und systemausfällen. berichten zufolge musste nvidia die obere metallschicht und die unebenheiten des gpu-chips neu gestalten, um die ausbeute zu verbessern.

huang jenxun betonte in einer telefonkonferenz mit analysten, dass der blackwell-chip keine „funktionalen änderungen“ erfordere und alle anpassungen der verbesserung der ausbeute dienten.

finanzchefin colette kress sagte, dass nvidia die blackwell-produktion wie geplant steigert und erwartet, dass blackwell dem unternehmen im vierten quartal einnahmen in milliardenhöhe bescheren wird.

02

micron fügt neuen dram-produktionserweiterungsplan hinzu

laut japanischen medienberichten plant micron den bau einer neuen dram-chip-produktionsanlage in der präfektur hiroshima, japan, mit dem ziel, diese bereits ende 2027 in betrieb zu nehmen.

diese art von problem tritt nicht nur bei nvidia auf. brancheninsider gehen davon aus, dass solche probleme zunehmen werden, da chiphersteller versuchen, die rechenleistung durch eine vergrößerung der chips zu steigern. auch änderungen des chipdesigns zur beseitigung von fehlern oder zur verbesserung der ausbeute sind in der branche üblich.

auch su zifeng, ceo des chipgiganten amd, wies darauf hin, dass mit zunehmender chipgröße die fertigungskomplexität unweigerlich zunehmen werde.chips der nächsten generation müssen durchbrüche bei energieeffizienz und stromverbrauch erzielen, um den enormen bedarf an rechenleistung in rechenzentren für künstliche intelligenz zu decken.

„es sind viele technische investitionen erforderlich, damit diese technologien funktionieren“, sagte sie. „werden sie komplexer und größer? daran besteht kein zweifel. das ist unsere realität.“

natürlich stieß nvidias radikale strategie, zwei größte chips zu blackwell zu kombinieren, um die größenbeschränkung eines einzelnen chips zu durchbrechen, auch bei der konkurrenz auf zweifel.

andrew feldman, gründer des konkurrenten cerebras systems, glaubt, dass die schwierigkeit bei der entwicklung der multi-chip-kombinationstechnologie exponentiell zunehmen wird. cerebras systems entschied sich für die entwicklung eines riesigen einzelchips und startete einen darauf basierenden cloud-computing-dienst mit künstlicher intelligenz, um nvidias marktposition herauszufordern.

andrew feldman sagte:

„um sinnvolle arbeit in der künstlichen intelligenz zu leisten, ist viel rechenleistung erforderlich, was viele transistoren erfordert, mehr als ein einzelner chip aufnehmen kann …

es ist bereits schwierig, eine zwei-chip-technologie zu entwickeln, es ist noch schwieriger, eine vier-chip-technologie zu entwickeln, und es ist noch schwieriger, eine acht-chip-technologie zu entwickeln. "

ob sich nvidias riesenchip-strategie am ende durchsetzen kann, muss der markt noch prüfen. sicher ist jedoch, dass die ultimative herausforderung der chipherstellung gerade erst begonnen hat.