Nachricht

Einkreisung und Unterdrückung von NVIDIA |

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Text|Qiu Xiaofen

Interview|Qiu Xiaofen und Yang Xiao

Herausgeber|Su Jianxun Yang Xuan

widerstehen

Eine geheime WeChat-Gruppe wird mündlich unter Leuten von KI-Chip-Unternehmen in Zhangjiang, Shanghai, verbreitet. Der Name der Gruppe lautet „Domestic Chip Group Warming Group“. Sogar Konkurrenten werden Informationen austauschen und Geschäftsressourcen austauschen.

Die „inländische Chipgruppe für Wärme“ hat eine Waffenstillstandszone abgegrenzt, in der Kollegen vorübergehend Waffenstillstand schließen und sich gegenseitig helfen können, nur weil alle einen gemeinsamen Feind haben: NVIDIA.

Aufgrund der Existenz von Nvidia haben die Umsätze inländischer Chiphersteller eine gewisse Demütigung erfahren.

Li Ming (Pseudonym) ist Verkäufer bei einem inländischen GPU-Unternehmen. Als der KI-Boom begann, ging er selbstbewusst zu den Kunden, hatte aber keine Zeit, „Hallo“ zu sagen.

„Was ist der Unterschied zwischen Ihren Geräten und dem A100-Chip von NVIDIA? NVIDIA hat NVLink, was haben Sie?“ (Anmerkung des Autors: NVLink verbindet mehrere GPU-Chips, um zu verhindern, dass GPU-Daten für Berechnungen auf die CPU verschoben werden, um die Recheneffizienz zu verbessern.)

Als Li Mings Team sah, dass sie ihre Kunden mit ihren Produkten und Technologien nicht beeindrucken konnten, begann sie darüber nachzudenken, wie sie sich auf Verbindungen verlassen und „einflussreichere Leute“ für die Lobbyarbeit finden könnten NVIDIA.“

NVIDIA A100 mit 54 Milliarden Transistoren auf einer Fläche von 826 Quadratmillimetern ist der Schlüssel zum Öffnen der Zauberkiste großer KI-Modelle.

Das Training großer Modelle ist wie das „Verfeinern von Elixieren“ in großen Datenmengen mit dem Ziel, die Muster von Datenänderungen herauszufinden.Die Verwendung von NVIDIA-Chips zum Trainieren großer Modelle ist, als würde man Hunderte Millionen Menschen mit einem IQ von 200 zum Rechnen auffordern, während die Wirkung anderer Chips nur so ist, als würde man Tausende von Menschen mit einem IQ von 100 zum Rechnen auffordern.


NVIDIA A100-Bilder von der offiziellen NVIDIA-Website

Die Top-Technologieunternehmen beeilen sich alle, Nvidia zu kaufen. Wer über die meisten NVIDIA-High-End-GPUs verfügt, hat die Möglichkeit, intelligentere Großmodelle zu trainieren.

Öffentliche Informationen zeigen, dass OpenAI derzeit die größte Anzahl von NVIDIA-High-End-GPUs weltweit kontrolliert, mindestens 50.000 Stück sind auch Eigentümer von Wanka-Clustern (ca. 26.000); und es ist selten, dass es in China ein Internet gibt Netzwerk mit Nvidia High-End-GPU-Wanka-Clustern. Der Große ist ByteDance (13.000).

NVIDIA monopolisiert die besten Ressourcen in der globalen Industriekette – es verfügt über die umfangreichste Produktionskapazität für fortschrittliche Chips bei TSMC, es verfügt über die größte Benutzergruppe von Ingenieuren weltweit und es kontrolliert den Computer-Lebensnerv vieler KI-Unternehmen.

Ein absolutes Monopol führt oft zu Unzufriedenheit, Wut und Flucht.

„Jeder, der heute große Modelle herstellt, verliert im Grunde ernsthaft Geld! Nur einer verdient Geld! NVIDIA“, sagte ein Brancheninsider wütend –„Die Gewinnspanne von NVIDIA bereitet allen Kunden Unbehagen und schadet der KI-Branche!“

Der Finanzbericht zeigt, dass die Bruttogewinnmarge von Nvidia 71 % erreichte, wobei die beliebten Produkte der Serien A100 und H100 Bruttogewinnmargen von bis zu 90 % aufweisen. Als Hardware-Unternehmen erzielt Nvidia tatsächlich höhere Bruttogewinnmargen als Internet-Softwareunternehmen.

Hohe Preise und enorme Gewinne veranlassten Nvidias Großkunden zur Flucht. Am 30. Juli gab Apple bekannt, dass sein KI-Modell mit 8.000 Google-TPUs trainiert wurde, während der Inhalt von NVIDIA bei 0 lag. Sobald die Nachricht bekannt wurde, fiel der Aktienkurs von NVIDIA am 31. Juli um mehr als 7 %, der größte Rückgang in der Vergangenheit drei Monate, und sein Marktwert verflüchtigte sich um 193 Milliarden US-Dollar.Ich hätte fast ein Pinduoduo verloren.


Diagramm zum Rückgang des NVIDIA-Aktienkurses im vergangenen Jahr

Für alle inländischen GPU-Unternehmen, die Nvidia ein Stück Fleisch abreißen wollen, ist 2022 ein Wendejahr. In den USA wurden mehrere Verbote erlassen, die gezwungen sind, ihren Lebensunterhalt zu verdienen, und weiterhin kastrierte Versionen von Chips auf den Markt bringen in China werden sie aber schnell wieder verboten:

  • Im September 2022 wurde der Export von A100/H00 nach China verboten, und NVIDIA brachte im Oktober 2023 die kastrierte Version A800/H800 auf den Markt. Im Juni 2024 wurde der Export von A800/H800/L40/L40S/RTX4090 verboten. NVIDIA-Gründer Huang Jenxun sagte, dass es kastrierte Versionen der L20- und H20-Chips nach China bringen werde.

Allerdings löste die kastrierte Version eine stärkere Verurteilung seitens der Branche aus. Der kommende H20 von Nvidia ist halb so teuer wie der H100 von Nvidia, seine Leistung beträgt jedoch nur ein Drittel des Erstgenannten. Eine Person aus der KI-Branche prangerte wütend an: „ Ist das nicht nur Gelddiebstahl? Reine IQ-Steuer! "

Als die Kunden von Nvidia unzufrieden und wütend wurden, wurden die inländischen Chiphersteller, die Nvidia ersetzen wollten, von dieser Emotion „genährt“.

Früher konnten sie nur Nvidias Hintern folgen und ein bisschen vom Kuchen essen. Laut Daten des Halbleiteranalyseunternehmens TechInsights wird Nvidias Marktanteil bei den GPU-Lieferungen für Rechenzentren im Jahr 2023 bis zu 98 % erreichen. Inländische Chips und alle Chipgiganten zusammengenommen,Nur magere 2 %.

Jetzt, wo das Verbot greift, ist das perfekte Nvidia auf dem chinesischen Markt auseinandergerissen. Wer kann Nvidia ersetzen? Inländische Hersteller von KI-Chips sehen Hoffnung.

„In diesem Jahr wurden 90 % des NVIDIA-Marktes in China freigegeben.Ob Sie es packen können oder nicht, hängt von Ihrem Können ab.", sagte der Gründer eines inländischen GPU-Unternehmens.

36 Krypton veröffentlichte im Jahr 2021 einmal „Deep Krypton | CATL: Cracks in the Trillion Battery Empire“. In der Energiebatteriebranche ist CATL beispiellos und wird von der Konkurrenz im Auge behalten.

Heutzutage wird Nvidia, der dominierende Player im Bereich der KI-Chips, von vielen Konkurrenten ebenfalls als Dorn im Auge angesehen. Der Unterschied zwischen Nvidia und Nvidia besteht jedoch darin, dass die Hürden höher sind und der Abstand zu seinen Konkurrenten größer ist noch breiter.

Wir versuchen, die „Risse in NVIDIA“ durch den Widerstand der NVIDIA-Gegner zu finden. Obwohl die inländischen GPU- und KI-Chiphersteller schwach sind, verstehen sie den chinesischen Markt besser und ihre Spielmethoden sind stärker lokalisiert Intel, AMD usw. Die etablierten Chipgiganten haben mehr Munition, um gegen Nvidia anzutreten.

Kurzfristig wird Nvidia nicht besiegt, aber es wird nicht ungeschoren bleiben. Das wird ein blutiger Krieg.

Ausbrechen

Wenn Sie durchbrechen wollen, müssen Sie die Schwächen Ihres Gegners finden.Eine der Schwächen von Nvidia: Arroganz.

Die Chipindustrie ist im Wesentlichen eine To-B-Softwareindustrie. Kunden benötigen „begleitende“ Dienstleistungen von Chipherstellern, wie z. B. das Debuggen von Hardware und die Kompatibilität von Software und Hardware. Nur wenn die Zusammenarbeit vorhanden ist, können Kunden treu bleiben und Chipprodukte werden nicht einfach ersetzt.

Allerdings sagten viele inländische Chipexperten gegenüber 36Kr, dass es auf dem chinesischen Markt, mit Ausnahme großer Abnehmer mit Milliardenbeträgen wie BAT und Byte, für die meisten anderen Unternehmen fast schwierig sei, Investitionen von Nvidia zu erhalten, selbst wenn ihr Transaktionsvolumen mehrere zehn Millionen erreicht . Kundendienst.

Mit anderen Worten: Wenn chinesische Ingenieure, die NVIDIA-Chips verwenden, Zweifel haben, können sie sich nur darauf verlassen, dass sie auf der offiziellen Website von NVIDIA nach Dokumenten suchen oder sich an die Community wenden, um selbst zu lernen.

Bei der Zusammenarbeit mit NVIDIA werden die unterschiedlichen Bedürfnisse chinesischer Kunden oft nicht berücksichtigt.Eine Person aus der Chipbranche sagte gegenüber 36Kr, dass Nvidia in China im Allgemeinen die hochwertigsten und teuersten Komplettlösungen bewirbt. Wenn Kunden individuelle Anfragen für bestimmte Szenarien stellen, werden sie in der Regel abgelehnt Machen Sie sich selbst Gedanken darüber oder suchen Sie sich ein leistungsstarkes Algorithmenunternehmen, das dies übernimmt.

Dieses Vorgehen von Nvidia hat viele Beschwerden von kleinen und mittleren Kunden hervorgerufen. „Nvidia schenkt als großer Hersteller heute nicht mehr so ​​viel Aufmerksamkeit auf kleine Kunden wie früher. Ihre Produkte haben keine Konkurrenten und sie müssen nicht hart arbeiten, um die Kunden zufrieden zu stellen“, sagte die oben genannte Person.

Doch in der Vergangenheit hat der Aufstieg des NVIDIA-Ökosystems tatsächlich die Bedeutung von Dienstleistungen für die Chipindustrie bestätigt: Im Jahr 2006, als das CUDA-Ökosystem gerade erst begann, waren NVIDIA-Produkte nicht so gut wie die heutigen heimischen Chips. Aber das NVIDIA-Team begann zunächst mit den wissenschaftlichen Forschungsteams der Universitäten und drang dann in Start-up-Unternehmen in jedem Teilsektor ein, um Software und Hardware anzupassen, und erst dann wurde es heute zu einem großen Land.


NVIDIA H100 Quelle: Offizielle NVIDIA-Website

Das haben auch chinesische Chiphersteller erkannt und versuchen mit dem Kundenservice anzufangen.

Ein bestimmtes inländisches KI-Chip-Unternehmen, das anonym bleiben möchte, versucht seit 2023, Back-End-Forschungs- und Entwicklungspersonal an die Front zu bringen, um persönliche Dienstleistungen zu erbringen – nicht nur, um für gemeinsame Schulungen vor Ort zu sein, sondern auch, um Kunden mit einem zu versorgen engagiertes Team von F&E-Mitarbeitern nach der Auftragserteilung in einer kleinen Gruppe. Die Stückpreise für Kunden liegen zwischen einigen Millionen und Hunderttausenden, und Sie können sich rund um die Uhr beraten lassen.

Die bloße Bereitstellung lokaler und rücksichtsvoller Dienste reicht nach dem Rückzug von NVIDIA aus China bei weitem nicht aus.Die Chipindustrie ist nicht mehr nur ein Kampf zwischen Chipprodukten. , sondern testet auch ihr jeweiliges Verständnis des Zeitfensters. Chinesische Chiphersteller stürzten sich wie ein Rudel Wölfe auf sie und das heftige Bieten begann.

Huawei kommt am heftigsten. Huawei hat sich zuvor mit iFlytek zusammengetan, um das „Spark All-in-One“-Gerät herauszubringen, das mit dem „Ascend 910B“ ausgestattet war.

Dieser Chip galt einst als „vergleichbar mit NVIDIA A100“, was die Einzelkartenfähigkeiten betrifft. Was nicht bekannt ist, ist die schwierige Seite hinter dem glorreichen Fall – 36 Krypton erfuhr, dass Huawei nicht zögerte, die Arbeitskosten zu zahlen, und Hunderte von Ingenieuren entsandte, um iFlytek bei der Anpassung der Parameter zu unterstützen.


Huawei und iFlytek veröffentlichen Spark All-in-One-Gerät, Quelle: iFlytek

Obwohl dies von der Branche als „handgemacht“ bezeichnet wird, reichten viele große Modellfirmen und Internetunternehmen, sobald der Benchmark-Fall herauskam, einen Olivenzweig zum Testen an Huawei weiter.

Ein inländisches Chip-Vertriebsunternehmen war überrascht, dass das hochrangige Management von Huawei seit Juli letzten Jahres in jedem öffentlich ausgeschriebenen Smart-Computing-Center-Projekt stationiert ist. „Huawei kann jetzt Hunderte von Menschen zu einem Projekt schicken.“ Sie steigen auf, um zu dienen, und verlieren bei einigen Schlüsselprojekten sogar Geld, um Einnahmen aus anderen Projekten zu erzielen.“

Das oben erwähnte, namentlich nicht genannte Chipunternehmen verfügt außerdem über 200 hartgesottene Verkäufer – eine sehr seltene Konstellation in der heimischen Chipindustrie. Ihr Vertriebsteam startete in den drei heißesten Bereichen für die Umsetzung großer Modelle: Finanzen, Recht und Industrie und trat auf fast jeder Ausstellung zum Thema Rechenleistung auf: „In der Chipindustrie stehen Ressourcen an erster Stelle. Wer langsam läuft, wird sterben.“ ." Verloren".

Auch bei heimischen Chips hat ein versteckter Preiskampf begonnen.

Eine Person aus der Chipindustrie sagte gegenüber 36Kr, dass ihr Ziel darin bestehe, unabhängig vom Stückpreis mehr Aufträge für intelligente Rechenzentren der Spitzenklasse zu gewinnen. 36 Krypton hat beobachtet, dass einige inländische Unternehmen nicht zögern, den teuren HBM (High-Bandwidth Memory) aus ihren Inferenzkarten zu entfernen, um die Kosten zu senken, und sogarDer Versand erfolgt zu einem Preis, der 50 % unter dem Selbstkostenpreis liegt.

„Egal was passiert, jeder hofft immer noch, von verschiedenen Einstiegspunkten aus durchzubrechen und jeder ein kleines Stück vom Kuchen von NVIDIA zu bekommen, sodass NVIDIA nicht mehr der Einzige ist.“

Aber die Realität ist grausam, wenn es um Produkte geht, mit denen heimische KI-Chips zwangsläufig verschiedene Probleme haben werden.

Ein Chip-Experte nannte 36Kr ein Beispiel: Die Verarbeitung desselben Datensatzes mit dem A100-Cluster von NVIDIA dauert möglicherweise nur zehn Tage, bei einigen inländischen Chipprodukten kann es jedoch mehrere Monate dauern.Die Akkumulationszeit heimischer Chip-Hardware ist zu kurz, es mangelt an fortschrittlichen Prozessen und Hardware-Lücken, was zu einer geringen Effizienz führt.

Auch Softwaremängel sind offensichtlich. Ein anderer Branchenexperte hat getestet und festgestellt, dass bei der Verwendung von inländischen Chips zum Betrieb großer Modelle die inländischen Chips anfällig für Abstürze sind, wenn man mehr coole Anwendungen darauf ausführen möchte, sobald das grundlegende große Modell geändert wird heimische Chips. „Im Grunde hält man sich die Nase zu und benutzt sie.“

Mittlerweile hat jedes Unternehmen die vorliegende Strategie der „Einkreisung und Unterdrückung“ wirklich klar erkannt und sich nach und nach in realistischere Wege differenziert:

Zwar gibt es immer noch einige Fraktionen, die sich weiterhin dem Wanka-Cluster zuwenden, sich auf Trainingsszenarien konzentrieren und hart gegen NVIDIA vorgehen, vertreten durch Moore Threads und Huawei, doch die Mehrheit der Fraktionen konzentriert sich mehr auf den Einsatz großer Modelle/; Kleine Modelle in verschiedenen Branchen beginnen mit Argumentationsszenarien, die keine hohe Hardware und Software erfordern, dargestellt durch Suiyuan, Tianshu Zhixin usw.

(36Kr Hinweis: Große Modelle haben zwei Verbindungen: Training und Inferenz: Beim Training werden Muster aus Milliarden von Datenbanken gefunden."machen"Großes Modell; Schlussfolgerung ist in"verwenden"Der Prozess großer Modelle ist weniger schwierig undGeringere Hardware- und Softwareanforderungen, engere Anbindung an die Industrie)


Moore Thread veröffentlicht Kua'e Wanka-Cluster auf der Artificial Intelligence Conference 2024 mit 36 ​​Krypton-Schüssen

„Wir jagen Nvidia jetzt nicht blind hinterher. Wir können es uns nicht leisten, aufzuholen, und wir wagen es nicht, blind Chips mit extrem großer Rechenleistung herzustellen“, sagte ein Mitarbeiter der Chipindustrie unverblümt.

Eine realistische Überlegung für heimische Chiphersteller ist die von NvidiaDas Hauptaugenmerk liegt hier nicht, und heimische Hersteller haben Nvidias Frontalkrieg vermieden.

Zuvor verwendeten die meisten Unternehmen NVIDIA-Gaming-Grafikkarten 4090 für Endverbraucher, um aus Kostengründen Rückschlüsse zu ziehen. Diese Karten hatten viele Probleme: übermäßiger Stromverbrauch, unzureichender Speicher und Deaktivierung. Nvidia-Beamte gestatten außerdem nicht, dass diese Consumer-Grafikkarten für die Schlussfolgerung großer Modelle verwendet werden.

Inländische Chiphersteller sind in die Lücke von NVIDIA eingetreten. Tianshu Zhixin und Suiyuan treiben dieses Jahr beide Inferenzkarten voran, die mit dem 4090 konkurrieren, mit den Verkaufsargumenten großer Speicher, geringer Stromverbrauch und stabile Versorgung.

Auch heimische Chiphersteller haben deutlich gemacht, wie wichtig es ist, Marktsegmente zu identifizieren. Beispielsweise konzentrieren wir uns bei einigen energiesensiblen Szenarien auf kleine Chips mit geringem Stromverbrauch; oder wir können in Nischenszenarien wie die Videooptimierung eintauchen, um kleine, aber feine Geschäfte zu machen.

Das Schlachtfeld der Giganten ist angespannt.

Wenn inländische GPU-Unternehmen „NVIDIA übertreffen“ in PPT schreiben, ist das eher eine schöne Vision. Diese Unternehmensgruppe ist schon lange nicht mehr etabliert und hat den Trend der inländischen Substitution aufgeholt, auch wenn sie nur ein wenig übertrifft , es gilt als Meisterleistung für sie und ist sowohl ein Rivale als auch ein Maßstab.

Aber wenn es um Intel und AMD geht, die im Dienstalter mit Nvidia vergleichbar sind, ist die Atmosphäre noch angespannter.

Wir betrachten Nvidia intern als unseren Todfeind", sagte ein Entwickler der Produktlinie der MI-Serie von AMD gegenüber 36Kr.

Auf der Taipei Computer Show (Computex 2024) im Juni dieses Jahres klärte AMD-Gründerin Su Zifeng (sie ist auch die Cousine von Nvidia-Gründer Huang Jen-Hsun) erstmals auch über den künftigen AMD-Produktrhythmus bei der GPU-Iteration eines neuen Jedes Jahr entsprechen GPU-Produkte dem Update-Rhythmus von Nvidia.

Fast jedes Mal, wenn Nvidia eine GPU auf den Markt bringt, kauft AMD diese vom Markt und zerlegt sie sofort, um sie mit noch nicht auf den Markt gebrachten Produkten zu vergleichen.

„Wir müssen hier einige Funktionen (Indikatoren) hinzufügen und dort die Parameter erhöhen.“ Was sie anstreben, ist, dass „die Hardware nicht hinter NVIDIA zurückbleiben darf und die Parameter etwas besser sind“, sagte die oben genannte Person gegenüber 36 Krypton.


Su Zifeng stellte den Instinct MI325X auf der diesjährigen Taipei Computex vor

Seit 2023 erhalten die chinesischen Ökosystempartner von AMD fast alle zwei Tage neue Anforderungen zur Softwareoptimierung von AMD. Um für ihre GPUs zu werben, fordern AMD-Führungskräfte manchmal die günstigere CPU-Abteilung auf, GPUs für Bestellungen abzugleichen, wodurch sie riskieren, dass die CPUs möglicherweise nicht verkauft werden.

AMD-Menschen verbrennen jeden Tag Weihrauch und beten Buddha an, in der Hoffnung, dass wir die Ökologie verbessern können“, sagte ein Manager eines ökologischen Unternehmens seiner Meinung nach derzeitIn China gibt es bereits mehr als 10 Cloud-Anbieter und To B-Kunden, bei der Anpassung und Wirkungsüberprüfung im Zusammenhang mit AMD-Chips.

Im Vergleich zu den besorgten inländischen Chipherstellern besteht der Vorteil ausländischer Chipgiganten auf Hardwareebene darin, dass sie über fortschrittliche Prozesse und HBM-Produktionskapazitäten verfügen. Daher gibt es im Vergleich zu Nvidia-Produkten keine große Lücke bis zu einem gewissen Grad.

Offizielle Daten zeigen, dass AMDs Produkt (MI300X veröffentlicht im Dezember 2023) zuvor behauptete, dass die Rechenleistung 1,2-mal so hoch sei wie die von Nvidia H100;

Intels Produkt (Gaudi 3 veröffentlicht im April 2024) übertrifft H100 auch bei Energieeffizienz und Inferenzleistung bei weitem. Natürlich ist es auch günstiger, AMDs GPU-Preis liegt bei etwa 70 bis 80 % der Benchmark-Produkte von Nvidia.

Doch alle Hersteller, die Nvidia gegenüber aggressiv agieren, stehen vor einem gemeinsamen Problem:Egal wie stark unsere Hardware ist, sie wird von der schwachen Software überschattet, genau wie die Mängel eines Fasses.

In einer Zeit, in der GPUs nur für Grafikberechnungen verwendet werden konnten, war die von NVIDIA eingeführte Softwareplattform CUDA gleichbedeutend damit, Entwicklern eine Reihe von Programmierschnittstellen zur Verfügung zu stellen, die es ihnen ermöglichten, Computerprogramme frei auf der GPU zu schreiben und dabei die Programmiersprache zu verwenden, mit der sie am besten vertraut sind mit.

„Lassen Sie mich Ihnen eine Analogie geben. Warum kann CUDA es nicht übertreffen? Bist du nicht bereit?“ Ein Mitarbeiter einer Chipfirma gab 36 Kronen als Beispiel.

CUDA ist das größte Hindernis für das Software-Ökosystem von Nvidia.Selbst Intel und AMD, die große Unternehmen sind, können andere nicht in kurzer Zeit überholen.

Ein ehemaliger Mitarbeiter des Intel GPU-Teams erzählte 36Kr, dass sie mehr als 3.000 Ingenieure auf der ganzen Welt eingesetzt und drei oder vier Jahre investiert hätten, aber die Genauigkeit nur von 0 % auf 4 % verbessert hätten – sie hätten Intel-Chips verwendet, um ein Porträt umzuwandeln, und gewartet Nach langer Zeit gingen die Informationen so weit verloren, dass „es kein menschliches Gesicht mehr war“.


Intel-Chef Kissinger bringt Chips der Gaudi-Serie auf den Markt

Der „Henne-Ei“-Irrtum taucht wieder auf. Gerade weil nicht viele Menschen AMD- und Intel-GPUs verwenden und noch weniger Menschen ihre entsprechenden Softwareplattformen (ROCm, oneAPI) nutzen, ist es für jeden schwierig, die wahren Hardwarefähigkeiten voll auszuschöpfen.

„NVIDIAs CUDA hat schon immer dazu geführt, dass so viele Entwickler an Algorithmen iterierten, was NVIDIA dabei half, Rückschlüsse und Schulungen sehr effizient zu gestalten. Daher hatte NVIDIA immer Verhandlungsmacht und weiß immer, was sein nächster Chip tun sollte, aber das ist AMD. Das ist es.“ „Es bereitet sowohl Intel als auch Intel Kopfschmerzen“, sagte der CEO eines AMD-Ökosystemunternehmens unverblümt.AMDs Softwaretool ROCm sei „genau wie NVIDIAs CUDA vor 20 Jahren“.

Aber für nachgelagerte Kunden entsteht hier das Risiko.

Die Überprüfung eines großen Modells ist von Natur aus ein Experiment mit Unsicherheit. Wenn Sie es dennoch auf einem Chip ausführen möchten, der nicht überprüft wurde, ist dies gleichbedeutend mit der Kombination zweier unkontrollierbarer Variablen – der Verzicht auf Nvidia bedeutet, dass Sie hohe Migrationskosten zahlen müssen Unsicherheit.

Dennoch ist die Einkreisung und Unterdrückung von Nvidia immer noch ein Kampf, den AMD und Intel ausfechten müssen.

Die globale Chip-Architektur ist in drei Teile gegliedert: Die X86-Architektur ist führend im PC-Bereich und wird von Intel und AMD dominiert; der Mobilmarkt wird von Arm dominiert und NVIDIA dominiert den Markt für künstliche Intelligenz.

In den fast anderthalb Jahren, seit die neue KI-Revolution diese Ära einläutete, überschritt Nvidia einmal die Marktwertmarke von 3 Billionen US-Dollar, was nun dem kombinierten Marktwert von 7 Intel + AMD entspricht.

Nach 20 Jahren „Einkreisung und Unterdrückung“ von Nvidia durch die Chipgiganten,Es war ein weiterer spannender Kampf, und es war auch ein verspäteter Gegenangriff.

echter Knaller

Wenn inländische KI-Chip-Unternehmen eine Ameisenarmee bilden, geben AMD und Intel ihr Bestes, angesichts einer solchen Belagerung?

Die Cracks im NVIDIA-Imperium breiten sich still und leise aus.

Ein Signal, vor dem Nvidia wachsam sein muss, ist, dass OpenAI, Google, Microsoft ... diese Großkunden, die Nvidia aufgrund ihres Glaubens an KI aufgeladen haben, den ersten Schritt in Richtung „Anti-Nvidia“ unternehmen.

Selbst entwickelte Chips sind ein Schachspiel, das von verschiedenen Unternehmen schon seit langem geplant wurde. Ein ehemaliger Kernmitarbeiter des TPU-Teams von Google sagte gegenüber 36Kr, dass Google, das ein Viertel der weltweiten Rechenleistung nutzt,„Möglicherweise kaufen wir bis Ende des Jahres keine externen Chips mehr.“

In der Vergangenheit basierte Googles selbst entwickeltes TPU eher auf Kostenüberlegungen. Beispielsweise befürchtete man, dass Nvidia die Preise nach Belieben erhöhen würde oder das Angebot nicht stabil genug wäre. Jetzt ist Googles Kernherstellungsstrategie radikaler.„Fast unabhängig von Kosten und Aufwand.“

OpenAI hat unzählige Vorbereitungen getroffen. Sie planen, bis zu 7 Billionen US-Dollar aufzubringen, um ein neues KI-Chip-Imperium aufzubauen.

Im Inland erfuhr 36Kr auch aus vielen Quellen——Derzeit recherchieren die größten inländischen Käufer von Nvidia, Alibaba, Byte und Baidu, grundsätzlich heimlich nach Chips für die Ausbildung großer Modelle.

Produktfortschritt ausländischer Cloud-Hersteller, großer Modellhersteller und Star-Chip-Hersteller, 36 Kr umfassende Informationserfassung und -kartierung

Allerdings sind selbstentwickelte Chips doch eine langfristige Lösung. Ein weiterer kurzfristiger Plan für diese Großkunden besteht darin, die Produkte der Nvidia-Konkurrenten auszuprobieren und ihre Abhängigkeit von Nvidia zu verringern.

AMD ist dieser Plan B. Ein AMD-Insider sagte gegenüber 36Kr:Die GPU-Produkte von AMD haben bereits große Kundenmärkte in Europa, den USA, Südkorea und anderen Orten erschlossen.Microsoft hat Zehntausende AMD-Produkte gekauft, und Tesla, Midjourney, das U.S. National Laboratory und Korea Telecom haben die Produkte ebenfalls in Chargen erhalten.

In China sagte Chen Wen, ein Mitarbeiter von AMD Ecosystem, dass im Jahr 2023 Hunderte von AMD-Beschleunigerkarten eines bestimmten Modells ausgeliefert werden. Das seien zwar nicht viele, „aber dieses AMD-Produkt wurde in China so gut wie nie zuvor gefunden.“

Nach früheren optimistischen Schätzungen von AMD werden Rechenzentrums-GPUs AMD bis Ende 2024 einen Umsatz von bis zu 2 Milliarden US-Dollar bescheren.

Obwohl die Ameisenarmee der chinesischen Chiphersteller für Nvidia noch keine nennenswerte Bedrohung darstellt, gewinnen ihre Funken allmählich an Fahrt.

36Kr erfuhr, dass die Verkäufe von inländischen Trainings- und Inferenzchips nun ein neues Niveau erreicht haben – ein erfreuliches und positives Signal ist, dass Internetunternehmen und große Modellunternehmen, die als die am schwierigsten zu gewinnenden Aufträge in China gelten, damit begonnen haben In heimische Chips investieren Der Hersteller öffnete den Mund.

Laut 36Kr derzeitAscend Chip hatte Mühe, in das System von Internetunternehmen, darunter Baidu, einzudringen.

Darüber hinaus trainieren inländische KI-Unternehmen wie Zhipu AI, MiniMax und Step Star alle große Modelle mit Billionen von Parametern. Wenn die High-End-Chips von NVIDIA jedoch begrenzt sind, entscheiden sich große Modellunternehmen im Allgemeinen für „gemischtes Training“ (d. h. NVIDIA +). andere Chips), wie z.B.Der Cluster von Zhipu AI reserviert fast die Hälfte der Shengteng-Chips.

Darüber hinaus wurden seit letztem Jahr Zehntausende von Stücken der Inferenzchip-Produkte von Tianshu Zhixin ausgeliefert. Ersteres ist in die Lieferkette von Baichuan, einem großen Modellhersteller, eingetreten Kunlun-Chip Hier betragen die kumulierten Lieferungen der letzten beiden Generationen von Inferenzchips 30.000 bis 50.000 Stück, wobei Lieferungen von Baidu und externen Kanälen jeweils die Hälfte ausmachen.

„Nvidias aktuelle Preis- und Angebotsniveaus stellen an der Grenze dar, ob und wie es jeder schaffen kann.“, sagte ein Brancheninsider unverblümt.


NVIDIA-Gründer Huang Jenxun Bildquelle Visual China

Schaut man weiter in die nächsten drei bis fünf Jahre, werden nach und nach neue Bedrohungen für Nvidia auftauchen.

Auch brandneue KI-Chip-Architekturen außer GPUs sind in der Branche aufgetaucht – so behauptet beispielsweise das Silicon-Valley-Chipunternehmen Groq, das zuvor die LPU-Architektur auf den Markt gebracht hat, dass es große Sprachmodelle „zehnmal schneller“ als die GPUs von Nvidia laufen lässt;

Es gibt auch den Silicon-Valley-Chip Etched, der einen großen ASIC-Chip herausgebracht hat, der angeblich „eine Größenordnung schneller“ als Nvidia-GPUs ist. Diese Chip-Startups werden von Star-Investitionsunternehmen wie OpenAI unterstützt.

36Kr erfuhr, dass in diesem Jahr in China brandneue KI-Chip-Startups entstanden sind. Beispielsweise unterstützte Shanghai kürzlich heimlich zwei neue KI-Chip-Unternehmen.

Yang Gongyifan, CEO von Zhonghao Xinying, einem inländischen TPU-Unternehmen, sagte, dass die Gesamtauslastung der GPU nur 20 % beträgt. Tatsächlich sind die Mängel offensichtlich, obwohl neue Architekturen wie TPU und ASIC nicht sehr vielseitig sind Die Auslastung ihrer Transistoren kann 60 bis 100 % erreichen. „In den nächsten drei bis fünf Jahren wird es im In- und Ausland definitiv eine große Anzahl von KI-Chips außerhalb der GPU-Architektur geben.“

Ein bisschen reicht aus, um den Riesen NVIDIA ins Wanken zu bringen.

„Denken Sie, dass NVIDIA äußerlich keine Konkurrenten hat? Das ist wirklich nicht der Fall“, sagte ein NVIDIA-Mitarbeiter gegenüber 36Kr. Wie Huang Renxun oft sagt: „Wir haben nur 30 Tage bis zur Insolvenz.“

NVIDIA bereitete sich mehr als zehn Jahre lang darauf vor und stieß dann auf ein geniales Unternehmen wie OpenAI, das gemeinsam das Wunder von NVIDIA vorangetrieben hat. In der Vergangenheit mangelte es der Halbleiterindustrie nicht an Geschichten über das Überholen von Giganten in Kurven.

Der Rauch des Kampfes um die Einkesselung und Unterdrückung von Nvidia ist bereits entzündet.

Ende

Ende