nouvelles

La puissance informatique est la puissance. Pourquoi Nvidia est-il devenu le « dragon de la Silicon Valley » ?

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Cet article provient de : De l'extérieur et de l'intérieur, auteur : Zhou Xiao, Tan Jiuyun, Xie Fangchen, éditeur : Fu Xiaoling, Cao Binling

« Vendre des pelles » est une bonne affaire, mais ce n'est peut-être pas le cas si elle est toujours vendue à quelques mineurs et est toujours exposée au « risque client clé ».

Tout comme Nvidia est clairement l'acteur dominant dans le domaine des puces IA, Huang Renxun « se réveillait chaque matin avec l'inquiétude que l'entreprise fasse faillite ».

On constate que les clients de Nvidia ont toujours été très concentrés, CR5 représentant plus de la moitié de l'année. À son apogée en 2002, les cinq principaux clients représentaient 65 % du chiffre d'affaires, et les deux premiers clients représentaient un étonnant 40 %. Après que Microsoft, le principal financier de l'époque, ait retiré sa commande, les performances de NVIDIA ont chuté et ses actions ont chuté. le prix a chuté de 90%.


Une « grande crise client » similaire s'est produite à nouveau en 2008 lorsque les trois grands géants du PC Apple, Dell et HP ont arrêté leurs commandes collectivement, et plus tard lorsque des clients de référence tels que Google et Tesla ont commencé à développer leurs propres puces.


À l'heure actuelle (exercice 2024), les deux principaux clients de NVIDIA représentent toujours 32 % du chiffre d'affaires, et les cinq premiers sont estimés à près de 50 %. L'un des éléments réservés par les analystes de Wall Street est donc qu'à chaque fois que NVIDIA publie une annonce. son rapport financier, Calculer son ratio de concentration client important.

Cependant, même si les super-financiers contrôlent la vie de Nvidia, ils n’osent plus facilement renverser la table.

Les géants qui ont forcé Nvidia à baisser ses prix en retirant des commandes sont soudainement devenus des adeptes de Nvidia. Chaque fois que Boss Huang lance un nouveau GPU, ils font la queue pour l'acheter à un prix plus élevé, quel qu'en soit le prix.

Alors, d'être à la merci des autres jusqu'à se retourner contre les clients, comment Yingvida a-t-elle riposté ?

Cet article passe en revue ses trois séries de luttes avec des clients majeurs et constate que l'histoire de la fortune de Nvidia est une histoire condensée d'évolution technologique et industrielle. De leadership temporaire à leadership absolu, de remplaçable à irremplaçable, il a progressivement retrouvé son droit de parole jusqu'à devenir le « Dragon de la Silicon Valley » dans la nouvelle ère.

1. Agir comme le « baume de Taiwan » pour les jeux PC et se tenir sur les épaules des clients

2002 doit être une année inoubliable pour Huang Renxun.

Cette année, le cours de l'action Nvidia a plongé de 90 %, et sa richesse personnelle a également diminué de 10 fois, retombant directement du rang de « milliardaire » au rang de « multimillionnaire ».

Sa douleur vient du grand financier Microsoft : le projet de console de jeu Xbox avec lequel les deux sociétés ont coopéré a donné lieu à une guerre des prix. Microsoft a demandé à Nvidia de baisser le prix du GPU, mais à cette époque, Nvidia fabriquait également des cœurs en fonction du coût. alors il a naturellement refusé de négocier , Microsoft a déchiré la coopération entre les deux parties avec colère.

Vous savez, ce contrat Microsoft représente près de 70 % des ventes annuelles de Nvidia. Après la rupture de la coopération, les revenus de Nvidia ont rapidement diminué et sa valeur marchande a chuté.


Après avoir ressenti le sentiment d'être victime d'intimidation de la part des clients, Huang Renxun a dû faire des compromis et a accepté de « réduire le coût futur de la Xbox ».

Cependant, six ans plus tard, face au « scandale des cartes graphiques » dans lequel Apple, Dell et HP étaient mécontents du retrait collectif des commandes de puces GeForce des séries 6000-9000 et où le cours de l'action a chuté de 95 %, le patron Huang a choisi de offenser le père du client jusqu'au bout.

Il a doucement exposé le problème des cartes graphiques provoquant une surchauffe et un burn-in de l'ordinateur. Plus tard, Apple est venu demander une coopération personnalisée, mais ils l'ont catégoriquement rejetée.

Ces deux attitudes complètement différentes sont dues en grande partie à l’évolution du droit à la parole.

À l'ère des consoles, au début de ce siècle, les fabricants de consoles de jeux contrôlaient « l'entrée du trafic », et la distribution et l'exploitation des jeux étaient toutes gérées par des géants tels que Sony et Nintendo. Les fournisseurs de puces ne pouvaient généralement que « les admirer ». .


Même si Nvidia a été le pionnier du concept de GPU et a dominé le domaine des cartes graphiques - à partir du produit historique Geforce256, la technologie des cartes graphiques a continué à évoluer rapidement et a été la clé pour transformer la 2D en 3D dans l'industrie du jeu vidéo. n'échappe pas à la détermination de la vie et de la mort.

Après avoir rompu avec Microsoft, Nvidia a directement raté la nouvelle spécification DirectX9 de Microsoft, ce qui a rendu le GeForce FX nouvellement lancé incompatible avec les normes Microsoft. De plus, le produit lui-même était immature et les ventes étaient sombres.

ATI, qui a reçu le soutien de Microsoft, a lancé la Radeon 9700, qui a battu la GeForce FX de Nvidia, et s'est rapidement développée sur le marché des GPU. Au troisième trimestre 2004, sur le marché indépendant des cartes graphiques, la part de marché d'ATI était de 59 %, tandis que celle de Nvidia n'était que de 37 %.

Cependant, au fil du temps, sur le marché des jeux PC, le monopole de « l'entrée du trafic » des fabricants de consoles de jeux a été brisé.

Dans ce domaine, le cœur de l'industrie réside dans le jeu lui-même, et il est plus enclin que « les fabricants de jeux fonctionnent comme bon leur semble, et les fabricants de matériel les poursuivent désespérément. Il existe une division du travail dans la R&D, la distribution et le matériel ». , et les logiciels de l'industrie.


Cela signifie que par rapport à Sony, Nintendo et Microsoft, qui n'étaient qu'une poignée à l'ère des consoles de jeux, les clients potentiels des fabricants de puces se sont soudainement étendus à tous les coins de la chaîne industrielle.

Comme le montre la figure ci-dessous, les revenus de Nvidia ont continué de croître entre 2004 et 2006, tandis que la proportion des revenus provenant de ses cinq principaux clients a continué de diminuer.


Dans le même temps, cette vague de « vraie 3D » portée par la technologie des cartes graphiques et la vague de connexion PC déclenchée par la popularité des réseaux superposés et du haut débit ont également mis en avant des exigences plus élevées en matière de capacités des puces en amont et en aval de la chaîne industrielle.


En prenant comme exemple du côté des consommateurs, ces jeux aux graphismes sympas sont également connus comme des tueurs d'ordinateurs en raison de leur modélisation 3D complexe, et les joueurs ne peuvent pas arrêter de mettre à jour leurs ordinateurs. Et leur quête de performances pour leurs appareils a contraint les fabricants de PC à choisir des puces réputées pour leurs performances.

Par exemple, "Crysis", qui a balayé tout le pays et à l'étranger en 2007, a des graphismes réalistes qui rendent les gens accros, mais il teste extrêmement les performances de la carte graphique. Un joueur se souvient : « J'ai combattu le boss final pendant une journée entière pendant mes vacances d'été à l'université. Après chaque tir de bombe nucléaire, l'ordinateur devait être mis en pause pour refroidir.


Cela a rendu la carte graphique NVIDIA Geforce9800GT, capable d'exécuter "Crysis" de manière fluide, très populaire, avec plus de 5 millions d'unités vendues dans le monde.

Pour parler franchement, par rapport à l'industrie des consoles, en amont des jeux PC, tant que les performances, le rendement et le prix sont bien équilibrés, le produit peut parler de lui-même, et il n'est pas nécessaire d'être un "faible- clé" Partie B.

On peut constater que depuis 2004, la formule GPU de Nvidia consistant à « doubler les performances et continuer à baisser les prix à chaque série de mises à jour » est devenue populaire sur le marché des jeux sur PC.


Cependant, Nvidia n’est pas le seul à lorgner sur ce morceau de gâteau, les géants des puces ne sont pas loin derrière.

Les acteurs du processeur établis tels qu'Intel et AMD se sont rapidement tournés vers les GPU, et leur vieil ennemi ATI se rapprochait également. AMD a même annoncé une fusion avec ATI en 2005, dans l'espoir de dominer l'industrie grâce à une puissante combinaison de processeurs et de GPU.

Une bataille acharnée était déjà imminente. De manière inattendue, ATI a acheté un grand nombre de brevets obsolètes sur la technologie GPU afin de les vendre à un meilleur prix. Cela a non seulement endetté AMD pendant des années, mais a également ralenti le rythme de son développement. Intégration GPU. Dans l'industrie des puces qui continue d'itérer, AMD perdu dans la foule.

Nvidia est assez fier du retard de son adversaire. Comme l'a montré Huang Renxun : "C'est un cadeau inespéré. Nous sommes devenus la seule société indépendante de puces graphiques au monde."

Et NVIDIA, un acteur dominant disposant de la technologie en main, a depuis acquis la capacité de rivaliser avec les clients.

Par exemple, Dell et HP, qui ont retiré leurs commandes lors du « scandale des cartes graphiques » mentionné ci-dessus, ont passé des commandes l'une après l'autre après le lancement de nouveaux produits par NVIDIA ; résultats.

Mais avant que le patron Huang puisse rire longtemps, une nouvelle crise survint tranquillement.

2. Concentrez-vous sur l'universalité du GPU, ce qui rend difficile pour les gros clients de l'éviter

L'un des actes célèbres du super vendeur Huang Renxun est qu'il a affirmé être un fan de riz lors de la conférence de lancement de Xiaomi en 2013 et a crié : « S'il vous plaît, donnez-moi une chance de présenter NVIDIA !

À cette époque, le public mangeur de melons déplorait que Boss Huang soit flexible et pensait que Nvidia allait rivaliser sur le marché des puces mobiles.

De manière inattendue, l'année suivante, Huang Renxun a renoncé à l'opportunité qu'il avait léchée et a annoncé qu'il se retirerait progressivement du marché des puces pour smartphones et tablettes.

L'explication donnée par Huang Renxun à l'époque était la suivante : la concurrence féroce sur les prix entre les fabricants de téléphones mobiles oblige les entreprises en amont à réduire continuellement leurs prix, mais le prix n'est pas le point fort de Nvidia, elle ne peut donc que se retirer.

Mais aujourd’hui, nous savons que la guerre des prix n’est qu’un phénomène superficiel. La raison la plus profonde est que la demande de puces mobiles n’est pas cohérente avec les performances ultimes recherchées par Nvidia.

Le succès du marché des PC a permis à Huang Renxun de comprendre mieux que quiconque que dans le domaine des puces, les entreprises dotées d'une technologie de pointe (voire unique) peuvent souvent obtenir une plus grande part du gâteau et avoir un fossé plus profond.

Par conséquent, Nvidia a mis en œuvre la voie des « victoires technologiques » pour les puces mobiles : la série Tegra a accumulé de manière folle la puissance de calcul. Du Tegra 2 au Tegra 3, le nombre de cœurs GPU est passé de 8 à 12, et le Tegra 4 a bondi. 72. La série entière Ils sont tous considérés comme des outils de notation.

Cependant, les puces mobiles montées sur les smartphones et les tablettes doivent fonctionner dans un espace et une puissance limités. Les puces NVIDIA, qui mettent davantage l'accent sur une configuration équilibrée et recherchent des performances, rencontrent bientôt des problèmes de consommation d'énergie incontrôlable et d'échauffement important.

Plus important encore, la technologie des signaux de communication est fermement contrôlée par Qualcomm. Si les fabricants de téléphones mobiles coopèrent avec Nvidia, ils devront dépenser beaucoup d'argent pour fournir leurs propres bandes de base, ils ont donc reculé.

Dans ces circonstances, si Nvidia continue de rechercher la mobilité, elle doit faire des compromis sur les performances, ce qui n'est pas conforme au style du « geek de la technologie » Huang Renxun. Il a décidé de « recentrer son énergie sur la haute performance, l'informatique visuelle ou orientée vers les jeux ». " sur l'appareil".

Mais le marché ne l'a pas acheté. À cette époque, le principal marché de Nvidia, les jeux PC, avait terminé sa phase de pénétration accélérée, et l'ensemble de l'Internet était dans une période de transition vers le mobile. L'échec de la mobilité n'a pas seulement mis les activités de Nvidia dans une situation difficile. effondrement, mais signifiait également qu'il voulait poursuivre la technologie abandonne un marché en plein essor.


Nvidia a agi de cette manière plus d’une fois, et l’autre fois remonte à 2006.

Aux yeux du monde à cette époque, les GPU n'étaient que des équipements de jeu. Huang Renxun a accidentellement vu des personnes effectuer des transactions à haute fréquence et des quantifications financières à Wall Street en utilisant des GPU NVIDIA pour exécuter des transactions, mais elles ne pouvaient écrire que beaucoup de basses fréquences. niveau code machine pour l'implémenter, et ils ne pouvaient pas le faire comme les processeurs programment dans des langages tels que C++.

Cela a fait comprendre à Huang Renxun que le marché avait une certaine demande pour des scénarios informatiques généraux. À son retour, il a réclamé davantage de développement logiciel (c'est-à-dire la plate-forme CUDA) pour rendre le GPU compétent pour diverses tâches, et pas seulement pour dessiner des images. le terrain de jeu.

Une fois le projet lancé, les coûts annuels de recherche et développement devraient atteindre 500 millions de dollars, alors que le chiffre d'affaires annuel de Nvidia n'était que de 3 milliards de dollars.

De plus, à cette époque, il n'existait pas de demande évidente sur le marché pour l'énorme puissance de calcul polyvalente apportée par le calcul parallèle. Elle était principalement utilisée dans des domaines impopulaires tels que les laboratoires de physique avancée et le commerce quantitatif. Le GPU requis pour un seul projet était limité à. à un chiffre, Wall Street considérait autrefois CUDA comme La valorisation technique est nulle.

Autrement dit, Boss Huang mise 1/6 des revenus de l'entreprise sur une plateforme logicielle qui n'a que peu à voir avec le cœur de métier et dont les perspectives sont infinies.

Non seulement cela coûte de l'argent, mais pour s'adapter à la plate-forme CUDA, les puces de Nvidia doivent ajouter plus de circuits logiques, ce qui augmente la surface de la puce, augmente les exigences de dissipation thermique et augmente considérablement le taux de défaillance.

Les incidents d'annulation de commande mentionnés ci-dessus par HP, Dell, Apple, etc. étaient précisément dus au fait que les puces Nvidia étaient gravement surchauffées, provoquant le crash et le dysfonctionnement d'un grand nombre d'ordinateurs portables.

Mais Huang Renxun croyait fermement que « cette façon de créer des logiciels peut tout changer ». Même s'il a dépensé une énorme somme de 200 millions pour indemniser les clients, il a quand même investi dans CUDA de manière presque paranoïaque.

Il s'est avéré qu'il avait raison.

Lors du concours ImageNet fin 2012, le réseau neuronal convolutif AlexNet basé sur les calculs de la puce NVIDIA a augmenté la précision de reconnaissance à 84 % d'un seul coup, déclenchant ainsi la révolution de l'IA dans les dix prochaines années.

Cela fait également de la combinaison NVIDIA GPU+CUDA un blockbuster dans le domaine du deep learning. Google, qui se moquait autrefois du fait que "les GPU sont juste pour jouer à des jeux", est immédiatement devenu un partisan de Nvidia, et des géants comme Microsoft et Facebook ont ​​également commandé un grand nombre de GPU pour la formation à l'intelligence artificielle.

Et ce n'est qu'un début. Avec les avancées continues dans le domaine de l'apprentissage profond, les géants se « tournent » progressivement autour de NVIDIA dans de multiples scénarios.

Par exemple, en 2015, alors que le taux d’erreur du deep learning dans le domaine de la reconnaissance d’images était inférieur à celui des humains, le marché de la conduite autonome a explosé Du côté des voitures, le chauffage et la consommation d’énergie n’étaient plus un problème. qui n'étaient pas appréciés par les fabricants de téléphones portables, étaient favorisés par les constructeurs automobiles .


En 2016, AlphaGo a battu Lee Sedol au nom d’IA, déclenchant ainsi l’ensemble du marché de la face B.

On peut constater que les principaux fabricants ont commencé à proposer une série de produits de services d'IA basés sur l'apprentissage profond, tels que la reconnaissance, l'authentification et la récupération d'images, pour les clients du côté B de divers secteurs.


Outre la demande croissante de GPU dans des secteurs tels que l'Internet et la conduite autonome, les entreprises capables d'appliquer la technologie de l'IA dans les domaines de la biomédecine et du commerce quantitatif ont également rejoint les rangs des clients de NVIDIA.

Les données montrent qu’en 2016, la part de marché de Nvidia dans le domaine de l’apprentissage profond atteignait 97 %.

À ce stade, NVIDIA, obsédé par les performances des GPU et CUDA, a attendu que le moment du « pouvoir de calcul, c'est le pouvoir » se réalise : les grands clients ne peuvent pas éviter NVIDIA dans leur activité, et ils ont perdu la qualification pour changer de table. .

Cette augmentation de voix a donné une bouffée d'air frais à Nvidia, mais elle a également caché des dangers cachés.

3. Les principaux clients qui développent des puces auto-développées sont supprimés par Nvidia

En 2017, l'« interdiction d'une note » de Nvidia a déclenché l'indignation du public dans le cercle technologique mondial : les clients ne sont plus autorisés à utiliser les produits GeForce pour effectuer un apprentissage en profondeur dans les centres de données.

À cette époque, NVIDIA faisait la promotion de sa nouvelle série de produits haut de gamme Tesla. Ce serveur avait la même architecture que la série GeForce, mais le prix était très différent. La version supérieure était près de 10 fois plus chère. La promulgation de l'interdiction signifie que les clients ne peuvent plus utiliser GeForce pour remplacer Tesla, et que les startups disposant de faibles ressources financières pourraient même perdre leur moyen de survie.

Au milieu des protestations, les « actions du dragon » ont finalement cessé, mais les défenses des entreprises technologiques contre Nvidia se sont de plus en plus intensifiées.

Au cours des dernières années, des géants de l’Internet tels que Google, Meta et Microsoft, ainsi que des constructeurs de véhicules électriques tels que Tesla, ont successivement commencé à développer leurs propres puces pour tenter de réduire leur dépendance aux GPU Nvidia.


En plus de détester la « taxe NVIDIA », les puces auto-développées sont plus abordables que celles achetées chez NVIDIA.

Prenons l'exemple de l'industrie automobile : ce qui nécessite le plus de puissance de calcul du côté des voitures, c'est le système de conduite intelligent. Cependant, les puces NVIDIA sont des « guerriers hexagonaux » à usage général. Non seulement leurs vitesses de calcul sont insatisfaisantes, mais elles occupent également une place importante. beaucoup d'espace.

Les puces auto-développées sont spécialement conçues pour la conduite sans conducteur, comme la puce FSD de Tesla. Par rapport au NVIDIA DRIVE PX 2 de la taille d'une paume, la surface est considérablement réduite et la consommation d'énergie est également réduite d'un tiers.

La puce FSD donne également la priorité au NPU responsable de l'apprentissage profond et de la prédiction. Par rapport au GPU, elle est plus efficace dans l'apprentissage automatique de l'IA et dispose d'une puissance de calcul multipliée par 5.


Il en va de même dans le domaine pan-IA. Les puces sont adaptées et transformées de l'architecture, du système d'exploitation de couche supérieure, du middleware au code commercial pour atteindre des performances ultimes. Cela est vrai pour les puces TPU de Google et les puces Graviton d'Amazon.

Parmi eux, Google TPU est 15 à 30 fois plus rapide que le GPU NVIDIA dans le domaine du calcul d'inférence, et le rapport performances/consommation d'énergie est environ 30 à 80 fois plus élevé.


En d'autres termes, les puces développées par Nvidia peuvent non seulement être personnalisées, mais également surpasser les puces à usage général de Nvidia en termes de performances, de taille et de consommation d'énergie.

De plus, bien que les puces actuelles soient dites « auto-développées », elles ne nécessitent pas de recherche et de développement complet, en prenant Tesla comme exemple, à l'exception du NPU auto-développé, du reste du CPU, du GPU, des interfaces. etc., tous achètent une IP standard En seulement 18 mois, le développement est terminé.

Par conséquent, après que de grands clients se soient lancés dans une frénésie d'auto-recherche, NVIDIA s'est retrouvée piégée dans le doute d'être « subvertie ». Mais même si les grands clients ont le courage de construire des cœurs, il n’est pas facile de remplacer Nvidia.

Comme nous le savons tous, les coûts fixes de fabrication des puces tels que la recherche et le développement, la conception, l'équipement du site, etc. sont étonnamment élevés. L'enregistrement optique représente une dépense énorme. Le coût unique d'enregistrement d'un 7 nanomètres. la puce coûte environ 200 millions de yuans.


Sur cette base, cette industrie a toujours été centrée sur la « mise à l'échelle des coûts » : pour le côté R&D, plus la puce peut être utilisée dans de scénarios, plus elle peut diluer les énormes coûts de R&D pour le fabricant, plus ils sont ponctuels ; commandes, plus il peut mobiliser pleinement l'utilisation de la capacité de production et maintenir les bénéfices d'expédition à un certain niveau.

On constate qu'avec l'architecture commune de NVIDIA, les dépenses de R&D pour un seul scénario peuvent être diluées. Par exemple, le coût de l'architecture Hopper utilisée dans la puce automobile Thor pourrait avoir été partagé par le H100 avec la même architecture.

Ceci n'est évidemment pas disponible pour les gros clients dont les puces auto-développées sont principalement utilisées dans des scénarios spéciaux. En conséquence, les coûts énormes de R&D peuvent les rendre prohibitifs.

Il en va de même pour la fabrication. Une organisation a déjà calculé un compte : supposons que les constructeurs automobiles produisent 1,2 million de véhicules par an et utilisent 1,2 million de puces de haute informatique, ce qui équivaut à 100 000 par mois. Si chaque tranche de 12 pouces contient 500 puces, ce ne sera que 100 000 par mois. Demande de 200 plaquettes.

Avec une si faible demande, TSMC ne peut être considéré que comme le plus petit client, et il en va de même pour les usines de conditionnement et de test. Lorsque l'offre de capacité de production Fab et d'emballage et de test dépasse la demande, ils donneront la priorité à assurer l'approvisionnement des gros clients et allongeront le temps d'attente pour les commandes.

Associé à la réaction en chaîne des tests et d'autres maillons, le cycle réel de mise en œuvre des applications de la puce peut devenir plus long. Par exemple, la puce FSD de Tesla a achevé son premier essai de production fin 2017, mais son installation sur les voitures n'a commencé que deux ans plus tard, et les mises à jour et les itérations sont encore plus lentes. En comparaison, Nvidia peut mettre à jour ses puces automobiles pratiquement tous les 18 mois.


Cela a obligé de nombreuses entreprises à revenir vers NVIDIA. Surtout après le boom des grands modèles et de l'IA générative, la puissance de calcul est devenue une ressource incontournable. Même les grands fabricants qui sont encore engagés dans l'auto-recherche n'osent pas s'en priver. en achetant un GPU avancé NVIDIA.


Les puces de puissance de calcul de Nvidia sont soudainement devenues une monnaie forte. La rumeur veut que le fondateur d'Oracle et Musk aient un jour supplié Jen-Hsun Huang de passer une heure dans un magasin d'alimentation japonais juste pour recevoir des livraisons de puces GPU.

Selon les rapports, chaque fois que NVIDIA vend un H100, elle peut réaliser un bénéfice colossal de 1 000 %. 50 % des bénéfices des industries liées à l’IA vont dans les poches de Nvidia.

Face à l'intensification de la « taxe NVIDIA », les principaux clients serrent les dents, mais sont impuissants : la concurrence actuelle en matière de puces se concentre à la fois sur les logiciels et le matériel, et NVIDIA détient non seulement la puce, mais possède également la douve logicielle CUDA.

Depuis plus de dix ans, CUDA, en tant que bibliothèque de fonctions et base de code, est ouverte aux développeurs depuis longtemps et a attiré des millions de développeurs. Ils ont développé davantage d'outils, rendant l'écosystème CUDA plus mature et devenant presque une « infrastructure ». ". La présence.

Si le GPU est comparé à une centrale électrique, alors les développeurs sont comme des gens qui construisent des appareils électriques, et CUDA est comme un « système de réseau électrique ». Les spécifications de tension des appareils électriques sont adaptées au réseau électrique.

Il sera difficile de remplacer le statut de CUDA. L'année dernière, afin de briser le monopole de CUDA sur la co-conception de puces logicielles, les principaux clients de NVIDIA ont lancé « l'Alliance Anti-CUDA » dans le but de recréer un outil de compilation compatible CUDA.

Cependant, au moment où les solutions des éditeurs de logiciels tiers atteignaient un niveau proche de CUDA, Nvidia avait déjà lancé la prochaine génération de GPU. Les logiciels et le matériel suivaient le rythme, permettant aux concurrents de rattraper leur retard.

De plus, Nvidia, flairant le danger, a déjà commencé à construire un mur : d'abord, il a dit « achetez un rack de serveur, obtenez d'abord du GB200 », a regroupé et vendu des racks personnalisés coûteux, exacerbant les coûts de migration des clients, puis a renforcé la décompilation. la voie à suivre pour que d'autres outils soient compatibles avec CUDA.

En conséquence, les gros clients qui développent leurs propres puces finiront par devenir de la viande sur la planche à découper de Nvidia.

résumé

"Il y a d'abord Renxun, puis il y aura le paradis, et la carte graphique torturera les dieux." Les "croyants" de Nvidia dans la barre des cartes graphiques nationales ont un jour commenté Huang Renxun dans le style des "Documents historiques".

Avec la bénédiction de nombreux médias, tout comme Huang Renxun le croit fermement, la puissance de calcul a vraiment changé le monde. Sa conviction a été généralement reconnue et son pouvoir peut même dominer le marché.

Mais ceux qui créent l’histoire ne peuvent jamais prévoir leurs propres coordonnées dans le processus historique. Cela détermine que pour Huang Renxun, chaque jour est un état de « prêt à l'action ».