nouvelles

Encerclement et suppression de NVIDIA Deep Krypton |

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Texte|Qiu Xiaofen

Entretien|Qiu Xiaofen et Yang Xiao

Editeur|Su Jianxun Yang Xuan

résister

Un groupe secret WeChat se propage de bouche à oreille parmi les personnes des entreprises de puces IA de Zhangjiang, Shanghai. Le nom du groupe est « Domestic Chip Group Warming Group ». Ceux qui rejoignent le groupe doivent être des employés d'entreprises de puces nationales. même les concurrents échangeront des informations et des ressources commerciales.

Le « groupe national de puces pour la chaleur » a délimité une zone de trêve, où les collègues peuvent temporairement faire une trêve et s'entraider, simplement parce que tout le monde a un ennemi commun : NVIDIA.

En raison de l'existence de Nvidia, les ventes des sociétés nationales de puces ont connu un peu d'humiliation.

Li Ming (pseudonyme) est vendeur dans une société nationale de GPU. Lorsque le boom de l'IA a commencé, il est allé rencontrer les clients en toute confiance, mais il n'a pas eu le temps de leur dire bonjour. Le client a commencé à poser des questions :

" Par rapport à la puce A100 de NVIDIA, quelle est la différence entre vos produits ? NVIDIA a NVLink, qu'avez-vous ? " (Note de l'auteur : NVLink connecte plusieurs puces GPU pour empêcher les données du GPU d'être déplacées vers le CPU pour des calculs visant à améliorer l'efficacité informatique)

Voyant qu'ils ne pouvaient pas impressionner les clients avec leurs produits et technologies, l'équipe de Li Ming a commencé à réfléchir à des moyens de s'appuyer sur les connexions et de trouver des « personnes plus puissantes » pour faire pression, mais les clients ont quand même agité la main et ont déclaré : « Nous voulons toujours utiliser NVIDIA."

NVIDIA A100, avec 54 milliards de transistors regroupés dans une superficie de 826 millimètres carrés, est la clé pour ouvrir la boîte magique des grands modèles d'IA.

La formation sur de grands modèles revient à « affiner des élixirs » dans des données massives, dans le but de découvrir les modèles de modification des données ;Utiliser des puces NVIDIA pour entraîner de grands modèles revient à demander à des centaines de millions de personnes ayant un QI de 200 de faire des calculs, alors que l'effet d'autres puces équivaut seulement à demander à des milliers de personnes ayant un QI de 100 de faire des calculs.


Photos NVIDIA A100 sur le site officiel de NVIDIA

Les plus grandes entreprises technologiques se précipitent toutes pour acheter Nvidia. Celui qui possède le plus de GPU NVIDIA haut de gamme aura la possibilité de former de grands modèles plus intelligents.

Les informations publiques montrent qu'OpenAI contrôle actuellement le plus grand nombre de GPU haut de gamme NVIDIA au monde, au moins 50 000 pièces ; Google et Meta sont également propriétaires de clusters Wanka (environ 26 000) et il est rare en Chine qu'il existe un Internet ; réseau avec les clusters GPU Wanka haut de gamme Nvidia Le plus gros est ByteDance (13 000).

NVIDIA monopolise les meilleures ressources de la chaîne industrielle mondiale : elle possède la capacité de fabrication de puces avancées la plus abondante de TSMC, elle compte le plus grand groupe d'utilisateurs d'ingénieurs au monde et elle contrôle l'élément vital informatique de nombreuses sociétés d'IA.

Le monopole absolu engendre souvent l’insatisfaction, la colère et la fuite.

"Tous ceux qui fabriquent de grands modèles aujourd'hui perdent sérieusement de l'argent ! Un seul gagne de l'argent ! NVIDIA", a déclaré avec colère un initié de l'industrie——"La marge bénéficiaire de NVIDIA met tous les clients mal à l'aise et nuit à l'industrie de l'IA !".

Le rapport financier montre que la marge bénéficiaire brute de Nvidia a atteint 71 %, parmi lesquels les produits populaires des séries A100 et H100 ont des marges bénéficiaires brutes pouvant atteindre 90 %. En tant qu'entreprise de matériel informatique, Nvidia bénéficie en réalité de marges bénéficiaires brutes plus élevées que les éditeurs de logiciels Internet.

Les prix élevés et les profits énormes ont poussé les gros clients de Nvidia à fuir. Le 30 juillet, Apple a annoncé que son modèle d'IA était entraîné avec 8 000 Google TPU, alors que le contenu de NVIDIA était de 0. Dès l'annonce de la nouvelle, le cours de l'action de NVIDIA a chuté de plus de 7 % le 31 juillet, soit la plus forte baisse du passé. trois mois, et sa valeur marchande s'est évaporée de 193 milliards de dollars,J'ai failli perdre un Pinduoduo.


Graphique de la baisse du cours de l'action NVIDIA au cours de l'année écoulée

Pour toutes les sociétés nationales de GPU qui veulent arracher un morceau de chair à Nvidia, 2022 est une année charnière. Plusieurs séries d'interdictions ont été émises aux États-Unis, contraints de gagner leur vie, de continuer à lancer des versions castrées de puces. en Chine, mais ils sont rapidement à nouveau interdits :

  • En septembre 2022, l'exportation des A100/H00 vers la Chine a été interdite et NVIDIA a lancé la version castrée A800/H800 ; en octobre 2023, l'exportation des A800/H800/L40/L40S/RTX4090 a été interdite en juin 2024 ; Le fondateur de NVIDIA, Huang Jenxun, a déclaré qu'il pousserait les versions castrées des puces L20 et H20 en Chine.

Cependant, la version castrée a suscité une condamnation plus intense de la part de l'industrie. Le prochain H20 de Nvidia coûte la moitié du prix du H100 de Nvidia, mais ses performances ne représentent que 1/3 de l’ancien. Une personne de l'industrie de l'IA a dénoncé avec colère - " N'est-ce pas simplement voler de l'argent ? Taxe sur le QI pur ! "

Lorsque les clients de Nvidia sont devenus mécontents et en colère, les fabricants nationaux de puces qui voulaient remplacer Nvidia ont été « nourris » par cette émotion.

Dans le passé, ils ne pouvaient que suivre les fesses de Nvidia et manger une petite part du gâteau. Selon les données de la société d'analyse des semi-conducteurs TechInsights, la part de marché de Nvidia dans les livraisons de GPU pour centres de données atteindra 98 % en 2023. Les puces nationales et tous les géants des puces réunis,Seulement un maigre 2%.

Maintenant que l'interdiction est tombée, le Nvidia parfait a été déchiré sur le marché chinois. Qui peut remplacer Nvidia ? Les fabricants nationaux de puces d’IA voient de l’espoir.

« Cette année, 90 % du marché de NVIDIA en Chine a été libéré.Que vous puissiez l'attraper ou non dépend de vos capacités.", a déclaré le fondateur d'une société nationale de GPU.

36 Krypton a publié un jour « Deep Krypton | CATL : Cracks in the Trillion Battery Empire » en 2021. Dans le secteur des batteries électriques, CATL est sans précédent et est surveillé par ses concurrents.

Aujourd'hui, Nvidia, qui est l'acteur dominant dans le domaine des puces IA, est également considéré comme une épine dans le pied par de nombreux pairs. Cependant, la différence entre Nvidia et Nvidia est que ses barrières sont plus élevées et l'écart avec ses adversaires est plus grand. encore plus large.

Nous essayons de trouver les « fissures de NVIDIA » grâce à la résistance des adversaires de NVIDIA. En regardant l'industrie des GPU, bien que les fabricants nationaux de GPU et de puces AI soient faibles, ils comprennent mieux le marché chinois et leurs méthodes de jeu sont plus localisées ; Intel, AMD, etc. Les géants des puces bien établis disposent de suffisamment de munitions pour affronter Nvidia de front.

À court terme, Nvidia ne sera pas vaincu, mais il ne restera pas indemne. Cette guerre est destinée à être sanglante.

Éclater

Si vous voulez percer, vous devez trouver les faiblesses de votre adversaire.Une des faiblesses de Nvidia : l'arrogance.

L’industrie des puces est essentiellement une industrie de logiciels To B. Les clients ont besoin de services « d'accompagnement » de la part des fabricants de puces, tels que le débogage du matériel et la compatibilité des logiciels et du matériel. Ce n'est que lorsque la compagnie est en place que les clients peuvent être collants et que les produits à puce ne seront pas facilement remplacés.

Cependant, de nombreux experts nationaux en puces ont déclaré à 36Kr que sur le marché chinois, à l'exception des gros acheteurs comptant des milliards tels que BAT et Byte, il est presque difficile pour la plupart des autres entreprises d'obtenir des investissements de Nvidia même si leur volume de transactions atteint des dizaines de millions. . Service après-vente.

En d'autres termes, lorsque les ingénieurs chinois utilisant des puces NVIDIA ont des doutes, ils ne peuvent compter que sur eux-mêmes pour rechercher des documents sur le site officiel de NVIDIA, ou se rendre dans la communauté pour apprendre par eux-mêmes.

Lors de la coopération avec NVIDIA, les différents besoins des clients chinois ne sont souvent pas satisfaits.Une personne de l'industrie des puces a déclaré à 36Kr que Nvidia promeut généralement les solutions complètes les plus haut de gamme et les plus chères en Chine. Lorsque les clients font des demandes personnalisées pour des scénarios spécifiques, ils sont généralement rejetés. Après avoir acheté la carte, les clients doivent « réfléchir ». parlez-en vous-même, ou trouvez une société d'algorithmes puissante pour le faire.

Cette approche de Nvidia a accumulé de nombreuses plaintes de la part de petits et moyens clients. "Nvidia, en tant que grand fabricant aujourd'hui, n'accorde plus autant d'attention aux petits clients que par le passé. Leurs produits n'ont pas de concurrents et ils n'ont pas besoin de travailler dur pour plaire aux clients", a déclaré la personne mentionnée ci-dessus.

Mais dans le passé, l'essor de l'écosystème NVIDIA a en réalité confirmé l'importance des services pour l'industrie des puces : en 2006, lorsque l'écosystème CUDA venait tout juste de démarrer, les produits NVIDIA n'étaient pas aussi performants que les puces nationales actuelles. Mais l'équipe NVIDIA a d'abord commencé avec les équipes de recherche scientifique des universités, puis a pénétré dans les start-up de chaque sous-secteur pour adapter les logiciels et le matériel, et ce n'est qu'à ce moment-là qu'elle est devenue aujourd'hui un grand pays.


NVIDIA H100 Source : site officiel de NVIDIA

Les fabricants chinois de puces l’ont également compris et tentent de commencer par le service client.

Une certaine entreprise nationale de puces d'IA qui souhaite rester anonyme tente depuis 2023 d'amener le personnel de R&D back-end en première ligne pour fournir des services personnalisés - non seulement pour être sur place pour une formation commune, mais aussi pour fournir aux clients un équipe dédiée de personnel R&D après la passation de la commande client en petit groupe. Les prix unitaires client varient de quelques millions à des centaines de milliers, et vous pouvez bénéficier d'une consultation 24h/24 et 7j/7.

La simple fourniture de services localisés et attentionnés est loin d’être suffisante. Après le retrait de NVIDIA de Chine,L’industrie des puces n’est plus simplement une bataille entre les produits de puces eux-mêmes. , mais teste également leur maîtrise respective de la fenêtre temporelle. Les fabricants chinois de puces se sont jetés sur eux comme une meute de loups, et les enchères vigoureuses ont commencé.

Huawei arrive le plus férocement. Huawei s'est précédemment associé à iFlytek pour lancer l'appareil « Spark All-in-One », équipé du « Ascend 910B ».

On disait autrefois que cette puce était « comparable à NVIDIA A100 » en termes de capacités monocarte. Ce que l'on ne sait pas, c'est le côté difficile derrière cette glorieuse affaire - 36 Krypton a appris que Huawei n'avait pas hésité à payer les coûts de main-d'œuvre et avait déployé des centaines d'ingénieurs pour aider iFlytek à ajuster les paramètres.


Huawei et iFlytek lancent la machine tout-en-un Spark, source : iFlytek

Bien que cela soit qualifié de « fait à la main » par l'industrie, dès que le cas de référence a été publié, de nombreuses grandes sociétés modèles et sociétés Internet ont tendu le rameau d'olivier à Huawei pour les tester.

Une société nationale de vente de puces a été surprise de constater que depuis juillet de l’année dernière, la haute direction de Huawei était présente dans n’importe quel projet de centre informatique intelligent faisant l’objet d’un appel d’offres public. « Huawei peut désormais envoyer des centaines de personnes sur un projet. monter pour servir, et même perdre de l'argent sur certains projets clés pour gagner des revenus sur d'autres projets.

La société de puces anonyme susmentionnée compte également 200 vendeurs inconditionnels, une configuration très rare dans l'industrie nationale des puces. Leur équipe commerciale est partie des trois domaines les plus en vogue que sont la mise en œuvre de grands modèles, la finance, le droit et l'industrie, et est apparue dans presque toutes les expositions liées à la puissance de calcul. « Dans l'industrie des puces, les ressources passent en premier. Si vous courez lentement, vous mourrez. ." Perdu".

Une guerre cachée des prix pour les puces nationales a également commencé.

Une personne de l'industrie des puces a déclaré à 36Kr que son objectif était de remporter davantage de commandes de centres informatiques intelligents de référence, quel que soit le prix unitaire. 36 Krypton a observé que pour réduire les coûts, certaines entreprises nationales n'hésitent pas à supprimer la coûteuse HBM (mémoire à large bande passante) de leurs cartes d'inférence, et mêmeExpédié à un prix inférieur de 50% au prix de revient.

"Quoi qu'il en soit, tout le monde espère toujours franchir différents points d'entrée et chacun prendre une petite part du gâteau de NVIDIA, afin que NVIDIA ne soit plus le seul."

Mais la réalité est cruelle. En ce qui concerne les produits, les puces d'IA nationales auront inévitablement divers problèmes.

Un expert en puces a donné un exemple à 36Kr : le traitement du même ensemble de données à l'aide du cluster A100 de NVIDIA peut ne prendre que dix jours, mais l'utilisation de certaines puces nationales peut prendre plusieurs mois.Le temps d'accumulation du matériel de puce domestique est trop court, et il y a un manque de processus avancés et des lacunes matérielles, ce qui entraîne une faible efficacité.

Les lacunes du logiciel sont également évidentes. Un autre professionnel de l'industrie a testé et découvert que lorsque vous utilisez des puces nationales pour exécuter de grands modèles, si vous souhaitez créer des applications plus intéressantes, une fois le grand modèle de base modifié, les puces nationales sont sujettes à des pannes. « Dans de nombreux cas, nous utilisons. chips domestiques. " En gros, vous vous tenez le nez et vous l'utilisez. "

Aujourd’hui, chaque entreprise a vraiment vu clairement la stratégie « d’encerclement et de suppression » à portée de main et s’est progressivement différenciée vers des voies plus réalistes :

Bien qu'il existe encore quelques factions qui continuent de se déplacer vers le cluster Wanka, en se concentrant sur les scénarios de formation et en étant dures avec NVIDIA, représentée par Moore Threads et Huawei, la majorité des factions choisissent de se concentrer davantage sur l'utilisation de grands modèles/ ; petits modèles dans diverses industries.La mise en œuvre de diverses industries commence à partir de scénarios de raisonnement qui ne nécessitent pas de matériel et de logiciels élevés, représentés par Suiyuan, Tianshu Zhixin, etc.

(36 Kr Remarque : les grands modèles ont deux liens : la formation et l'inférence : la formation est le processus de recherche de modèles à partir de milliards de bases de données."faire"Le grand modèle ; l’inférence est en cours"utiliser"Le processus des grands modèles est moins difficile etExigences matérielles et logicielles réduites, rapprochement avec l'industrie)


Moore Thread lance le cluster Kua'e Wanka lors de la conférence sur l'intelligence artificielle 2024. 36 tirs de krypton

"Nous ne poursuivons pas aveuglément Nvidia maintenant. Nous ne pouvons pas nous permettre de rattraper notre retard et nous n'osons pas fabriquer aveuglément des puces dotées d'une puissance de calcul extrêmement importante", a déclaré sans détour un responsable de l'industrie des puces.

Une considération réaliste pour les fabricants de puces nationaux est que lesL'objectif principal n'est pas ici, et les fabricants nationaux ont évité la guerre frontale de Nvidia.

Auparavant, la plupart des entreprises utilisaient des cartes graphiques de jeu grand public NVIDIA 4090 pour effectuer des inférences basées sur des considérations de coût. Ces cartes présentaient de nombreux problèmes : consommation d'énergie excessive, mémoire insuffisante et désactivation. Les responsables de Nvidia n'autorisent pas non plus l'utilisation de ces cartes graphiques grand public pour l'inférence de grands modèles.

Les sociétés nationales de puces sont entrées dans la brèche de NVIDIA. Tianshu Zhixin et Suiyuan proposent tous deux des cartes d'inférence qui concurrencent le 4090 cette année, avec les arguments de vente d'une grande mémoire, d'une faible consommation d'énergie et d'un approvisionnement stable.

Les fabricants nationaux de puces ont également clairement indiqué l’importance d’identifier les segments de marché. Par exemple, pour certains scénarios sensibles à la consommation, nous nous concentrons sur de petites puces à faible consommation ; ou nous pouvons nous plonger dans des scénarios de niche tels que l'optimisation vidéo pour réaliser de petites mais belles affaires.

Le champ de bataille des géants est tendu.

Lorsque les sociétés nationales de GPU écrivent « dépasser NVIDIA » dans PPT, cela ressemble plus à une belle vision. Ce groupe de sociétés n'a pas été établi depuis longtemps et a rattrapé la tendance de substitution nationale, même s'il ne dépasse que légèrement. , c'est considéré comme un exploit. Nvidia est à la fois un rival et une référence pour eux.

Mais lorsqu’il s’agit d’Intel et d’AMD, dont l’ancienneté est comparable à celle de Nvidia, l’ambiance est encore plus tendue.

En interne, nous considérons Nvidia comme notre ennemi mortel", a déclaré à 36Kr un développeur de la gamme de produits de la série MI d'AMD.

Lors du Taipei Computer Show (Computex 2024) en juin de cette année, la fondatrice d'AMD, Su Zifeng (elle est également la cousine du fondateur de Nvidia, Huang Jen-Hsun) a également clarifié pour la première fois le futur rythme des produits AMD sur GPU en itérant un nouveau. chaque année, les produits GPU sont cohérents avec le rythme de mise à jour de Nvidia.

Presque chaque fois que Nvidia lance un GPU, AMD l'achète sur le marché et le démonte immédiatement pour le comparer avec des produits qui n'ont pas encore été lancés.

"Nous devons ajouter quelques fonctionnalités (indicateurs) ici et augmenter les paramètres là-bas." Ce qu'ils recherchent, c'est que "le matériel ne peut pas être à la traîne de NVIDIA et les paramètres sont légèrement meilleurs", a mentionné la personne susmentionnée à 36 Krypton.


Su Zifeng a lancé l'Instinct MI325X au Taipei Computex de cette année

Depuis 2023, les partenaires chinois de l’écosystème AMD recevront de nouvelles demandes d’optimisation logicielle de la part d’AMD presque tous les deux jours. Afin de promouvoir leurs GPU, les dirigeants d'AMD demandent parfois au département CPU le plus avantageux de faire correspondre les GPU pour passer des commandes, au risque que les CPU ne soient pas vendus.

Les gens d'AMD brûlent de l'encens et adorent Bouddha tous les jours, dans l'espoir que nous puissions améliorer l'écologie.», un dirigeant d'une entreprise écologique a déclaré que selon lui, actuellementIl existe déjà plus de 10 fournisseurs de cloud et clients To B en Chine, dans l'adaptation et la vérification des effets liés aux puces AMD.

Par rapport aux fabricants de puces nationaux anxieux, l'avantage des géants étrangers des puces au niveau matériel est qu'ils disposent de processus avancés et d'une capacité de production HBM. Il n'y a donc pas un grand écart entre les produits AMD et Intel par rapport aux produits Nvidia. dans une certaine mesure.

Les données officielles montrent que le produit d'AMD (MI300X sorti en décembre 2023) affirmait précédemment que la puissance de calcul était 1,2 fois supérieure à celle du Nvidia H100 ;

Le produit d'Intel (Gaudi 3 sorti en avril 2024) dépasse également de loin le H100 en termes d'efficacité énergétique et de performances d'inférence. Bien sûr, il est également moins cher, le prix du GPU AMD représente environ 70 à 80 % de celui des produits de référence de Nvidia.

Mais tous les constructeurs agressifs envers Nvidia sont confrontés à un problème commun :Quelle que soit la solidité de notre matériel, il est éclipsé par la faiblesse des logiciels, tout comme les défauts d'un baril.

À une époque où les GPU ne pouvaient être utilisés que pour le calcul graphique, la plateforme logicielle CUDA lancée par NVIDIA équivalait à fournir aux développeurs un ensemble d'interfaces de programmation, leur permettant d'écrire librement des programmes informatiques sur le GPU en utilisant le langage de programmation qui leur est le plus familier. avec.

"Laissez-moi vous donner une analogie. Pourquoi CUDA ne peut-il pas la surpasser ? C'est comme si vous appreniez une langue et travailliez dans cette langue depuis tant d'années. Si je vous demande de changer de langue, vous sentirez-vous mal à l'aise ? Aren' Tu n'es pas d'accord ?" Un employé d'une entreprise de puces a donné un exemple de 36 Kr.

CUDA est l’obstacle le plus profond à l’écosystème logiciel de Nvidia.Même Intel et AMD, qui sont de grandes entreprises, ne peuvent pas dépasser les autres en peu de temps.

Un ancien employé de l'équipe GPU Intel a déclaré à 36Kr qu'ils avaient déployé plus de 3 000 ingénieurs dans le monde et investi trois ou quatre ans, mais n'avaient amélioré la précision que de 0 % à 4 % - ils ont utilisé des puces Intel pour convertir un portrait et ont attendu Après un long moment, l'information s'est perdue au point que "ce n'était plus un visage humain".


Kissinger, PDG d'Intel, lance la série de puces Gaudi

Le mythe de la « poule et de l’œuf » réapparaît. C'est précisément parce que peu de gens utilisent les GPU AMD et Intel, et encore moins de personnes utilisent leurs plates-formes logicielles correspondantes (ROCm, oneAPI), il est donc difficile pour quiconque d'utiliser pleinement leurs véritables capacités matérielles.

"La CUDA de NVIDIA a toujours eu beaucoup de développeurs qui itèrent sur les algorithmes, aidant NVIDIA à rendre l'inférence et la formation très efficaces. En conséquence, NVIDIA a toujours eu un pouvoir de négociation et sait toujours ce que sa prochaine puce devrait faire, mais c'est AMD. C'est un casse-tête à la fois pour Intel et Intel », a déclaré sans détour le PDG d’une société de l’écosystème AMD.L'outil logiciel ROCm d'AMD est "tout comme le CUDA de NVIDIA il y a 20 ans".

Mais pour les clients en aval, c’est là que le risque surgit.

Vérifier un grand modèle est intrinsèquement une expérience pleine d'incertitude. Si vous souhaitez toujours l'exécuter sur une puce qui n'a pas été vérifiée, cela équivaut à mettre ensemble deux variables incontrôlables - abandonner Nvidia signifie devoir payer une somme énorme. incertitude.

Malgré cela, l’encerclement et la suppression de Nvidia restent une bataille qui doit être menée pour AMD et Intel.

L'architecture mondiale des puces est divisée en trois parties : l'architecture X86 guide le domaine des PC et est dominée par Intel et AMD ; le marché mobile est dominé par Arm et NVIDIA domine le marché de l'intelligence artificielle ;

En près d'un an et demi après l'avènement de la nouvelle révolution de l'IA, Nvidia a franchi la barre des 3 000 milliards de dollars de valeur marchande, ce qui équivaut désormais à la valeur marchande combinée de 7 Intel + AMD.

Après 20 ans, « l’encerclement et la suppression » de Nvidia par les géants des puces,C'était une autre bataille anxieuse, et c'était aussi une contre-attaque tardive.

vraie fissure

Lorsque les fabricants nationaux de puces IA forment une armée de fourmis, AMD et Intel mettent tout en œuvre. Nvidia est-il vraiment ébranlé face à un tel siège ?

Les fissures dans l’empire NVIDIA se propagent tranquillement.

Un signal sur lequel Nvidia doit être vigilant est qu'OpenAI, Google, Microsoft... ces gros clients qui ont rechargé Nvidia en raison de leur croyance en l'IA font le premier pas vers « l'anti-Nvidia ».

Les jetons auto-développés sont un jeu d'échecs planifié depuis longtemps par diverses entreprises. Un ancien employé principal de l’équipe TPU de Google a déclaré à 36Kr que Google, qui utilise 1/4 de la puissance de calcul mondiale,"Nous ne pourrons peut-être pas acheter de puces externes d'ici la fin de l'année."

Dans le passé, le TPU développé par Google était davantage basé sur des considérations de coûts. Par exemple, on craignait que Nvidia augmente les prix à volonté ou que l'offre ne soit pas suffisamment stable. Aujourd'hui, la stratégie de création de cœurs de Google est plus radicale."Presque quel que soit le coût et le coût."

OpenAI a d'innombrables préparatifs. Ils prévoient de lever jusqu'à 7 000 milliards de dollars américains pour construire un nouvel empire de puces IA.

Au niveau national, 36Kr a également appris de nombreuses sources——À l'heure actuelle, les plus grands acheteurs nationaux de Nvidia, Alibaba, Byte et Baidu, recherchent en secret des puces pour la formation de grands modèles.

Progrès des produits des fabricants de cloud étrangers, des grands fabricants de modèles et des fabricants de puces vedettes, collecte et cartographie complètes d'informations de 36 Kr

Cependant, les puces développées par Nvidia constituent après tout une solution à long terme. Un autre plan à court terme pour ces gros clients est d'essayer les produits des concurrents de Nvidia et de réduire leur dépendance à l'égard de Nvidia.

AMD est ce plan B. Un initié d'AMD a déclaré à 36Kr :Les produits GPU d'AMD ont déjà ouvert de vastes marchés clients en Europe, aux États-Unis, en Corée du Sud et ailleurs——Microsoft a acheté des dizaines de milliers de produits AMD, et Tesla, Midjourney, le laboratoire national américain et Korea Telecom ont également pris livraison des produits par lots.

En Chine, Chen Wen, un employé d'AMD Ecosystem, a déclaré que des centaines de cartes accélératrices AMD d'un certain modèle seraient expédiées en 2023. Bien que ce ne soit pas beaucoup, "mais ce produit AMD n'a presque jamais été trouvé en Chine auparavant".

Selon les précédentes estimations optimistes d’AMD, les GPU des centres de données rapporteront jusqu’à 2 milliards de dollars de revenus à AMD d’ici fin 2024.

Même si l’armée de fourmis des fabricants de puces chinois ne constitue pas encore une menace substantielle pour Nvidia, ses étincelles prennent progressivement de l’ampleur.

36Kr a appris que désormais, les ventes nationales de puces de formation et d'inférence ont atteint un nouveau niveau - un signal gratifiant et positif est que les sociétés Internet et les grandes entreprises modèles, reconnues comme les plus difficiles à remporter des commandes en Chine, ont commencé à investir dans des puces nationales. Le fabricant a ouvert la bouche.

Selon 36Kr, actuellement,Ascend Chip a eu du mal à pénétrer le système des sociétés Internet, dont Baidu.

De plus, les sociétés nationales d'IA telles que Zhipu AI, MiniMax et Step Star forment toutes de grands modèles avec des milliards de paramètres. Cependant, lorsque les puces haut de gamme de NVIDIA sont limitées, les grandes sociétés de modèles choisissent généralement une « formation mixte » (c'est-à-dire NVIDIA +). autres puces), telles que,Le cluster de Zhipu AI réserve près de la moitié des puces Shengteng.

En outre, les produits de puces d'inférence de Tianshu Zhixin et Suiyuan ont tous deux expédié des dizaines de milliers de pièces depuis l'année dernière. Les canaux d'expédition comprennent les principaux centres informatiques intelligents nationaux. Le premier est entré dans la chaîne d'approvisionnement de Baichuan, un grand fabricant de modèles. Puce Kunlun Ici, les expéditions cumulées des deux dernières générations de puces d'inférence sont de 30 000 à 50 000 pièces, les expéditions depuis Baidu et les canaux externes représentant chacune la moitié.

"Les niveaux actuels de prix et d'approvisionnement de Nvidia sont à la limite de tester si et comment tout le monde peut le faire.", a déclaré sans détour un initié de l’industrie.


Huang Jenxun, fondateur de NVIDIA Picture Source Visual China

Si l’on regarde plus loin dans les trois à cinq prochaines années, de nouvelles menaces pour Nvidia apparaîtront progressivement.

De toutes nouvelles architectures de puces IA autres que les GPU sont également apparues dans l'industrie - par exemple, la société de puces Groq de la Silicon Valley, qui a précédemment lancé l'architecture LPU, prétend exécuter de grands modèles de langage "dix fois plus rapides" que les GPU de Nvidia ;

Il y a aussi la puce Etched de la Silicon Valley, qui a sorti une puce ASIC grand modèle, prétendant être « un ordre de grandeur plus rapide » que les GPU Nvidia. Ces startups de puces sont soutenues par des gammes d’investissements vedettes comme OpenAI.

36Kr a appris que de toutes nouvelles startups de puces IA ont vu le jour en Chine cette année. Par exemple, Shanghai a récemment soutenu secrètement deux nouvelles sociétés de puces IA.

Yang Gongyifan, PDG de Zhonghao Xinying, une société nationale de TPU, a déclaré que le taux d'utilisation global des transistors du GPU n'est que de 20 %. En fait, les lacunes sont évidentes, même si les nouvelles architectures telles que TPU et ASIC ne sont pas très polyvalentes. , leurs transistors Le taux d'utilisation peut atteindre 60 à 100 % "Dans les trois à cinq prochaines années, il y aura certainement un grand nombre de puces d'IA en dehors de l'architecture GPU au pays et à l'étranger."

Un petit peu suffit à faire trembler le géant NVIDIA.

"Pensez-vous que NVIDIA semble n'avoir aucun rival à l'extérieur ? Ce n'est vraiment pas le cas", a déclaré un employé de NVIDIA à 36Kr. Comme le dit souvent Huang Renxun : « Nous n'avons que 30 jours avant la faillite ».

NVIDIA se prépare depuis plus de dix ans, puis est tombé sur une entreprise géniale comme OpenAI, et ils ont catalysé conjointement le miracle de NVIDIA. Dans le passé, l’industrie des semi-conducteurs ne manquait pas d’histoires de dépassement de géants dans les virages.

La fumée de la bataille pour encercler et supprimer Nvidia s’est déjà allumée.

fin

fin