nouvelles

Les 3 000 milliards d’entreprises de puces électroniques essaient-elles également de survivre ?

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia prévoit de produire à nouveau des puces IA spéciales pour le marché chinois.

Selon le dernier rapport de Reuters, des personnes proches du dossier ont déclaré qu'Intel développait une nouvelle puce d'IA phare pour le marché chinois qui répond aux exigences des contrôles d'exportation américains actuels et ajoute un autre membre à la gamme nationale de puces spéciales Nvidia.

Il convient de mentionner que Nvidia a lancé la série "Blackwell" en mars de cette année, qui devrait être produite en série plus tard cette année. Selon Nvidia, le B200 est 30 fois plus rapide que son prédécesseur sur certaines tâches. des meilleures puces IA actuellement disponibles.

Cette nouvelle puce phare spéciale est également liée au B200. Des sources ont indiqué que Nvidia coopérerait avec Inspur Group, l'un de ses principaux partenaires de distribution en Chine, pour lancer et distribuer cette puce, provisoirement nommée « B20 ». peut avoir certaines fonctionnalités du B200.

En comptant ce B20, en un peu plus d'un an, Nvidia a lancé sept ou huit puces spéciales pour le marché chinois.

A800 et H800

Le 7 octobre 2022, le gouvernement américain a annoncé une série de mesures de contrôle des exportations, notamment l'arrêt de la fourniture de certaines puces semi-conductrices et d'équipements de fabrication de puces à la Chine.

En plus d'affecter les équipements de production tels que les machines de photolithographie, cela restreint également l'accès de la Chine aux puces de haute informatique et d'intelligence artificielle dans le cadre de processus avancés, notamment en interdisant à des sociétés américaines telles que Nvidia et AMD de vendre de telles puces à la Chine, et en restreignant également l'intelligence artificielle chinoise. Les sociétés de puces effectuent des enregistrements dans des usines Fab à l'étranger avec la technologie américaine.

Cette restriction à l’exportation a touché Nvidia et AMD.

Nvidia a déclaré après l'introduction des restrictions que l'interdiction affectait ses puces A100 et H100 conçues pour accélérer les tâches d'apprentissage automatique et pourrait entraver l'achèvement du développement de sa puce phare H100 qui sera commercialisée en 2022. Il a souligné que les ventes des puces concernées en Chine au cours du trimestre avaient atteint 400 millions de dollars américains. Si les entreprises chinoises décident de ne pas acheter les produits de remplacement de Nvidia, cet argent sera perdu en vain.

Alors, comment les restrictions américaines à l’exportation restreignent-elles exactement les puces Nvidia ?

Selon les règles de restriction à l'exportation pour les circuits intégrés informatiques avancés (ECCN 3A090 et 4A090) publiées par le ministère du Commerce des États-Unis le 7 octobre 2022, la liste des articles contrôlés doit remplir les conditions suivantes :

a. Circuits intégrés avec un taux de transfert bidirectionnel total de toutes les entrées et sorties, ou programmables, de 600 Go/s ou plus, autres que la mémoire volatile, et l'un des circuits intégrés suivants :

a.1. Une ou plusieurs unités de processeur numérique qui exécutent des instructions machine, la longueur en bits de chaque opération multipliée par les performances de traitement dans TOPS, et la somme de toutes les unités de processeur est de 4 800 ou plus ;

a.2. Une ou plusieurs « unités de calcul brutes » numériques (à l'exclusion des unités qui aident à l'exécution d'instructions machine liées au calcul du TOPS de 3A090.a.1) dont la longueur en bits par opération est multipliée par la somme de toutes les unités de calcul. Les performances de traitement TOPS sont de 4 800 ou plus ;

a.3. Une ou plusieurs « unités de calcul originales » de simulation, à valeurs multiples ou à plusieurs niveaux, dont la performance de traitement est calculée comme TOPS multiplié par 8, et le total de toutes les unités de calcul atteint ou dépasse 4 800 ;

a.4. Toute combinaison d'unités de traitement numérique et d'"unités de calcul originales" dont la somme calculée conformément aux 3A090.a.1, 3A090.a.2 et 3A090.a.3 s'élève à 4 800 ou plus.

Le circuit intégré décrit dans 3A090.a. comprend une unité de traitement graphique (GPU), une unité de traitement tensoriel (TPU), un processeur neuronal, un processeur de mémoire, un processeur de vision, un processeur de texte, un coprocesseur/accélérateur, des dispositifs de traitement adaptatif et des dispositifs logiques programmables sur site. (FPLD) et les circuits intégrés spécifiques à une application (ASIC).

Il n'est pas difficile de voir que le plus important est la limite de vitesse d'interconnexion des puces. Selon cette réglementation, le très vendu A100 de NVIDIA se situait précisément dans la limite et son taux de transfert entre puces atteignait 600 Go/s. Dans une certaine mesure, le département américain du Commerce a peut-être désigné cette restriction sur la base de l'A100.

Afin de faire face aux contrôles à l'exportation, NVIDIA a rapidement castré un remplaçant pour l'A100-A800. L'interdiction américaine a été officiellement annoncée le 7 octobre 2022, et un mois plus tard, NVIDIA a proposé l'A800 qui s'adapte à la nouvelle réglementation. autrefois adaptée aux conditions locales, elle est désormais adaptée aux conditions politiques.

Selon les spécifications, le NVIDIA A800 utilisera la même architecture de puce que le GPU Ampere A100. Il sera disponible en trois versions, deux versions PCIe de 40 Go et 80 Go, et une version SXM de 80 Go. Ces GPU fourniront jusqu'à 9,7 TFLOP du FP64, 19,5 TFLOP du FP64 Tensor Core, 19,5 TFLOP du FP32, 156 TFLOP. (312 TFLOPs rares) TF32, 312 TFLOPs (624 TFLOPs rares) BFLOAT16 et 624 TOPS (1248 TOPs rares) performances INT8. La version 40 Go est dotée d'une mémoire HBM2 avec une bande passante jusqu'à 1,555 To/s, tandis que la version 80 Go est dotée d'une mémoire HBM2e avec une bande passante jusqu'à 2 To/s.

Bien entendu, afin de répondre à la demande limitée, la bande passante a inévitablement été réduite, passant des 600 Go/s d'origine à 400 Go/s. Un porte-parole de Nvidia a déclaré dans une déclaration à Reuters : « Le GPU A800 a été mis en service au cours du mois. production, une alternative au GPU A100 pour les clients chinois, l’A800 répond aux tests explicites du gouvernement américain en matière de réduction des contrôles à l’exportation et ne peut pas être programmé au-delà de cette norme.

Wayne Lam, analyste chez CCS Insight, a commenté : « L'A800 semble être un GPU A100 reconditionné conçu pour éviter les récentes restrictions commerciales du ministère du Commerce », tout en soulignant que 8 est un chiffre porte-bonheur en Chine.

"La Chine est un marché important pour Nvidia, et il est judicieux, d'un point de vue commercial, de reconfigurer le produit pour éviter les restrictions commerciales", a déclaré Lam, qui a déclaré que les capacités de communication entre puces de l'A800 étaient considérablement réduites pour les centres de données utilisant des milliers de puces.

Sur le H100 suivant, Nvidia a emboîté le pas et a proposé le H800. Sur l'A100, Nvidia a réduit l'interconnexion de 600 Go/s du GPU à 400 Go/s, et a fait la même chose avec le H100. Selon les rapports, le taux d'interconnexion des puces du H800 a été réduit à environ la moitié de celui du H100, soit de 800 Go/s à 400 Go/s. Par rapport à l'A800, les performances du H800 ont un impact plus important. Après tout, la première n'est réduite que de 33 % et la seconde est réduite de 50 %.

À l'époque, un porte-parole de NVIDIA avait refusé de divulguer la différence entre le H800 et le H100 pour le marché chinois, affirmant seulement que « nos produits de la série 800 étaient entièrement conformes aux réglementations de contrôle des exportations ».

Lorsque les fabricants étrangers achètent frénétiquement les A100 et H100, les fabricants nationaux ne peuvent choisir que les H800 et A800 avec des configurations inférieures. La version spéciale de la puce de NVIDIA a limité dans une certaine mesure le développement de grands modèles d'IA nationaux.

H20 et RTX 4090D

Pour les entreprises nationales, les A800 et H800 ont de bonnes et de mauvaises qualités. Le problème est qu'après avoir coupé la bande passante Internet, les performances de ces deux puces sont un peu moins bonnes et la vitesse d'entraînement est également beaucoup plus lente. ils sont à la fois bons et mauvais. Ils peuvent être commandés via les canaux de Zhengcheng, mais par rapport aux entreprises étrangères, le coût des puces sera plus élevé.

Mais les A800 et H800 n’ont pas non plus duré plus d’un an. Le 17 octobre 2023, le département américain du Commerce a publié de nouvelles règles de contrôle pour réglementer l'exportation de circuits intégrés informatiques avancés, d'équipements de fabrication de semi-conducteurs et d'articles prenant en charge les applications et les utilisations finales de calcul intensif, publiées le 7 octobre 2022. Mises à jour supplémentaires.

Les principaux changements concernent les paramètres de contrôle. La règle finale provisoire supprime la « bande passante d'interconnexion » comme paramètre d'identification des puces restreintes sous ECCN 3A090, et la remplace à la place par la « bande passante d'interconnexion » comme paramètre d'identification des puces restreintes sous ECCN 3A090 si le La puce dépasse les deux paramètres calibrés dans ECCN 3A090 (3A090. a et 3A090.b), l'exportation sera restreinte.

Selon les documents du Département américain du Commerce, les paramètres réglementaires révisés 3A090.a réglementeront les circuits intégrés dotés d'une ou plusieurs unités de traitement numérique, et la « performance totale de traitement » de ces unités doit être de 4 800 ou plus, ou « performance totale de traitement "performance" est de 1 600 ou plus et la "densité de performance" est de 5,92 ou plus. Le nouveau ECCN 3A090.b réglementera les circuits intégrés dotés d'une ou plusieurs unités de traitement numérique qui doivent remplir l'une des conditions suivantes : une "performance de traitement totale" de 2 400 ou plus mais inférieure à 4 800 et une "densité de performance" de 1,6 ou 1,6. ou plus mais inférieure à 5,92, ou « performance totale de traitement » est de 1 600 ou plus, et « densité de performances » est de 3,2 ou supérieure à 3,2 mais inférieure à 5,92.

De plus, la règle crée une exception de licence qui crée un nouvel « Avis d'exception de licence pour l'informatique avancée » pour les circuits intégrés grand public dotés de capacités d'intelligence artificielle inférieures au seuil restrictif. L'exception s'applique à deux produits, dont un conçu ou des puces vendues pour être utilisées dans les données. Les centres de données, les seconds étant des puces non conçues ou vendues pour une utilisation dans les centres de données, ont une « performance de traitement totale » de 4 800 ou plus.

Par rapport aux règles du 7 octobre 2022, les nouvelles règles ont une fois de plus élargi la portée du contrôle. En vertu des deux règles de performance totale de transformation et de densité de performance, les produits non castrés et castrés sont inclus dans les contrôles à l'exportation. Dans le champ d'application, les A800 et H800 ont été concernés, tandis que d'autres produits Nvidia ont également été concernés. Les L40 et L40S destinés au marché du raisonnement, et le RTX 4090 dans le domaine grand public ont également été inclus dans l'interdiction.

Ce fut un coup dur pour Nvidia, ce qui signifiait que les produits grand public vendus par Nvidia à l'époque ne pouvaient pas être vendus en Chine en raison des contrôles à l'exportation. Vous devez savoir que les années précédentes, les revenus de l'activité des centres de données du marché chinois représentaient. environ le chiffre d'affaires global de Nvidia de 20 à 25 %, et au quatrième trimestre de l'exercice 2024, en raison des contrôles à l'exportation, le chiffre d'affaires sur le marché chinois a chuté à un chiffre.

Impuissant, Nvidia ne pouvait à nouveau manier la machette.

Le 16 novembre 2023, un mois après la publication des nouvelles règles, NVIDIA a lancé des puces GPU spécialement pour le marché chinois : les H20, L20 et L2 sont basées sur l'architecture Hopper de NVIDIA, tandis que les L20 et L2 sont basées sur l'Ada. architecture.

Parmi elles, les deux puces L20 et L2 ont été ajustées respectivement sur la base de L40 et L4. Puisqu'il s'agit d'architectures anciennes et qu'elles ne sont pas couramment utilisées dans le raisonnement et la formation, elles n'ont pas reçu beaucoup d'attention. Le H20 est plus intéressant, même s'il a obtenu 900 Go/s de NVLink complet en raison de la nouvelle réglementation qui ne limite plus la vitesse d'Internet, les performances doivent être fortement réduites selon l'analyste Dylan Petal, même si l'utilisation réelle du H20. Le taux peut atteindre 90 %, mais ses performances dans l'environnement réel d'interconnexion multi-cartes ne sont encore que proches de 50 % de celles du H100.

Pour le RTX 4090 sur le marché grand public, NVIDIA a également lancé un remplacement - le RTX 4090D en décembre de l'année dernière. Cette puce spéciale conforme aux contrôles d'exportation américains a été castrée en termes de cœur CUDA et de consommation d'énergie. 12,8 %, la consommation électrique est également réduite de 450 W à 425 W, soit une réduction de 5,9 %, toutes les autres spécifications de base restent les mêmes.

En raison de la légère augmentation de la fréquence principale, dans certains tests de référence, les performances du 4090D ne sont que d'environ 5 % inférieures à celles du 4090. Par rapport aux puces AI, cet écart semble se situer dans la plage acceptable.

Les quatre puces spéciales consécutives fin 2023 ont atténué dans une certaine mesure l'embarras de Nvidia Chine et l'ont empêché de manquer de produits à vendre. Cependant, après deux séries de restrictions, les grandes entreprises et les petites et moyennes entreprises ont réussi à le faire. a commencé à chercher ailleurs. La solution consiste soit à acheter des puces nationales, à construire des serveurs à l'étranger, soit à acheter des H100/200 et A100 par des canaux non officiels, ce qui n'a d'autre choix que de se propager parmi les fabricants nationaux.

Les compétences au couteau de Lao Huang

Les joueurs bricoleurs qui sont familiers avec les GPU de jeu ne seront pas trop étrangers aux compétences de Lao Huang au couteau.

Prenons un exemple relativement récent. Un an après la sortie de la série RTX 20, afin de mieux différencier la gamme de produits et de répondre au lancement de nouveaux produits de la série RX5000 d'AMD à côté, Nvidia a lancé la série RTX 20 Super.

Bien qu'ils soient également basés sur les cœurs TU106 et TU104, Nvidia a utilisé ces deux cœurs pour créer cinq cartes graphiques, à savoir RTX 2060, RTX 2060 Super, RTX 2070, RTX 2070 Super et RTX 2080. Parmi elles, le plus petit écart se situe entre L'écart de performances théorique entre le noyau TU106 RTX 2060 Super et le RTX 2070 n'est que d'environ 5 %, et les scores réels en cours d'exécution et les tests de jeu sont également très proches. On peut dire que Nvidia a poussé la castration à l'extrême.

De nos jours, les puces spécialement modifiées produites par NVIDIA pour la Chine ne sont rien d'autre qu'une répétition du passé et un retour aux anciennes activités.

En plus du B20 mentionné au début, Nvidia prévoit également de montrer ses compétences sur le marché grand public. Selon certaines informations, le RTX 5090D, une version réduite du RTX 5090, devrait être lancé en janvier 2025 et. devrait être basé sur l'architecture Blackwell de Nvidia. L'utilisation du processus 4NP de TSMC pourrait réduire les spécifications de base pour contourner les restrictions américaines à l'exportation.

En comptant ces deux puces supposées, Nvidia propose déjà une énorme gamme spéciale en Chine : A800, H800, H20, L20, L2, RTX 4090D, B20, RTX 5090D,

Certaines personnes sont plutôt optimistes quant aux perspectives de ces puces en édition spéciale. L'organisme de recherche SemiAnalysis estime que Nvidia devrait vendre plus d'un million de puces H20 en Chine cette année, pour une valeur de plus de 12 milliards de dollars américains.

Mais Nvidia a encore de quoi s’inquiéter. Selon un rapport des analystes de Jeffries, lorsque les États-Unis procéderont à leur examen annuel des contrôles à l'exportation de semi-conducteurs en octobre, il est "très probable" d'interdire les ventes de puces H20 de Nvidia à la Chine. L'analyste a déclaré que l'interdiction pourrait concerner "un produit spécifique". interdictions, plafonds de capacité de calcul inférieurs et/ou capacité de mémoire limitée » à mettre en œuvre.

De plus, les cartes de conformité fabriquées artificiellement comme le H20 sont essentiellement basées sur la castration des noyaux existants. Il en va de même pour le B20. Il aurait pu être utilisé comme noyau du H200 et du B200, mais il ne peut désormais être utilisé que pour vendre des spéciaux moins chers. éditions. , et la durée de vente ne sera probablement que de plus d'un an, c'est donc une entreprise déficitaire, quelle que soit la façon dont vous la regardez.

Mais Nvidia n'a pas d'issue. Elle ne peut que faire de son mieux pour équilibrer les règles et le marché. Mais combien d'entreprises en Chine sont prêtes à payer pour les puces en édition spéciale qui sont coupées encore et encore ?