nouvelles

qui a le plus de gpu ?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

avec l’avènement de l’ère de l’intelligence artificielle, le gpu est devenu le centre de toutes les attentions.

cependant, si vous souhaitez maximiser les fonctions de formation et d'inférence de l'ia du gpu, vous devez également vous appuyer sur la puissance du centre de données. un centre de données ia est souvent équipé de dizaines de milliers de gpu. c'est grâce à cette synergie. nous pouvons réaliser des choses comme un chatbot puissant comme chatgpt.

cependant, le prix des centres de données d'ia n'est pas faible. le coût de construction de plusieurs milliards de dollars n'est pas seulement exclusif aux géants de la technologie, mais interdit également à de nombreux pays et régions qui ne sont pas forts.

alors que de plus en plus de choses peuvent être faites avec l'intelligence artificielle, l'importance géopolitique des puces haut de gamme augmente également de jour en jour. de plus en plus de pays et de régions se font concurrence pour accumuler des puces, et certains ont même promulgué des lois pour empêcher certains pays et. les régions d'acheter les puces les plus avancées, les sanctions.mais jusqu’à présent, il y a eu un manque surprenant de données publiques sur l’emplacement exact des puces d’ia dans le monde.

le professeur vili lehdonvirta de l'internet institute de l'université d'oxford a révélé une réalité qui ne peut être ignorée : les gpu sont fortement concentrés dans seulement 30 pays et régions du monde, parmi lesquels les états-unis et la chine sont loin devant, et la plupart des régions sont en bonne voie. appelés "déserts informatiques" : il n'y a aucun gpu disponible à la location.

comment enquêter sur les distributions

la chaîne d’approvisionnement mondiale en informatique de l’ia peut être grossièrement divisée en quatre parties :

entreprises qui conçoivent et vendent des gpu et autres puces liées à l'ia

entreprises qui fabriquent et emballent des puces

entreprises déployant des puces pour fournir de la puissance de calcul

entreprises qui dépensent de la puissance de calcul pour développer ou déployer des systèmes d'ia

le leader du marché en matière de conception et de vente de gpu est la société américaine nvidia, la fabrication de puces est dominée par la société taïwanaise taiwan semiconductor manufacturing co., ltd. (tsmc), et la société néerlandaise asml est actuellement la seule entreprise à produire des machines de lithographie essentielles à la fabrication. les puces de pointe sont essentielles (miller 2022). en conséquence, ces éléments de la chaîne d’approvisionnement informatique sont très concentrés, tant en termes de géographie que de propriété.

cette étude se concentre sur la troisième étape de la chaîne d'approvisionnement : où dans le monde les puces sont déployées pour fournir le calcul de l'ia pour le développement et le déploiement de l'ia, c'est-à-dire pour former des modèles d'ia et exécuter des inférences sur des modèles existants. d’une manière générale, il existe trois catégories de fournisseurs de calcul à grande échelle : les installations de calcul scientifique, les clusters informatiques privés et les fournisseurs de cloud computing dits publics.

les installations scientifiques de calcul intensif existent depuis le début des années 1960, sont généralement financées par les gouvernements et sont principalement utilisées à des fins académiques et militaires. une étude de l’ocde (2023) a mené une analyse géographique simple des installations scientifiques de calcul intensif. selon la base de données top500, la chine possède le plus grand nombre de superordinateurs, avec 32 % ; suivie par les états-unis, avec 25 % et l'union européenne, avec 21 % ; cependant, la plupart des supercalculateurs scientifiques ne sont pas conçus pour la formation de modèles d’ia (ocde 2023). la prospérité actuelle du développement de l’ia générative repose principalement sur les clusters informatiques privés et le cloud computing public. les études antérieures n’ont pas analysé leur répartition géographique en détail.

les clusters informatiques privés appartiennent à des sociétés à but lucratif telles que meta, hp et de nombreuses petites entreprises. ces clusters sont constitués d'ordinateurs connectés au gpu et déployés dans des centres de données. un cluster privé peut être utilisé pour le développement de l'ia de l'entreprise ou loué à d'autres entreprises. les fournisseurs de cloud computing public sont également des entreprises à but lucratif. ils sont appelés « public » non pas à cause d'un lien avec le gouvernement, mais parce que leurs services sont fournis à la demande et partagés par plusieurs clients (c'est-à-dire similaire à la signification de « public » dans une taverne, plutôt que du ministère public « public ») . les leaders du marché du cloud computing public incluent aws, microsoft azure et google cloud ; les fournisseurs chinois de cloud public alibaba et tencent proposent également du calcul ia à grande échelle. ces grands fournisseurs sont souvent appelés « fournisseurs d’informatique hyperscale ».

cette étude se concentre principalement sur la répartition géographique de l’informatique ia dans le cloud public. des clusters informatiques privés ont été utilisés pour entraîner certains modèles emblématiques tels que meta’s llama et llama 2. mais la formation et le développement d'un grand nombre de modèles d'ia de pointe sont concentrés dans les fournisseurs de cloud public hyperscale google, microsoft et amazon, et dans leurs « partenariats informatiques » avec des sociétés d'ia de premier plan, telles qu'anthropic, cohere, google deepmind, hugging. visage, openai et stabilité ai. le cloud public est également important car il est ouvert à de nombreux types de développeurs, notamment aux chercheurs universitaires. par conséquent, notre principale question de recherche est la suivante : quelle est la répartition géographique de l’ia dans le cloud public dans le monde ? nous explorerons également les raisons potentielles de ces dispersions géographiques, discuterons de leurs implications pour la gouvernance informatique et la géopolitique, et conclurons par une brève discussion sur les clusters privés et l'informatique nationale de l'ia appartenant au gouvernement.

le recensement de l'étude couvre les six plus grands fournisseurs de cloud public hyperscale : aws, microsoft, google, alibaba, huawei et tencent. bien qu'il existe un certain nombre de petits fournisseurs, ces six représentent la majorité du marché mondial du cloud public et sont également leaders sur divers marchés régionaux. au moment du recensement, le gpu le plus puissant pour la formation des modèles d’ia courants était le h100 de nvidia, lancé en 2023, avec le modèle phare précédent, l’a100, lancé en 2020, et le v100 plus tôt en 2017. en 2023, nvidia a introduit les h800 et a800 pour contourner les restrictions américaines à l’exportation vers la chine, mais ces restrictions ont été rapidement étendues à ces nouveaux modèles. la collecte de données s'est concentrée sur ces cinq types de gpu les plus pertinents pour l'ia.

à partir de la base de données du recensement, l’étude a construit un ensemble de données au niveau national pour permettre une analyse géographique.pour chaque pays, il a calculé le nombre total de régions de cloud public sur son territoire, a également calculé le sous-ensemble de régions prenant en charge au moins un type de gpu (« régions compatibles gpu ») et le sous-ensemble de régions prenant en charge un gpu spécifique. taper.

pour compléter les données du recensement du cloud, l'étude a mené des entretiens qualitatifs et semi-structurés avec des experts. nous avons interrogé un total de 10 informateurs, représentant deux experts politiques, trois experts en fournisseurs de cloud public hyperscale et cinq experts en recherche possédant une expertise en informatique ia. ces informateurs ont été recrutés par échantillonnage boule de neige via notre propre réseau professionnel. les principaux objectifs de ces entretiens sont d'améliorer et de valider la méthodologie du recensement, de générer des informations supplémentaires ou alternatives sur la répartition géographique de l'ia dans le cloud public et d'aider à expliquer les modèles géographiques observés.

où sont les gpu ia ?

la figure 1 montre l'emplacement approximatif des zones de cloud public trouvées dans le recensement. le tableau 4 indique le nombre de régions cloud existant dans chaque pays et combien de ces régions proposent des instances gpu. du point de vue de la gouvernance informatique, l’une des caractéristiques les plus importantes des données est que la grande majorité des pays dans le monde ne disposent d’aucune région de cloud public. sur les 39 pays disposant d’une ou plusieurs régions cloud, 30 ont des régions cloud prenant en charge les gpu.

une autre caractéristique frappante est que même au sein des pays dotés de régions cloud compatibles gpu, la répartition géographique des régions est fortement polarisée :la chine et les états-unis réunis comptent presque autant de régions (49) que le reste du monde réuni (52). parmi les deux, le nombre total de régions prenant en charge les gpu en chine est légèrement supérieur (27) à celui des états-unis (22).

une analyse plus approfondie peut être menée en examinant les types d’instances gpu proposées dans chaque pays. le schéma le plus évident est que les états-unis possèdent les gpu les plus récents et les plus puissants au monde, non seulement en termes de proportion de différents types d'instances disponibles, mais également en nombre. les états-unis sont le seul pays où le gpu nvidia a100 2020 est disponible dans plus de régions que le gpu v100 2017. les états-unis comptent également plusieurs régions proposant le gpu nvidia h100 2023. les régions cloud en chine sont principalement basées sur v100, et quelques régions fournissent des instances a100. le h100 n’est disponible dans aucune région de chine. seuls 15 pays dans le reste du monde proposent l'a100, un seul pays propose le h100 et les régions restantes sont uniquement basées sur le v100.

cette analyse ne prend pas en compte les puces d'accélération personnalisées (telles que les tpu), ni les différences dans le nombre de gpu disponibles dans les différentes régions. les personnes interrogées ont noté que le nombre de gpu du même type disponibles dans différentes régions peut varier considérablement selon les régions et les fournisseurs. un informateur a noté : « les fournisseurs de services cloud hyperscale donnent presque l'impression d'être omnipotents en termes de calcul ou de stockage et semblent être capables de gérer n'importe quel problème que vous leur posez. mais ce n'est pas tout à fait la réalité. » le nombre de gpu disponibles dans une région peut être très limité, ce qui signifie que seul un nombre limité de clients peuvent exécuter des instances de gpu dans cette région, ou ne peuvent entraîner que des modèles à plus petite échelle dans un laps de temps raisonnable.

on pense actuellement qu'aws et microsoft possèdent les plus grands clusters de gpu cloud, mais « il existe certainement des différences entre les régions à cet égard ».cependant, le nombre de gpu et leur répartition dans la région du fournisseur sont considérés comme des informations hautement confidentielles par les fournisseurs de cloud hyperscale. aucun de nos fournisseurs d'informations n'était disposé ou capable de fournir des données spécifiques ou d'indiquer comment ces informations pourraient être obtenues publiquement. mais il est généralement admis que le nombre de gpu aux états-unis pourrait être beaucoup plus important que dans d’autres régions du monde dotées de gpu similaires. la région chinoise pourrait également disposer de davantage de puces v100 pour compenser ses performances relativement faibles. nos entretiens suggèrent que même si le nombre de gpu par région pouvait être inclus dans cette analyse, cela ne remettrait pas en cause les tendances dominantes décrites ci-dessus, mais les renforcerait plutôt.

pourquoi se concentrer sur les états-unis ?

qu’est-ce qui se cache derrière l’avance des états-unis en matière de cloud computing public avancé par rapport à la chine et à d’autres pays ? une explication évidente réside dans les contrôles à l'exportation du gouvernement américain, qui interdisent l'exportation de puces a100 et h100 vers la chine. les fournisseurs de cloud chinois pourront importer certaines puces a100 avant que les contrôles à l'exportation n'entrent en vigueur en 2023, mais le h100 est soumis à des contrôles à l'exportation depuis la sortie du produit. de même, les puces h800 et a800 ont été placées sous contrôle à l'exportation peu après leur lancement. le v100, bien moins puissant que ces puces, est le type d'instance de gpu nvidia le plus répandu en chine car il n'est pas soumis aux contrôles à l'exportation.

cependant, les contrôles à l’exportation ne peuvent pas expliquer pourquoi d’autres pays que la chine ont principalement déployé des gpu plus anciens. plusieurs explications sont possibles. une explication simple est la friction de la diffusion de l'innovation, qui fait référence au processus de diffusion des gpu sur le marché. les gpu les plus récents seront probablement installés d’abord aux états-unis, où nvidia possède le réseau de distribution le plus solide depuis son siège social aux états-unis. au fil du temps, les gpu avancés devraient progressivement se répandre sur des marchés relativement éloignés. "je suppose que presque tous les gpu étaient initialement destinés à la région nord-américaine, mais il devrait désormais y avoir un cluster important en europe également", a spéculé un informateur.

une autre explication possible de l'avance des états-unis en matière de cloud computing vient des différences géographiques dans la structure initiale de la demande, qui, combinées aux économies d'échelle, créent une sorte de « dépendance au chemin » qui maintient la concentration de l'informatique ia dans certaines zones géographiques. un informateur a expliqué :"il y a très peu d'acheteurs de cloud qui réalisent réellement un développement révolutionnaire de l'ia... il n'est donc pas nécessaire de répartir les capacités autour... vous avez besoin de quelques superclusters pour former une masse critique de puissance de calcul dans certains endroits, ce n'est pas nécessaire. pour reproduire cette capacité partout.

les premières entreprises et chercheurs à se concentrer sur la formation de modèles d’ia à grande échelle sont apparus aux états-unis, de sorte que les fournisseurs de cloud computing y ont concentré leur puissance de calcul de formation la plus puissante. mais même si la demande informatique augmente ailleurs dans le monde, cela ne se traduit pas nécessairement par une croissance correspondante de l'infrastructure informatique locale, car les développeurs peuvent souvent envoyer des tâches de formation dans les régions cloud des états-unis sans subir de pertes de performances significatives. ainsi, le leadership informatique initial des états-unis a été maintenu.

les informateurs estiment que la situation de la puissance de calcul utilisée pour déployer l’ia est différente. dans de nombreux cas d’utilisation de l’ia, comme les assistants vocaux, l’expérience utilisateur peut être affectée par la latence si la distance entre l’utilisateur et le serveur est trop grande. les coûts de transfert de données peuvent également devenir un problème commercial. par conséquent, il est préférable de déployer de telles applications sur une infrastructure informatique plus proche des utilisateurs. cela explique également pourquoi les puces v100, pas assez puissantes pour l'entraînement - mais néanmoins adaptées aux tâches d'inférence bien qu'elles soient plus lentes - sont réparties plus équitablement dans le monde que les puces plus avancées.

cependant, il existe quelques exceptions qui ne correspondent pas au modèle général selon lequel les états-unis disposent des gpu les plus avancés.le japon, le royaume-uni et la france disposent chacun du même nombre de zones de support a100 que de zones de support v100. chacun de ces pays a une activité locale importante de développement de l’ia.il peut exister des obstacles réglementaires ou politiques qui empêchent les développeurs locaux d'envoyer des données aux états-unis à des fins de formation. un informateur a noté : « actuellement, il existe des acteurs du secteur public ou des acteurs européens importants qui ont besoin de former des modèles de niveau gpt-4 avec des données qui ne peuvent pas quitter l'europe… si les fournisseurs de cloud hyperscale ne répondent pas à cette demande, je serais surpris. »

dans ce contexte, les informateurs ont mentionné des discussions politiques sur la « souveraineté numérique », la « souveraineté des données » et la « souveraineté informatique », qui pourraient créer un besoin accru de formation informatique locale. les pays-bas et l’irlande disposent également de gammes de gpu petites mais relativement avancées. cela peut être lié à la position stratégique de ces pays en tant que centres d’infrastructure pour certains fournisseurs de cloud hyperscale. notamment, les pays-bas sont le seul pays en dehors des états-unis à disposer d’une région cloud dotée de gpu h100.

distribution mondiale de l'informatique privée et gouvernementale

cette étude se concentre sur le cloud computing public, une source informatique importante mais pas unique. dans le domaine du cloud computing public, notre collecte de données se concentre sur les gpu de nvidia et sur six principaux fournisseurs de services cloud hyperscale.

la position relative des différents types de fournisseurs informatiques à grande échelle va-t-elle changer, remettant en question la géographie informatique actuellement observée ? les clusters gpu sont des biens d'équipement coûteux qui nécessitent une utilisation élevée pour obtenir un retour sur investissement raisonnable, ce qui explique pourquoi les clusters à grande échelle sont principalement construits comme une infrastructure partagée, qu'elle soit la propriété du gouvernement (comme le calcul intensif scientifique) ou, ces dernières années, du secteur privé (comme le cloud public). ). l’informatique publique semble faire un retour à petite échelle dans le monde entier sous la forme de l’initiative national ai computing. par exemple, le groupe de travail national ai resources (nair) aux états-unis vise à créer une infrastructure informatique publique pour « démocratiser la recherche sur l’ia ». cependant, dans de nombreux cas, l’ampleur des investissements gouvernementaux ne semble pas suffisante pour véritablement remettre en question cette domination. de fournisseurs de services cloud hyperscale. de nombreux efforts gouvernementaux récents ont également été menés en partenariat avec ces fournisseurs de cloud hyperscale, et en fait ces projets s'appuient sur une infrastructure privée.

le nouveau supercalculateur lumi du consortium européen pour le calcul haute performance constitue un contre-exemple.situé à kajaani, en finlande, lumi a été créé en coopération avec les gouvernements des états membres de l'ue et se compose d'un cluster de 11 912 gpu conçus par amd, le rival de nvidia. son ampleur pourrait en faire une alternative sérieuse à l’infrastructure de cloud computing privée « publique » pour l’infrastructure de développement de l’ia. compte tenu de sa situation géographique dans l’ue, il ne remet pas en question la fracture informatique nord-sud illustrée dans la figure 2. cependant, cela pourrait contribuer à briser l’image bipolaire des états-unis et de la chine en tant que seules superpuissances en matière d’ia.

de nouveaux clusters informatiques privés se développent également. le tpu de google pourrait représenter une part importante du calcul de l'ia. aws et microsoft prévoient tous deux de produire leurs propres puces. meta annonce un investissement massif dans le renforcement de la puissance informatique privée : le pdg mark zuckerberg affirme investir 340 000 unités nvidia h100 et a100 en 2023, microsoft affirme dépenser des centaines de millions de dollars pour alimenter le chatbot de clusters chatgpt d'openai. les grandes entreprises technologiques peuvent être en mesure de parvenir à une utilisation élevée des clusters à grande échelle en fonction uniquement de leurs besoins internes et de ceux de leurs partenaires. mais les clusters initialement déployés en tant que privés peuvent passer à une infrastructure cloud partagée à mesure que les besoins internes diminuent.cela brouille la distinction entre les capacités de cloud computing privées et publiques (comme les logements sociaux).

une lacune dans l’informatique de l’ia

gouverner l’ia par le calcul est une idée puissante, car le calcul consiste en une vaste infrastructure physique observable. ces infrastructures doivent être physiquement situées quelque part et sont donc susceptibles de relever de la compétence territoriale, qui est la forme de juridiction la plus exécutoire pour tous les états, grands et petits. cependant, les recherches montrent que les infrastructures informatiques ne sont pas réparties de manière égale dans le monde et que leur répartition géographique détermine en grande partie la probabilité que différents pays utilisent l’informatique comme point d’intervention pour l’ia.

la recherche fait revivre l'idée familière de deux superpuissances de l'ia engagées dans une « course aux armements » informatique, les états-unis ayant un avantage en termes de qualité des puces et la chine tentant de combler l'écart par la quantité.les restrictions américaines à l'exportation sur les gpu avancés semblent avoir joué un rôle, car aucun fournisseur de cloud public ne propose les puces h100 2023 en chine, ni les h800 ou a800, qui ont été développés pour contourner ces restrictions. de même, la russie et l’iran, deux pays soumis à des sanctions occidentales, ne disposent d’aucune installation publique de cloud computing pour l’ia dans notre échantillon.

cependant, outre la perspective d’une concurrence géopolitique entre grandes puissances, la recherche propose également d’autres catégories conceptuelles liées à la gouvernance de l’ia basée sur l’informatique. outre les états-unis et la chine, 15 autres pays disposent également des gpu les plus importants pour le développement de l’ia, à savoir l’a100 et le h100. ces pays de premier rang, à l’exception de l’inde, sont tous situés dans ce que l’on appelle le « nord global ». par analogie, appelons-les « calculer le nord ». ces pays du nord informatique peuvent utiliser leur juridiction territoriale pour intervenir dans le développement de l’ia, en particulier lorsque les modèles sont envoyés dans leurs régions locales de cloud public pour y être formés. par exemple, ils pourraient influencer les types de systèmes d’ia qui entrent sur les marchés mondiaux en exigeant que les algorithmes et les ensembles de données passent des audits et soient certifiés conformes aux règles locales avant que la formation puisse commencer.

le deuxième niveau comprend 13 pays dont la puissance de calcul est plus adaptée au déploiement de systèmes d’ia qu’à leur développement. à l’exception de la suisse, ces pays sont tous situés dans le sud global, d’où le terme « sud informatique ». par exemple, il existe cinq régions cloud prenant en charge le gpu en amérique latine, mais aucune d'entre elles ne dispose d'un gpu plus puissant que le v100 sorti en 2017. ces pays sont en mesure d’utiliser leur compétence territoriale en matière d’informatique pour contrôler quels systèmes d’ia peuvent être déployés localement, mais ont moins d’influence sur le développement des systèmes d’ia.

outre le « informatique du nord » et le « informatique du sud », il existe également un « désert informatique », un terme utilisé pour désigner tous les pays du monde qui ne disposent pas de cloud public d'informatique ia (que ce soit pour la formation ou le déploiement). ).pour ces pays, passer à des services d’ia basés sur le cloud signifie s’appuyer sur des infrastructures développées et déployées dans des juridictions étrangères. les déserts informatiques comprennent certains pays riches mais aussi tous les pays à revenu intermédiaire inférieur et à faible revenu classés par le fonds monétaire international (fmi). le calcul de l’impact sur les pays désertiques peut varier en fonction de leur richesse. les pays riches du désert pourraient être en mesure de tirer parti de leurs autres avantages – tels que l’influence diplomatique sur le nord informatique et une richesse suffisante pour construire une puissance de calcul appartenant au gouvernement – ​​pour compenser le désavantage de leur manque de cloud computing public local pour l’ia, mais les déserts informatiques les pays pauvres ont peu de chances d’influencer l’ia par le biais d’une gouvernance informatique.

semblable aux chercheurs observant une « fracture informatique » entre le monde universitaire et l’industrie, l’étude a également observé une fracture informatique mondiale, et la répartition géographique de l’informatique ia dans le cloud public semble reproduire des modèles familiers d’inégalité mondiale. à partir du milieu des années 1990, les discussions sur la numérisation ont proposé que l’entrée réussie dans la nouvelle « économie du savoir » mondiale repose sur des actifs immatériels tels que la connaissance et la créativité, plutôt que sur les actifs et ressources matériels requis dans l’ère économique industrielle. cela signifie que les pays en développement peuvent éviter des investissements coûteux dans les infrastructures et se lancer directement dans une économie basée sur la connaissance. cependant, le débat d’aujourd’hui sur l’ia a une fois de plus souligné le rôle essentiel des infrastructures physiques telles que les usines de puces, les centres de données et les réseaux électriques dans la compétitivité nationale. si l’informatique devient un nœud clé de gouvernance, alors ces infrastructures physiques pourraient également s’avérer cruciales pour maintenir des pouvoirs de régulation indépendants (lehdonvirta 2023). par conséquent, la puissance informatique d’un pays est également, dans une certaine mesure, assimilée à sa puissance politique.

est-ce que cela va changer ? si la concentration de l'informatique ia haut de gamme aux états-unis et dans le « nord informatique » est simplement due à des frictions dans la diffusion de l'innovation, alors, avec le temps, le monde pourrait progressivement être inondé de puissance de calcul, réduisant ainsi cet écart. les concurrents de nvidia, comme amd et intel, rattrapent leur retard en termes de performances des puces. les fabricants chinois développent également des puces de traitement d'ia et, en raison des contrôles américains sur les exportations, il existe une énorme demande intérieure. couplée au soutien du gouvernement, cet écart pourrait progressivement se creuser.

cependant, si les schémas géographiques observés s’expliquent davantage par une dépendance au sentier résultant des avantages du premier arrivé et des économies d’échelle, alors la concentration géographique, la spécialisation régionale et la division internationale du travail pourraient devenir des caractéristiques durables de la production informatique, comme c’est le cas dans de nombreux autres domaines. industries idem.

écris à la fin

qui a le plus de gpu ? la réponse à cette question semble prête, mais derrière cette question se cache essentiellement la répartition inégale de la puissance de calcul. comment améliorer le déséquilibre de la puissance de calcul et permettre à davantage de personnes vivant dans les déserts informatiques de profiter de la commodité apportée par l'ia sera probablement difficile à résoudre en peu de temps.