¿quién tiene más gpu?

2024-09-17

con el advenimiento de la era de la inteligencia artificial, la gpu se ha convertido en el centro de atención de todos.

sin embargo, si desea maximizar las funciones de inferencia y entrenamiento de ia de la gpu, también debe confiar en la potencia del centro de datos. un centro de datos de ia suele estar equipado con decenas de miles de gpu. podemos lograr cosas como un potente chatbot como chatgpt.

sin embargo, el precio de los centros de datos de ia no es bajo. el costo de construcción de miles de millones de dólares no solo es exclusivo de los gigantes tecnológicos, sino que también prohíbe a muchos países y regiones que no son fuertes.

a medida que se pueden hacer más y más cosas con inteligencia artificial, la importancia geopolítica de los chips de alta gama también aumenta día a día. cada vez más países y regiones compiten para acaparar chips, y algunos incluso han promulgado leyes para impedir que algunos países y. regiones adquieran los chips más avanzados.pero hasta ahora ha habido una sorprendente falta de datos públicos sobre la ubicación exacta de los chips de ia en todo el mundo.

el profesor vili lehdonvirta del instituto de internet de la universidad de oxford reveló una realidad que no se puede ignorar: las gpu están altamente concentradas en sólo 30 países y regiones de todo el mundo, de los cuales estados unidos y china están muy por delante, y la mayoría de las áreas están en llamado "desiertos informáticos": no hay ninguna gpu disponible para alquilar.

cómo investigar distribuciones

la cadena de suministro global de informática de ia se puede dividir aproximadamente en cuatro partes:

empresas que diseñan y venden gpu y otros chips relacionados con la ia

empresas que fabrican y envasan chips.

empresas que implementan chips para proporcionar potencia informática

empresas que gastan potencia informática para desarrollar o implementar sistemas de ia

el líder del mercado en diseño y ventas de gpu es nvidia, con sede en ee. uu., la fabricación de chips está dominada por taiwan semiconductor manufacturing co., ltd. (tsmc) de taiwán, y asml de los países bajos es actualmente la única empresa que produce máquinas de litografía que son esenciales para la fabricación. los chips de última generación son fundamentales (miller 2022). como resultado, estas partes de la cadena de suministro de informática están altamente concentradas tanto en términos de geografía como de propiedad.

este estudio se centra en el tercer paso de la cadena de suministro: en qué parte del mundo se implementan chips para proporcionar computación de ia para el desarrollo y la implementación de la ia, es decir, para entrenar modelos de ia y ejecutar inferencias sobre los modelos existentes. en términos generales, existen tres categorías de proveedores de computación a gran escala: instalaciones de supercomputación científica, clusters de computación privados y los llamados proveedores de computación en la nube pública.

las instalaciones de supercomputación científica existen desde principios de la década de 1960, normalmente están financiadas por los gobiernos y se utilizan principalmente con fines académicos y militares. un estudio de la ocde (2023) realizó un análisis geográfico simple de las instalaciones de supercomputación científica. según la base de datos top500, china tiene el mayor número de supercomputadoras, con un 32%, seguida de estados unidos con un 25% y la unión europea con un 21%; sin embargo, la mayoría de las supercomputadoras científicas no están diseñadas para el entrenamiento de modelos de ia (ocde 2023). la prosperidad actual del desarrollo de la ia generativa depende principalmente de los clústeres informáticos privados y la computación en la nube pública. estudios anteriores no han analizado en detalle su distribución geográfica.

los clústeres informáticos privados son propiedad de empresas con fines de lucro como meta, hp y muchas empresas más pequeñas. estos clústeres constan de computadoras conectadas a gpu implementadas en centros de datos. un clúster privado puede utilizarse para el desarrollo de la ia de la empresa o alquilarse a otras empresas. los proveedores públicos de computación en la nube también son empresas con fines de lucro. se les llama "públicos" no por algo que tenga que ver con el gobierno, sino porque sus servicios se brindan a pedido y son compartidos por múltiples clientes (es decir, similar al significado de "público" en una taberna, en lugar de departamento público "público") . los líderes en el mercado de la computación en la nube pública incluyen a aws, microsoft azure y google cloud; los proveedores chinos de nube pública, alibaba y tencent, también ofrecen computación de inteligencia artificial a gran escala. a estos grandes proveedores se les suele denominar "proveedores informáticos de hiperescala".

este estudio se centra principalmente en la distribución geográfica de la computación de ia en la nube pública. se han utilizado clústeres de computación privados para entrenar algunos modelos icónicos como meta's llama y llama 2. pero la formación y el desarrollo de un gran número de modelos de ia de vanguardia se concentran en los proveedores de nube pública de hiperescala google, microsoft y amazon, y sus "asociaciones informáticas" con empresas líderes en ia, como anthropic, cohere, google deepmind, hugging face, openai y stability ai. la nube pública también es importante porque está abierta a muchos tipos diferentes de desarrolladores, incluidos investigadores académicos. por lo tanto, nuestra principal pregunta de investigación es: ¿cuál es la distribución geográfica de la computación de ia en la nube pública en todo el mundo? también exploraremos las posibles razones de estas dispersiones geográficas, discutiremos sus implicaciones para la gobernanza informática y la geopolítica, y concluiremos con una breve discusión sobre los clústeres privados y la informática nacional de ia de propiedad gubernamental.

el censo del estudio cubre los seis mayores proveedores de nube pública a hiperescala: aws, microsoft, google, alibaba, huawei y tencent. si bien hay varios proveedores más pequeños, estos seis representan la mayor parte del mercado mundial de la nube pública y también lideran varios mercados regionales. en el momento del censo, la gpu más potente para entrenar modelos comunes de ia era la h100 de nvidia, lanzada en 2023, con el modelo insignia anterior, la a100, lanzada en 2020, y la v100 a principios de 2017. en 2023, nvidia presentó el h800 y el a800 para eludir las restricciones de exportación de estados unidos a china, pero esas restricciones se extendieron rápidamente a estos nuevos modelos. la recopilación de datos se centró en estos cinco tipos de gpu más relevantes para la ia.

a partir de la base de datos del censo, el estudio construyó un conjunto de datos a nivel de país para permitir el análisis geográfico.para cada país, calculó el número total de regiones de nube pública dentro de su territorio, también calculó el subconjunto de regiones que admiten al menos un tipo de gpu ("regiones habilitadas para gpu") y el subconjunto de regiones que admiten una gpu específica. tipo.

para complementar los datos del censo de la nube, el estudio realizó entrevistas cualitativas y semiestructuradas a expertos. entrevistamos a un total de 10 informantes, que representan a dos expertos en políticas, tres expertos en proveedores de nube pública de hiperescala y cinco expertos en investigación con experiencia en informática de ia. estos informantes fueron reclutados mediante muestreo en bola de nieve a través de nuestra propia red profesional. los objetivos principales de estas entrevistas son mejorar y validar la metodología del censo, generar información complementaria o alternativa sobre la distribución geográfica de la computación de ia en la nube pública y ayudar a explicar los patrones geográficos observados.

¿dónde están las gpu con ia?

la figura 1 muestra la ubicación aproximada de las áreas de nubes públicas encontradas en el censo. la tabla 4 muestra cuántas regiones de nube hay en cada país y cuántas de estas regiones ofrecen instancias de gpu. desde una perspectiva de gobernanza informática, una de las características más importantes de los datos es que la gran mayoría de los países del mundo no tienen ninguna región de nube pública. de los 39 países con una o más regiones de nube, 30 tienen regiones de nube que admiten gpu.

otra característica sorprendente es que incluso dentro de aquellos países con regiones de nube habilitadas para gpu, la distribución geográfica de las regiones está muy polarizada:china y estados unidos juntos tienen casi tantas regiones (49) como el resto del mundo combinado (52). de los dos, el número total de regiones compatibles con gpu en china es ligeramente superior (27) al de estados unidos (22).

se pueden realizar análisis más detallados examinando los tipos de instancias de gpu que se ofrecen en cada país. el patrón más obvio es que estados unidos tiene las gpu más nuevas y potentes del mundo, no sólo en la proporción de diferentes tipos de instancias disponibles, sino también en números. estados unidos es el único país donde la gpu nvidia a100 2020 está disponible en más regiones que la gpu v100 2017. estados unidos también tiene varias regiones que ofrecen la gpu nvidia h100 2023. las regiones de la nube en china se basan principalmente en v100 y algunas regiones proporcionan instancias a100. h100 no está disponible en ninguna región de china. sólo 15 países en el resto del mundo ofrecen el a100, sólo un país ofrece el h100 y las regiones restantes se basan exclusivamente en el v100.

este análisis no tiene en cuenta los chips de aceleración personalizados (como los tpu), ni tiene en cuenta las diferencias en la cantidad de gpu disponibles en diferentes regiones. los informantes entrevistados señalaron que la cantidad de gpu del mismo tipo disponibles en diferentes regiones puede variar significativamente entre regiones y proveedores. un informante señaló: "los proveedores de servicios en la nube a hiperescala casi dan la impresión de ser omnipotentes en términos de computación o almacenamiento y parecen ser capaces de manejar cualquier problema que se les plantee. pero esa no es del todo la realidad". la cantidad de gpu disponibles en una región puede ser muy limitada, lo que da como resultado que solo una cantidad limitada de clientes pueda ejecutar instancias de gpu en esa región, o que solo pueda entrenar modelos de menor escala en un período de tiempo razonable.

actualmente se cree que aws y microsoft tienen los grupos de gpu en la nube más grandes, pero "definitivamente existen diferencias entre regiones a este respecto".sin embargo, los proveedores de nube a hiperescala consideran que la cantidad de gpu y su distribución dentro de la región del proveedor son información altamente confidencial. ninguno de nuestros proveedores de información quiso o pudo proporcionar datos específicos o indicar cómo esta información podría obtenerse públicamente. pero en general se cree que la cantidad de gpu en los estados unidos puede ser mucho mayor que la de otras regiones del mundo con gpu similares. la región china también puede tener más chips v100 para compensar su rendimiento relativamente bajo. nuestras entrevistas sugieren que incluso si el número de gpu por región pudiera incluirse en este análisis, esto podría no cuestionar los patrones dominantes descritos anteriormente, sino más bien reforzarlos.

¿por qué centrarse en estados unidos?

¿qué hay detrás del liderazgo de estados unidos en computación avanzada de ia en la nube pública en comparación con china y otros países? una explicación obvia son los controles de exportación del gobierno estadounidense, que prohíben la exportación de chips a100 y h100 a china. los proveedores de nube chinos podrán importar algunos chips a100 antes de que los controles de exportación entren en vigor en 2023, pero el h100 ha estado sujeto a controles de exportación desde que se lanzó el producto. asimismo, los chips h800 y a800 fueron sometidos a controles de exportación poco después de su lanzamiento. el v100, que es mucho menos potente que estos chips, es el tipo de instancia de gpu de nvidia más común en china porque no está sujeto a controles de exportación.

sin embargo, los controles de exportación no pueden explicar por qué otros países, además de china, han implementado principalmente gpu más antiguas. son posibles varias explicaciones. una explicación simple es la fricción de la difusión de la innovación, que se refiere al proceso de difusión de gpu en el mercado. es probable que las gpu más nuevas se instalen primero en estados unidos, donde nvidia tiene la red de distribución más sólida desde que tiene su sede en estados unidos. con el tiempo, las gpu avanzadas deberían extenderse gradualmente a mercados relativamente distantes. "supongo que casi todas las gpu se dirigieron inicialmente a la región de américa del norte, pero ahora también debería haber un grupo considerable en europa", especuló un informante.

otra posible explicación del liderazgo de la computación en la nube de estados unidos proviene de las diferencias geográficas en la estructura de la demanda inicial, que combinadas con las economías de escala crean una especie de "dependencia de la ruta" que mantiene la concentración de la computación con ia en ciertas áreas geográficas. un informante explicó:"hay muy pocos compradores de nube que realmente estén realizando un desarrollo innovador de ia... por lo que no hay necesidad de distribuir las capacidades... se necesitan algunos superclusters para formar una masa crítica de potencia informática en ciertas ubicaciones, no hay necesidad replicar esta capacidad en todas partes”.

las primeras empresas e investigadores que se centraron en el entrenamiento de modelos de ia a gran escala surgieron en los estados unidos, por lo que los proveedores de la nube concentraron allí su potencia informática de entrenamiento más poderosa. pero incluso cuando la demanda de informática aumenta en otras partes del mundo, eso no se traduce necesariamente en un crecimiento correspondiente en la infraestructura informática local, ya que los desarrolladores a menudo pueden enviar tareas de capacitación a regiones de la nube en los ee. uu. sin sufrir pérdidas significativas de rendimiento. de esta manera, se mantuvo el liderazgo informático inicial de estados unidos.

los informantes creen que la situación con la potencia informática utilizada para implementar la ia es diferente. en muchos casos de uso de ia, como los asistentes de voz, la experiencia del usuario puede verse afectada por la latencia si la distancia entre el usuario y el servidor es demasiado grande. los costos de transferencia de datos también pueden convertirse en un problema comercial. por lo tanto, estas aplicaciones se implementan mejor en una infraestructura informática más cercana a los usuarios. esto también explica por qué los chips v100, que no son lo suficientemente potentes para el entrenamiento, pero aún así son adecuados para tareas de inferencia a pesar de ser más lentos, están distribuidos de manera más uniforme en todo el mundo que los chips más avanzados.

sin embargo, hay algunas excepciones que no se ajustan al patrón general de que estados unidos tiene las gpu más avanzadas.japón, el reino unido y francia tienen cada uno el mismo número de áreas de soporte a100 que áreas de soporte v100. cada uno de estos países tiene una importante actividad local de desarrollo de ia.puede haber barreras regulatorias o políticas que impidan a los desarrolladores locales enviar datos a los estados unidos para recibir capacitación. un informante señaló: "actualmente, hay actores europeos importantes o del sector público que necesitan entrenar modelos de nivel gpt-4 con datos que no pueden salir de europa... si los proveedores de nube a hiperescala no responden a esta demanda, me sorprendería".

en este contexto, los informantes mencionaron discusiones políticas sobre “soberanía digital”, “soberanía de datos” y “soberanía computacional”, que podrían crear una mayor necesidad de capacitación informática local. los países bajos e irlanda también tienen líneas de gpu pequeñas pero relativamente avanzadas. esto puede estar relacionado con la posición estratégica de estos países como centros de infraestructura para algunos proveedores de nube a hiperescala. en particular, los países bajos son el único país fuera de los estados unidos que tiene una región de nube con gpu h100.

distribución global de informática privada y gubernamental.

este estudio se centra en la computación en la nube pública, una fuente importante, pero no la única, de informática. en computación en la nube pública, nuestra recopilación de datos se centra en las gpu de nvidia y en seis proveedores líderes de servicios en la nube a hiperescala.

¿cambiará la posición relativa de los diferentes tipos de proveedores de informática a gran escala, desafiando la geografía de la informática observada actualmente? los clústeres de gpu son bienes de capital costosos que requieren una alta utilización para lograr un retorno de la inversión razonable, lo que explica por qué los clústeres a gran escala se construyen principalmente como infraestructura compartida, ya sea de propiedad gubernamental (como la supercomputación científica) o, en los últimos años, privada (como la nube pública). ). la informática de propiedad gubernamental parece estar regresando a pequeña escala en todo el mundo en la forma de la iniciativa nacional de computación con ia. por ejemplo, el grupo de trabajo de recursos nacionales de ia (nair) en estados unidos tiene como objetivo crear una infraestructura informática pública para "democratizar la investigación en ia". sin embargo, en muchos casos la escala de la inversión gubernamental no parece ser suficiente para desafiar verdaderamente el dominio. estado de los proveedores de servicios de nube de hiperescala. muchos esfuerzos gubernamentales recientes también se han llevado a cabo en asociación con estos proveedores de servicios de nube de hiperescala y, de hecho, estos proyectos dependen de infraestructura privada.

el nuevo superordenador lumi del consorcio europeo de computación de alto rendimiento proporciona un contraejemplo.ubicada en kajaani, finlandia, lumi se estableció en cooperación con los gobiernos de los estados miembros de la ue y consta de un grupo de 11.912 gpu diseñadas por amd, el rival de nvidia. su escala podría convertirla en una alternativa seria a la infraestructura de computación en la nube privada “pública” para la infraestructura de desarrollo de ia. dada su ubicación en la ue, no cuestiona la división informática norte-sur que se muestra en la figura 2. sin embargo, podría ayudar a romper la imagen bipolar de estados unidos y china como las únicas superpotencias de la ia.

también están creciendo nuevos grupos informáticos privados. la tpu de google puede representar una proporción significativa de la informática de ia. tanto aws como microsoft planean producir sus propios chips. meta anuncia una inversión masiva en la creación de potencia informática privada: el director ejecutivo mark zuckerberg afirma invertir 340.000 unidades nvidia h100 y a100 en 2023, microsoft afirma gastar cientos de millones de dólares para impulsar el chatbot de clústeres chatgpt de openai. las grandes empresas de tecnología pueden lograr una alta utilización de clusters de gran escala basándose únicamente en sus necesidades internas y de socios. pero los clústeres inicialmente implementados como privados pueden pasar a una infraestructura de nube compartida a medida que disminuyan las necesidades internas.esto desdibuja la distinción entre las capacidades de computación en la nube privadas y públicas (como la vivienda pública).

una brecha en la informática de ia

gobernar la ia a través de la computación es una idea poderosa porque la computación consiste en una infraestructura física grande y observable. estas infraestructuras deben estar físicamente ubicadas en algún lugar y, por lo tanto, son susceptibles de jurisdicción territorial, que es la forma de jurisdicción más aplicable para todos los estados, grandes y pequeños. sin embargo, las investigaciones muestran que la infraestructura informática no está distribuida uniformemente en todo el mundo, y su distribución geográfica determina en gran medida la probabilidad de que diferentes países utilicen la informática como punto de intervención para la ia.

la investigación revive la idea familiar de dos superpotencias de ia atrapadas en una "carrera armamentista" informática, en la que estados unidos tiene una ventaja en la calidad de los chips y china intenta cerrar la brecha a través de la cantidad.las restricciones estadounidenses a la exportación de gpu avanzadas parecen haber influido, ya que ningún proveedor de nube pública ofrece los chips h100 2023 en china, ni el h800 o el a800, que fueron desarrollados para eludir estas restricciones. del mismo modo, rusia e irán, dos países sujetos a sanciones occidentales, no tienen ninguna instalación de computación de ia en la nube pública en nuestra muestra.

sin embargo, además de la perspectiva de la competencia geopolítica entre grandes potencias, la investigación también propone otras categorías conceptuales relacionadas con la gobernanza de la ia basada en la computación. además de estados unidos y china, otros 15 países también tienen gpu que son más importantes para el desarrollo de la ia, a saber, a100 y h100. estos países de primer nivel, con excepción de india, están todos ubicados en el llamado “norte global”. por analogía, llámelos "calculando el norte". estos países del norte informático pueden utilizar su jurisdicción territorial para intervenir en el desarrollo de la ia, especialmente cuando los modelos se envían a sus regiones locales de nube pública para su capacitación. por ejemplo, podrían influir en los tipos de sistemas de ia que ingresan a los mercados globales al exigir que los algoritmos y conjuntos de datos pasen auditorías y estén certificados como conformes con las normas locales antes de que pueda comenzar la capacitación.

el segundo nivel incluye 13 países cuya potencia informática es más adecuada para el despliegue de sistemas de ia que para su desarrollo. con la excepción de suiza, todos estos países están ubicados en el sur global, de ahí el término "sur computacional". por ejemplo, hay cinco regiones de nube compatibles con gpu en américa latina, pero ninguna de ellas cuenta con una gpu más potente que la v100 lanzada en 2017. estos países pueden utilizar su jurisdicción territorial sobre la informática para controlar qué sistemas de ia se pueden implementar localmente, pero tienen menos influencia en el desarrollo de los sistemas de ia.

además del "norte de la computación" y el "sur de la computación", también existe un "desierto de la computación", término utilizado para referirse a todos los países del mundo que no tienen ninguna computación de ia en la nube pública (ya sea para capacitación o implementación). ).para estos países, pasar a servicios de ia basados en la nube significa depender de infraestructura desarrollada e implementada en jurisdicciones extranjeras. los desiertos computacionales incluyen algunos países ricos, pero también todos los países de ingresos bajos y medianos bajos clasificados por el fondo monetario internacional (fmi). el cálculo del impacto en los países desérticos puede variar según su riqueza. los países ricos en el desierto pueden aprovechar sus otras ventajas (como la influencia diplomática sobre el norte informático y la riqueza suficiente para construir poder informático de propiedad gubernamental) para compensar la desventaja de su falta de computación local de inteligencia artificial en la nube pública, pero la informática deserta. los países pobres tienen pocas perspectivas de influir en la ia a través de la gobernanza computacional.

al igual que los investigadores observaron una "división informática" entre la academia y la industria, el estudio también observó una división informática global, y la distribución geográfica de la computación con ia en la nube pública parece estar reproduciendo patrones familiares de desigualdad global. a partir de mediados de la década de 1990, los debates sobre la digitalización propusieron que la entrada exitosa a la nueva "economía del conocimiento" global se basaría en activos inmateriales como el conocimiento y la creatividad, en lugar de depender de los activos y recursos materiales necesarios en la era económica industrial. esto significa que los países en desarrollo pueden evitar costosas inversiones en infraestructura y saltar directamente a una economía basada en el conocimiento. sin embargo, el debate de hoy sobre la ia destacó una vez más el papel fundamental de la infraestructura física, como las fábricas de chips, los centros de datos y las redes eléctricas, en la competitividad nacional. si la informática se convierte en un nodo clave de gobernanza, entonces estas infraestructuras físicas también pueden resultar cruciales para mantener poderes regulatorios independientes (lehdonvirta 2023). por lo tanto, el poder informático de un país también se equipara hasta cierto punto con su poder político.

¿esto cambiará? si la concentración de la informática de ia de alta gama en estados unidos y el "norte de la computación" se debe simplemente a la fricción en la difusión de la innovación, entonces, con el tiempo, el mundo podría verse inundado gradualmente de potencia informática, reduciendo esta brecha. los rivales de nvidia, como amd e intel, se están poniendo al día en términos de rendimiento de los chips. los fabricantes chinos también están desarrollando chips de procesamiento de ia y, debido a los controles de exportación de estados unidos, existe una enorme demanda interna de ellos, junto con el apoyo gubernamental, esta brecha puede ampliarse gradualmente.

sin embargo, si los patrones geográficos observados se explican más por la dependencia de la trayectoria resultante de las ventajas del primero en actuar y de las economías de escala, entonces la concentración geográfica, la especialización regional y la división internacional del trabajo pueden convertirse en características duraderas de la producción informática, como lo son en muchos otros países. industrias lo mismo.

escribe al final

¿quién tiene más gpu? la respuesta a esta pregunta parece estar lista, pero detrás de esta pregunta se esconde esencialmente la distribución desigual de la potencia informática. probablemente será difícil resolver en poco tiempo cómo mejorar el desequilibrio de la potencia informática y permitir que más personas en los desiertos informáticos disfruten de la comodidad que ofrece la ia.

noticias

¿quién tiene más gpu?

introducción

mi información de contacto