notícias

quem tem mais gpus?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

com o advento da era da inteligência artificial, a gpu se tornou o foco da atenção de todos.

no entanto, se você deseja maximizar as funções de treinamento e inferência de ia da gpu, também deve contar com o poder do data center. um data center de ia geralmente é equipado com dezenas de milhares de gpus. podemos conseguir coisas como chatbot poderoso como chatgpt.

no entanto, o preço dos data centers de ia não é baixo. o custo de construção de bilhões de dólares não é apenas exclusivo dos gigantes da tecnologia, mas também proíbe muitos países e regiões que não são fortes.

à medida que mais e mais coisas podem ser feitas com inteligência artificial, a importância geopolítica dos chips de última geração também aumenta a cada dia. mais e mais países e regiões estão competindo para acumular chips, e alguns até promulgaram leis para impedir alguns países e regiões. regiões de comprar os chips mais avançados,mas até agora, tem havido uma surpreendente falta de dados públicos sobre a localização exata dos chips de ia em todo o mundo.

o professor vili lehdonvirta, do internet institute da universidade de oxford, revelou uma realidade que não pode ser ignorada: as gpus estão altamente concentradas em apenas 30 países e regiões ao redor do mundo, dos quais os estados unidos e a china estão muito à frente, e a maioria das áreas estão em tal situação. chamados de "desertos de computação": não há gpus disponíveis para aluguel.

como investigar distribuições

a cadeia global de fornecimento de computação de ia pode ser dividida em quatro partes:

empresas que projetam e vendem gpus e outros chips relacionados à ia

empresas que fabricam e embalam chips

empresas implantando chips para fornecer poder computacional

empresas que gastam poder computacional para desenvolver ou implantar sistemas de ia

a líder de mercado em design e vendas de gpu é a nvidia, com sede nos eua, a fabricação de chips é dominada pela taiwan semiconductor manufacturing co., ltd. (tsmc), e a asml da holanda é atualmente a única empresa que produz máquinas de litografia essenciais para a fabricação. chips de última geração são essenciais (miller 2022). como resultado, estas partes da cadeia de fornecimento de computação estão altamente concentradas tanto em termos geográficos como de propriedade.

este estudo centra-se na terceira etapa da cadeia de abastecimento: onde no mundo os chips são implantados para fornecer computação de ia para o desenvolvimento e implantação de ia, ou seja, para treinar modelos de ia e executar inferências em modelos existentes. em termos gerais, existem três categorias de fornecedores de computação em grande escala: instalações de supercomputação científica, clusters de computação privados e os chamados fornecedores de computação em nuvem pública.

as instalações de supercomputação científica existem desde o início da década de 1960, são normalmente financiadas pelos governos e são utilizadas principalmente para fins acadêmicos e militares. um estudo da ocde (2023) conduziu uma análise geográfica simples de instalações científicas de supercomputação. de acordo com a base de dados top500, a china tem o maior número de supercomputadores, representando 32%, seguida pelos estados unidos, representando 25% e pela união europeia, representando 21%; no entanto, a maioria dos supercomputadores científicos não são concebidos para formação de modelos de ia (ocde 2023). a atual prosperidade do desenvolvimento da ia ​​generativa depende principalmente de clusters de computação privados e da computação em nuvem pública. estudos anteriores não analisaram detalhadamente sua distribuição geográfica.

os clusters de computação privados pertencem a empresas com fins lucrativos, como meta, hp e muitas empresas menores. esses clusters consistem em computadores conectados por gpu implantados em data centers. um cluster privado pode ser usado para o desenvolvimento de ia da empresa ou alugado para outras empresas. os provedores de computação em nuvem pública também são empresas com fins lucrativos. eles são chamados de "públicos" não por terem algo a ver com o governo, mas porque seus serviços são fornecidos sob demanda e compartilhados por vários clientes (ou seja, semelhante ao significado de "público" em uma taverna, em vez de departamento público "público") . os líderes no mercado de computação em nuvem pública incluem aws, microsoft azure e google cloud; os provedores chineses de nuvem pública alibaba e tencent também fornecem computação de ia em grande escala. esses grandes provedores são frequentemente chamados de “provedores de computação em hiperescala”.

este estudo concentra-se principalmente na distribuição geográfica da computação de ia em nuvem pública. clusters de computação privados têm sido usados ​​para treinar alguns modelos icônicos, como meta’s llama e llama 2. mas o treinamento e o desenvolvimento de um grande número de modelos de ia de ponta estão concentrados nos provedores de hiperescala de nuvem pública google, microsoft e amazon, e em suas “parcerias computacionais” com empresas líderes de ia, como anthropic, cohere, google deepmind, hugging face, openai e ia de estabilidade. a nuvem pública também é importante porque está aberta a muitos tipos diferentes de desenvolvedores, incluindo pesquisadores acadêmicos. portanto, nossa principal questão de pesquisa é: qual é a distribuição geográfica da computação de ia em nuvem pública em todo o mundo? exploraremos também as possíveis razões para estas dispersões geográficas, discutiremos as suas implicações para a governação da computação e a geopolítica e concluiremos com uma breve discussão sobre clusters privados e computação nacional de ia de propriedade governamental.

o censo do estudo abrange os seis maiores provedores de nuvem pública em hiperescala: aws, microsoft, google, alibaba, huawei e tencent. embora existam vários fornecedores mais pequenos, estes seis representam a maior parte do mercado global de nuvens públicas e também lideram em vários mercados regionais. na época do censo, a gpu mais poderosa para treinar modelos comuns de ia era o h100 da nvidia, lançado em 2023, com o modelo carro-chefe anterior, o a100, lançado em 2020, e o v100 no início de 2017. em 2023, a nvidia introduziu o h800 e o a800 para contornar as restrições de exportação dos eua para a china, mas essas restrições foram rapidamente estendidas a estes novos modelos. a coleta de dados focou nesses cinco tipos de gpu mais relevantes para ia.

a partir da base de dados do censo, o estudo construiu um conjunto de dados a nível nacional para permitir a análise geográfica.para cada país, calculou o número total de regiões de nuvem pública em seu território, calculou também o subconjunto de regiões que suportam pelo menos um tipo de gpu ("regiões habilitadas para gpu") e o subconjunto de regiões que suportam uma gpu específica. tipo.

para complementar os dados do censo na nuvem, o estudo conduziu entrevistas qualitativas e semiestruturadas com especialistas. entrevistamos um total de 10 informantes, representando dois especialistas em políticas, três especialistas em provedores de nuvem pública de hiperescala e cinco especialistas em pesquisa com experiência em computação de ia. esses informantes foram recrutados por meio de amostragem em bola de neve por meio de nossa própria rede profissional. os principais objetivos destas entrevistas são melhorar e validar a metodologia do censo, gerar informações complementares ou alternativas sobre a distribuição geográfica da computação de ia em nuvem pública e ajudar a explicar os padrões geográficos observados.

onde estão as gpus de ia?

a figura 1 mostra a localização aproximada das áreas de nuvem pública encontradas no censo. a tabela 4 mostra quantas regiões de nuvem existem em cada país e quantas dessas regiões oferecem instâncias de gpu. do ponto de vista da governança da computação, uma das características mais importantes dos dados é que a grande maioria dos países do mundo não possui nenhuma região de nuvem pública. dos 39 países com uma ou mais regiões de nuvem, 30 possuem regiões de nuvem que suportam gpus.

outra característica marcante é que mesmo nos países com regiões de nuvem habilitadas para gpu, a distribuição geográfica das regiões é altamente polarizada:a china e os estados unidos juntos têm quase tantas regiões (49) como o resto do mundo combinado (52). dos dois, o número total de regiões de suporte de gpu na china é ligeiramente superior (27) ao dos estados unidos (22).

uma análise mais aprofundada pode ser realizada examinando os tipos de instâncias de gpu oferecidas em cada país. o padrão mais óbvio é que os estados unidos possuem as gpus mais novas e poderosas do mundo, não apenas na proporção de diferentes tipos de instâncias disponíveis, mas também em grande número. os estados unidos são o único país onde a gpu nvidia a100 2020 está disponível em mais regiões do que a gpu v100 2017. os eua também têm várias regiões que oferecem a gpu nvidia h100 2023. as regiões de nuvem na china são baseadas principalmente em v100, e algumas regiões fornecem instâncias a100. o h100 não está disponível em nenhuma região da china. apenas 15 países no resto do mundo oferecem o a100, apenas um país oferece o h100 e as restantes regiões são puramente baseadas no v100.

esta análise não leva em consideração chips de aceleração personalizados (como tpus), nem leva em conta diferenças no número de gpus disponíveis em diferentes regiões. os informantes entrevistados observaram que o número de gpus do mesmo tipo disponíveis em diferentes regiões pode variar significativamente entre regiões e fornecedores. um informante observou: “os provedores de serviços de nuvem em hiperescala quase dão a impressão de serem onipotentes em termos de computação ou armazenamento e parecem ser capazes de lidar com qualquer problema que você lhes apresente. o número de gpus disponíveis em uma região pode ser muito limitado, resultando em apenas um número limitado de clientes capazes de executar instâncias de gpu naquela região ou apenas capazes de treinar modelos de menor escala em um período de tempo razoável.

atualmente, acredita-se que aws e microsoft tenham os maiores clusters de gpu em nuvem, mas “há definitivamente diferenças entre as regiões a esse respeito”.no entanto, o número de gpus e a sua distribuição dentro da região do fornecedor são consideradas informações altamente confidenciais pelos fornecedores de nuvem de hiperescala. nenhum dos nossos fornecedores de informações estava disposto ou era capaz de fornecer dados específicos ou indicar como essas informações poderiam ser obtidas publicamente. mas geralmente acredita-se que o número de gpus nos estados unidos pode ser muito maior do que em outras regiões do mundo com gpus semelhantes. a região chinesa também pode ter mais chips v100 para compensar o seu desempenho relativamente baixo. as nossas entrevistas sugerem que mesmo que o número de gpus por região pudesse ser incluído nesta análise, isso poderia não desafiar os padrões dominantes descritos acima, mas sim reforçá-los.

por que focar nos estados unidos?

o que está por trás da liderança dos eua na computação avançada de ia em nuvem pública em comparação com a china e outros países? uma explicação óbvia são os controles de exportação do governo dos eua, que proíbem a exportação de chips a100 e h100 para a china. os provedores de nuvem chineses poderão importar alguns chips a100 antes que os controles de exportação entrem em vigor em 2023, mas o h100 está sujeito a controles de exportação desde que o produto foi lançado. da mesma forma, os chips h800 e a800 foram colocados sob controle de exportação logo após o seu lançamento. o v100, que é muito menos poderoso que esses chips, é o tipo de instância de gpu nvidia mais comum na china porque não está sujeito a controles de exportação.

no entanto, os controlos de exportação não podem explicar porque é que outros países, além da china, implementaram principalmente gpus mais antigas. várias explicações são possíveis. uma explicação simples é o atrito da difusão da inovação, que se refere ao processo de difusão da gpu no mercado. é provável que as gpus mais novas sejam instaladas primeiro nos estados unidos, onde a nvidia tem a rede de distribuição mais forte desde que está sediada nos estados unidos. com o tempo, as gpus avançadas deverão se espalhar gradualmente para mercados relativamente distantes. “eu presumiria que quase todas as gpus foram inicialmente para a região da américa do norte, mas agora também deve haver um cluster considerável na europa”, especulou um informante.

outra explicação potencial para a liderança da computação em nuvem nos eua vem das diferenças geográficas na estrutura inicial da demanda, que combinadas com economias de escala criam uma espécie de “dependência de trajetória” que mantém a concentração da computação de ia em certas áreas geográficas. um informante explicou:"existem muito poucos compradores de nuvem que estão realmente desenvolvendo ia inovadora... então não há necessidade de espalhar os recursos... você precisa de alguns superclusters para formar uma massa crítica de poder de computação em determinados locais, não há necessidade para replicar essa capacidade em todos os lugares.”

as primeiras empresas e pesquisadores a se concentrarem no treinamento de modelos de ia em larga escala surgiram nos estados unidos, de modo que os provedores de nuvem concentraram ali seu poder computacional de treinamento mais poderoso. mas mesmo que a procura por computação aumente noutras partes do mundo, isso não se traduz necessariamente num crescimento correspondente na infraestrutura de computação local, uma vez que os programadores podem muitas vezes enviar tarefas de formação para regiões de nuvem nos eua sem sofrer perdas significativas de desempenho. assim, a liderança inicial da computação dos estados unidos foi sustentada.

os informantes acreditam que a situação com o poder computacional usado para implantar ia é diferente. em muitos casos de uso de ia, como assistentes de voz, a experiência do usuário pode ser afetada pela latência se a distância entre o usuário e o servidor for muito grande. os custos de transferência de dados também podem se tornar um problema comercial. portanto, tais aplicações são melhor implantadas em infraestruturas de computação mais próximas dos usuários. isso também explica por que os chips v100, que não são poderosos o suficiente para treinamento – mas ainda assim adequados para tarefas de inferência, apesar de serem mais lentos – são distribuídos de maneira mais uniforme pelo mundo do que chips mais avançados.

no entanto, existem algumas exceções que não se enquadram no padrão geral de os eua terem as gpus mais avançadas.o japão, o reino unido e a frança têm, cada um, o mesmo número de áreas de suporte a100 que áreas de suporte v100. cada um destes países tem uma atividade local significativa de desenvolvimento de ia.pode haver barreiras regulatórias ou políticas que impeçam os desenvolvedores locais de enviar dados aos estados unidos para treinamento. um informante observou: “atualmente, há setores públicos ou atores europeus importantes que precisam treinar modelos de nível gpt-4 com dados que não podem sair da europa…se os provedores de nuvem em hiperescala não responderem a esta demanda, eu ficaria surpreso”.

neste contexto, os informadores mencionaram discussões políticas sobre “soberania digital”, “soberania de dados” e “soberania computacional”, o que poderia criar uma necessidade crescente de formação local em informática. a holanda e a irlanda também têm linhas de gpu pequenas, mas relativamente avançadas. isto pode estar relacionado com a posição estratégica destes países como centros de infraestrutura para alguns fornecedores de nuvem de hiperescala. notavelmente, a holanda é o único país fora dos estados unidos que tem uma região de nuvem com gpus h100.

distribuição global de computação privada e governamental

este estudo se concentra na computação em nuvem pública, uma fonte importante, mas não a única, de computação. na computação em nuvem pública, nossa coleta de dados se concentra nas gpus da nvidia e em seis provedores líderes de serviços em nuvem em hiperescala.

será que a posição relativa dos diferentes tipos de fornecedores de computação em grande escala mudará, desafiando a geografia da computação atualmente observada? os clusters de gpu são bens de capital caros que exigem alta utilização para atingir um roi razoável, o que explica por que os clusters de grande escala são construídos principalmente como infraestrutura compartilhada, seja de propriedade do governo (como a supercomputação científica) ou, nos últimos anos, privada (como a nuvem pública). ). a computação estatal parece estar a regressar em pequena escala em todo o mundo sob a forma da iniciativa national ai computing. por exemplo, o grupo de trabalho dos recursos nacionais de ia (nair) nos estados unidos pretende criar infra-estruturas de computação pública para “democratizar a investigação em ia. no entanto, em muitos casos, a escala do investimento governamental não parece ser suficiente para desafiar verdadeiramente o domínio”. de provedores de serviços de nuvem em hiperescala status muitos esforços recentes do governo também foram conduzidos em parceria com esses provedores de nuvem em hiperescala e, na verdade, esses projetos dependem de infraestrutura privada.

o novo supercomputador lumi do consórcio europeu de computação de alto desempenho fornece um contraexemplo.localizada em kajaani, finlândia, a lumi foi criada em cooperação com os governos dos estados membros da ue e consiste em um cluster de 11.912 gpus projetadas pela amd, rival da nvidia. a sua escala poderia torná-la uma alternativa séria à infraestrutura de computação em nuvem “pública” privada para infraestrutura de desenvolvimento de ia. dada a sua localização na ue, não desafia a divisão computacional norte-sul mostrada na figura 2. no entanto, poderia ajudar a quebrar a imagem bipolar dos estados unidos e da china como as únicas superpotências da ia.

novos clusters de computação privada também estão a crescer. a tpu do google pode ser responsável por uma proporção significativa da computação de ia. aws e microsoft planejam produzir seus próprios chips. meta anuncia investimento maciço na construção de poder de computação privado: o ceo mark zuckerberg afirma investir 340.000 unidades nvidia h100 e a100 em 2023, a microsoft afirma gastar centenas de milhões de dólares para alimentar o chatbot de clusters chatgpt da openai. as grandes empresas tecnológicas poderão conseguir uma elevada utilização de clusters de grande escala com base apenas nas suas necessidades internas e dos parceiros. mas os clusters inicialmente implantados como privados podem migrar para uma infraestrutura de nuvem compartilhada à medida que as necessidades internas diminuem.isto confunde a distinção entre capacidades de computação em nuvem privadas e públicas (como habitações públicas).

uma lacuna na computação de ia

governar a ia através da computação é uma ideia poderosa porque a computação consiste em uma infraestrutura física grande e observável. estas infra-estruturas devem estar fisicamente localizadas em algum lugar e são, portanto, susceptíveis de jurisdição territorial, que é a forma de jurisdição mais aplicável para todos os estados, grandes e pequenos. no entanto, a investigação mostra que a infraestrutura informática não está distribuída uniformemente por todo o mundo e a sua distribuição geográfica determina em grande parte a probabilidade de diferentes países utilizarem a computação como ponto de intervenção para a ia.

a pesquisa revive a ideia familiar de duas superpotências de ia travadas em uma “corrida armamentista” computacional, com os estados unidos tendo uma vantagem na qualidade do chip e a china tentando preencher a lacuna por meio da quantidade.as restrições à exportação de gpus avançadas dos eua parecem ter desempenhado um papel, já que nenhum fornecedor de nuvem pública está oferecendo os chips 2023 h100 na china, nem o h800 ou a800, que foram desenvolvidos para contornar essas restrições. da mesma forma, a rússia e o irão, dois países sujeitos a sanções ocidentais, não possuem quaisquer instalações de computação de ia em nuvem pública na nossa amostra.

no entanto, além da perspectiva da competição geopolítica entre grandes potências, a investigação também propõe outras categorias conceptuais relacionadas com a governação da ia ​​baseada na computação. além dos estados unidos e da china, outros 15 países também possuem gpus que são mais importantes para o desenvolvimento da ia, nomeadamente a100 e h100. estes países de primeiro nível, com exceção da índia, estão todos localizados no chamado “norte global”. por analogia, chame-os de "calculando o norte". estes países do norte da computação podem utilizar a sua jurisdição territorial para intervir no desenvolvimento da ia, especialmente quando os modelos são enviados para as suas regiões locais de nuvem pública para formação. por exemplo, poderiam influenciar os tipos de sistemas de ia que entram nos mercados globais, exigindo que algoritmos e conjuntos de dados sejam aprovados em auditorias e sejam certificados como estando em conformidade com as regras locais antes de a formação poder começar.

o segundo nível inclui 13 países cujo poder computacional é mais adequado para a implantação de sistemas de ia do que para o seu desenvolvimento. com exceção da suíça, estes países estão todos localizados no sul global, daí o termo “sul computacional”. por exemplo, existem cinco regiões de nuvem com suporte de gpu na américa latina, mas nenhuma delas apresenta uma gpu mais poderosa do que o v100 lançado em 2017. estes países são capazes de utilizar a sua jurisdição territorial sobre a computação para controlar quais os sistemas de ia que podem ser implantados localmente, mas têm menos influência no desenvolvimento de sistemas de ia.

além do “norte da computação” e do “sul da computação”, há também um “deserto da computação”, um termo usado para se referir a todos os países do mundo que não possuem qualquer computação de ia em nuvem pública (seja para treinamento ou implantação). ).para estes países, mudar para serviços de ia baseados na nuvem significa contar com infraestruturas desenvolvidas e implantadas em jurisdições estrangeiras. os desertos computacionais incluem alguns países ricos, mas também todos os países de rendimento médio-baixo e de rendimento baixo classificados pelo fundo monetário internacional (fmi). o cálculo do impacto nos países desérticos pode variar dependendo de quão ricos eles são. os países ricos no deserto podem ser capazes de aproveitar as suas outras vantagens - como a influência diplomática sobre o norte da computação e a riqueza suficiente para construir poder computacional de propriedade do governo - para compensar a desvantagem da falta de computação local de ia em nuvem pública, mas os desertos computacionais os países pobres têm poucas perspectivas de influenciar a ia através da governação computacional.

semelhante aos investigadores que observaram uma “divisão informática” entre a academia e a indústria, o estudo também observou uma divisão computacional global, e a distribuição geográfica da computação de ia em nuvem pública parece estar a reproduzir padrões familiares de desigualdade global. a partir de meados da década de 1990, as discussões sobre a digitalização propuseram que a entrada bem sucedida na nova "economia do conhecimento" global se basearia em activos imateriais, como o conhecimento e a criatividade, em vez de depender dos activos e recursos materiais exigidos na era económica industrial. isto significa que os países em desenvolvimento podem ignorar investimentos dispendiosos em infra-estruturas e saltar directamente para uma economia baseada no conhecimento. no entanto, a discussão de hoje sobre a ia destacou mais uma vez o papel crítico das infra-estruturas físicas, como fábricas de chips, centros de dados e redes de energia, na competitividade nacional. se a computação se tornar um nó de governação fundamental, então estas infra-estruturas físicas também poderão revelar-se cruciais para a manutenção de poderes reguladores independentes (lehdonvirta 2023). portanto, o poder computacional de um país também é equiparado, até certo ponto, ao seu poder político.

isso vai mudar? se a concentração da computação de ia de ponta nos estados unidos e no “norte da computação” se dever simplesmente à fricção na difusão da inovação, então, com o tempo, o mundo poderá gradualmente ficar inundado de poder computacional, diminuindo esta lacuna. os rivais da nvidia, como amd e intel, estão tentando se atualizar em termos de desempenho de chips. os fabricantes chineses também estão desenvolvendo chips de processamento de ia e, devido aos controles de exportação dos eua, há uma enorme demanda interna por eles. juntamente com o apoio governamental, essa lacuna pode aumentar gradualmente.

no entanto, se os padrões geográficos observados forem explicados mais pela dependência da trajectória resultante das vantagens dos pioneiros e das economias de escala, então a concentração geográfica, a especialização regional e a divisão internacional do trabalho podem tornar-se características duradouras da produção informática, como acontece em muitos outros países. indústrias idem.

escreva no final

quem tem mais gpus? a resposta a esta pergunta parece estar pronta, mas por trás dela está essencialmente a distribuição desigual do poder computacional. como melhorar o desequilíbrio do poder computacional e permitir que mais pessoas nos desertos computacionais desfrutem da conveniência trazida pela ia provavelmente será difícil de resolver em pouco tempo.