uutiset

kenellä on eniten gpu:ta?

2024-09-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

tekoälyn aikakauden tultua gpu:sta on tullut kaikkien huomion keskipiste.

kuitenkin, jos haluat maksimoida gpu:n tekoälyn koulutus- ja päättelytoiminnot, sinun on luotettava myös datakeskuksen tehoon voimme saavuttaa asioita, kuten tehokas chatbot, kuten chatgpt.

tekoälyn datakeskusten hinta ei kuitenkaan ole alhainen. miljardien dollarien rakennuskustannukset eivät ole pelkästään teknologiajättiläisiä, vaan ne kieltävät myös monia vahvoja maita ja alueita.

kun tekoälyllä voidaan tehdä yhä enemmän asioita, myös huippuluokan sirujen geopoliittinen merkitys kasvaa päivä päivältä. yhä useammat maat ja alueet kilpailevat sirujen keräämisestä, ja jotkut ovat jopa säätäneet lakeja estääkseen joidenkin maiden ja alueita ostamasta huippuluokan haketta,mutta toistaiseksi on ollut yllättävän vähän julkista tietoa tekoälysirujen tarkasta sijainnista ympäri maailmaa.

professori vili lehdonvirta oxfordin yliopiston internet institutesta paljasti todellisuuden, jota ei voi sivuuttaa: gpu:t ovat erittäin keskittyneet vain 30 maahan ja alueelle ympäri maailmaa, joista yhdysvallat ja kiina ovat kaukana edellä, ja useimmat alueet ovat ns. nimeltään "laskenta-aavikot": gpu:ta ei ole vuokrattavissa ollenkaan.

jakelujen tutkiminen

maailmanlaajuinen tekoälyn laskennan toimitusketju voidaan jakaa karkeasti neljään osaan:

yritykset, jotka suunnittelevat ja myyvät gpu:ita ja muita tekoälyyn liittyviä siruja

siruja valmistavat ja pakkaavat yritykset

yritykset ottavat käyttöön siruja tarjotakseen laskentatehoa

yritykset, jotka käyttävät laskentatehoa tekoälyjärjestelmien kehittämiseen tai käyttöönottoon

gpu-suunnittelun ja -myynnin markkinajohtaja on yhdysvaltalainen nvidia, sirujen valmistusta hallitsee taiwanilainen taiwan semiconductor manufacturing co., ltd. (tsmc) ja alankomaiden asml on tällä hetkellä ainoa valmistukseen välttämättömiä litografiakoneita valmistava yritys. huippuluokan pelimerkit ovat kriittisiä (miller 2022). tämän seurauksena nämä tietotekniikan toimitusketjun osat ovat erittäin keskittyneitä sekä maantieteellisesti että omistuksen suhteen.

tämä tutkimus keskittyy toimitusketjun kolmanteen vaiheeseen: missä päin maailmaa siruja käytetään tarjoamaan tekoälylaskentaa tekoälyn kehittämiseen ja käyttöönottoon, eli tekoälymallien koulutukseen ja olemassa olevien mallien johtopäätöksen tekemiseen. laajamittainen tietojenkäsittelyn tarjoajia on yleisesti ottaen kolme luokkaa: tieteelliset superlaskentatilat, yksityiset laskentaklusterit ja niin sanotut julkiset pilvipalveluntarjoajat.

tieteellisiä supertietokoneita on ollut olemassa 1960-luvun alusta lähtien, ne ovat tyypillisesti valtioiden rahoittamia, ja niitä käytetään ensisijaisesti akateemisiin ja sotilaallisiin tarkoituksiin. oecd:n tutkimus (2023) suoritti yksinkertaisen maantieteellisen analyysin tieteellisistä supertietokoneista. top500-tietokannan mukaan eniten supertietokoneita on kiinassa, jonka osuus on 32 prosenttia, ja sen jälkeen yhdysvaltojen osuus on 25 prosenttia ja euroopan unionin osuus on 21 prosenttia. useimpia tieteellisiä supertietokoneita ei kuitenkaan ole suunniteltu tekoälymallikoulutukseen (oecd 2023). generatiivisen tekoälykehityksen nykyinen menestys perustuu pääasiassa yksityisiin tietojenkäsittelyklustereihin ja julkiseen pilvilaskentaan. aikaisemmat tutkimukset eivät ole analysoineet niiden maantieteellistä jakautumista yksityiskohtaisesti.

yksityiset laskentaklusterit omistavat voittoa tavoittelevat yritykset, kuten meta, hp ja monet pienemmät yritykset. nämä klusterit koostuvat gpu-liitetyistä tietokoneista, jotka on asennettu datakeskuksiin. yksityistä klusteria voidaan käyttää joko yrityksen tekoälyn kehittämiseen tai vuokrata muille yrityksille. julkiset pilvipalveluntarjoajat ovat myös voittoa tavoittelevia yrityksiä. niitä ei kutsuta "julkisiksi" ei siksi, että ne liittyvät viranomaisiin, vaan siksi, että heidän palvelunsa tarjotaan pyynnöstä ja useiden asiakkaiden yhteiskäytössä (eli samankaltainen kuin "julkinen" tavernassa, eikä julkinen osasto "julkinen"). . julkisen pilvipalvelun markkinoiden johtajia ovat aws, microsoft azure ja google cloud kiinalaiset julkiset pilvipalveluntarjoajat alibaba ja tencent tarjoavat myös laajamittaista tekoälylaskentaa. näitä suuria palveluntarjoajia kutsutaan usein "hyperscale-tietokoneiden tarjoajiksi".

tämä tutkimus keskittyy pääasiassa julkisen pilvi tekoälytekniikan maantieteelliseen jakautumiseen. yksityisiä laskentaklustereita on käytetty joidenkin ikonisten mallien, kuten meta’s llaman ja llama 2:n, kouluttamiseen. mutta useiden huippuluokan tekoälymallien koulutus ja kehittäminen on keskittynyt julkisiin pilvihyperscale-palveluntarjoajiin google, microsoft ja amazon sekä niiden "laskentakumppanuuksiin" johtavien tekoälyyritysten, kuten anthropic, cohere, google deepmind, hugging, kanssa. face, openai ja stability ai. julkinen pilvi on tärkeä myös siksi, että se on avoin monentyyppisille kehittäjille, myös akateemisille tutkijoille. siksi pääasiallinen tutkimuskysymyksemme on: mikä on julkisen pilvi tekoälyn maantieteellinen jakautuminen ympäri maailmaa? tutkimme myös mahdollisia syitä näiden maantieteellisten hajaantumiseen, keskustelemme niiden vaikutuksista tietojenkäsittelyn hallintoon ja geopolitiikkaan ja päätämme lyhyen keskustelun yksityisistä klustereista ja valtion omistamasta kansallisesta tekoälyn laskemisesta.

tutkimuksen laskenta kattaa kuusi suurinta hypermittakaavaista julkista pilvipalveluntarjoajaa: aws, microsoft, google, alibaba, huawei ja tencent. vaikka on olemassa useita pienempiä palveluntarjoajia, nämä kuusi muodostavat suurimman osan maailmanlaajuisista julkisista pilvimarkkinoista ja johtavat myös useilla alueellisilla markkinoilla. laskentahetkellä tehokkain grafiikkasuoritin yleisten tekoälymallien koulutukseen oli nvidian vuonna 2023 lanseerattu h100, edellinen lippulaivamalli a100 julkaistiin vuonna 2020 ja v100 aiemmin vuonna 2017. vuonna 2023 nvidia esitteli h800- ja a800-mallit kiertääkseen yhdysvaltojen vientirajoituksia kiinaan, mutta rajoitukset laajennettiin nopeasti näihin uusiin malleihin. tiedonkeruu keskittyi näihin viiteen tekoälyn kannalta tärkeimpään gpu-tyyppiin.

väestönlaskentatietokannasta tutkimuksessa rakennettiin maatason tietojoukko, joka mahdollistaa maantieteellisen analyysin.kullekin maalle se laski julkisten pilvialueiden kokonaismäärän alueellaan, myös alueiden osajoukon, jotka tukevat vähintään yhtä gpu-tyyppiä ("gpu-yhteensopivat alueet") sekä tiettyä gpu:ta tukevien alueiden osajoukon. tyyppi.

pilvilaskentatietojen täydennykseksi tutkimuksessa tehtiin kvalitatiivisia ja puolistrukturoituja asiantuntijahaastatteluja. haastattelimme yhteensä 10 informanttia, jotka edustivat kahta politiikan asiantuntijaa, kolmea hyperskaalan julkisen pilvipalvelun asiantuntijaa ja viittä tekoälylaskentaan perehtynyttä tutkimusasiantuntijaa. nämä informantit rekrytoitiin lumipallonäytteiden avulla oman ammattiverkostomme kautta. näiden haastattelujen ensisijaisena tavoitteena on parantaa ja validoida väestölaskentametodologiaa, tuottaa täydentävää tai vaihtoehtoista tietoa julkisen pilvi tekoälytekniikan maantieteellisestä jakautumisesta ja auttaa selittämään havaittuja maantieteellisiä malleja.

missä ai-gpu:t ovat?

kuvassa 1 on esitetty väestölaskennassa löydettyjen julkisten pilvialueiden likimääräinen sijainti. taulukko 4 näyttää kuinka monta pilvialuetta kussakin maassa on ja kuinka moni näistä alueista tarjoaa gpu-instanssia. tietojenkäsittelyn hallinnan näkökulmasta yksi tietojen tärkeimmistä ominaisuuksista on, että suurimmalla osalla maailman maista ei ole julkisia pilvialueita ollenkaan. niistä 39 maasta, joissa on yksi tai useampi pilvialue, 30:ssä on pilvialueita, jotka tukevat gpu:ita.

toinen silmiinpistävä piirre on, että jopa niissä maissa, joissa on gpu-yhteensopivat pilvialueet, alueiden maantieteellinen jakautuminen on erittäin polarisoitunut:kiinalla ja yhdysvalloissa yhteensä on lähes yhtä monta aluetta (49) kuin muualla maailmassa yhteensä (52). näistä kahdesta kiinan gpu-tukialueiden kokonaismäärä on hieman suurempi (27) kuin yhdysvalloissa (22).

lisäanalyysiä voidaan tehdä tarkastelemalla kussakin maassa tarjolla olevia gpu-instanssityyppejä. ilmeisin malli on, että yhdysvalloissa on maailman uusimmat ja tehokkaimmat grafiikkasuorittimet paitsi erityyppisten instanssien osuudessa, myös pelkässä määrässä. yhdysvallat on ainoa maa, jossa vuoden 2020 nvidia a100 gpu on saatavilla useammilla alueilla kuin vuoden 2017 v100 gpu. yhdysvalloissa on myös useita alueita, jotka tarjoavat vuoden 2023 nvidia h100 gpu:ta. kiinan pilvialueet perustuvat pääasiassa v100:aan, ja muutamat alueet tarjoavat a100-esiintymiä. h100 ei ole saatavilla millään kiinan alueella. vain 15 maata muualla maailmassa tarjoaa a100:aa, vain yksi maa tarjoaa h100:n, ja loput alueet perustuvat puhtaasti v100:aan.

tämä analyysi ei ota huomioon mukautettuja kiihdytyssiruja (kuten tpu:ita), eikä se ota huomioon eroja eri alueilla saatavilla olevien gpu:iden määrässä. haastattelun informoijat totesivat, että eri alueilla saatavilla olevien samantyyppisten gpu:iden määrä voi vaihdella merkittävästi alueiden ja palveluntarjoajien välillä. eräs informantti huomautti: "hyperscale-pilvipalveluntarjoajat antavat melkein vaikutelman, että he ovat kaikkivoipaisia ​​laskennan tai tallennustilan suhteen ja näyttävät pystyvän käsittelemään heille kohtaamasi ongelmat. mutta se ei ole täysin todellisuutta." alueella saatavilla olevien gpu:iden määrä voi olla hyvin rajallinen, minkä seurauksena vain rajoitettu määrä asiakkaita pystyy ajamaan gpu-esiintymiä kyseisellä alueella tai voivat vain kouluttaa pienemmän mittakaavan malleja kohtuullisessa ajassa.

aws:llä ja microsoftilla uskotaan tällä hetkellä olevan suurimmat pilvigrafiikkasuoritinklusterit, mutta "tässä suhteessa on ehdottomasti eroja alueiden välillä".hyperscale-pilvipalveluntarjoajat pitävät kuitenkin gpu:iden määrää ja niiden jakautumista palveluntarjoajan alueella erittäin luottamuksellisina tietoina. yksikään tiedontarjoajistamme ei halunnut tai pystynyt toimittamaan tiettyjä tietoja tai ilmoittamaan, kuinka nämä tiedot voitaisiin saada julkisesti. mutta yleisesti uskotaan, että gpu:iden määrä yhdysvalloissa voi olla paljon suurempi kuin muilla alueilla maailmassa, joilla on samanlaiset gpu:t. kiinan alueella voi myös olla enemmän v100-siruja korvatakseen sen suhteellisen alhaisen suorituskyvyn. haastattelumme viittaavat siihen, että vaikka gpu:iden määrä aluetta kohti voitaisiin sisällyttää tähän analyysiin, tämä ei ehkä haasta yllä kuvattuja hallitsevia malleja, vaan pikemminkin vahvistaa niitä.

miksi keskittyä yhdysvaltoihin?

mikä on yhdysvaltojen edelläkävijän takana kehittyneen julkisen pilvi tekoälytekniikan alalla verrattuna kiinaan ja muihin maihin? yksi ilmeinen selitys on yhdysvaltain hallituksen vientivalvonta, joka kieltää a100- ja h100-sirujen viennin kiinaan. kiinalaiset pilvipalveluntarjoajat voivat tuoda joitakin a100-siruja ennen vientivalvonnan voimaantuloa vuonna 2023, mutta h100 on ollut vientivalvonnan alainen tuotteen julkaisusta lähtien. samoin h800- ja a800-sirut asetettiin vientivalvontaan pian niiden julkaisun jälkeen. v100, joka on paljon vähemmän tehokas kuin nämä sirut, on yleisin nvidian gpu-instanssityyppi kiinassa, koska siihen ei kohdistu vientivalvontaa.

vientivalvonta ei kuitenkaan voi selittää, miksi muut maat kuin kiina ovat pääosin ottaneet käyttöön vanhempia gpu:ita. useita selityksiä on mahdollista. yksinkertainen selitys on innovaatioiden leviämisen kitka, joka viittaa gpu-diffuusioprosessiin markkinoilla. uudemmat gpu:t asennetaan todennäköisesti ensin yhdysvaltoihin, missä nvidialla on vahvin jakeluverkosto sen jälkeen, kun sen pääkonttori on yhdysvalloissa. ajan myötä edistyneiden gpu:iden pitäisi vähitellen levitä suhteellisen kaukaisille markkinoille. "olettaisin, että melkein kaikki grafiikkasuorittimet menivät alun perin pohjois-amerikan alueelle, mutta euroopassa pitäisi olla nyt iso klusteri", eräs informantti spekuloi.

toinen mahdollinen selitys yhdysvaltain pilvitekniikan johdolle tulee maantieteellisistä eroista alkuperäisessä kysyntärakenteessa, mikä yhdistettynä mittakaavaetuihin luo eräänlaisen "polkuriippuvuuden", joka ylläpitää tekoälyn keskittymistä tietyille maantieteellisille alueille. yksi tiedottaja selitti:"on hyvin vähän pilven ostajia, jotka todella tekevät uraauurtavaa tekoälykehitystä... joten ei ole tarvetta hajauttaa ominaisuuksia... tarvitset muutaman superklusterin muodostaaksesi kriittisen massan laskentatehoa tietyissä paikoissa, ei tarvetta kopioida tämä kyky kaikkialla."

ensimmäiset suuren mittakaavan tekoälymallikoulutukseen keskittyneet yritykset ja tutkijat syntyivät yhdysvalloissa, joten pilvipalveluntarjoajat keskittivät tehokkaimman koulutuksen laskentatehonsa sinne. mutta vaikka tietojenkäsittelyn kysyntä kasvaa muualla maailmassa, se ei välttämättä tarkoita vastaavaa paikallisen laskentainfrastruktuurin kasvua, koska kehittäjät voivat usein lähettää koulutustehtäviä yhdysvaltojen pilvialueille kärsimättä merkittäviä suorituskyvyn menetyksiä. näin ollen yhdysvaltojen alkuperäinen tietotekniikan johtajuus säilyi.

informantit uskovat, että tilanne tekoälyn käyttöönotossa käytetyn laskentatehon kanssa on erilainen. monissa tekoälyn käyttötapauksissa, kuten puheassistenteissa, viive voi vaikuttaa käyttökokemukseen, jos käyttäjän ja palvelimen välinen etäisyys on liian suuri. tiedonsiirtokustannuksista voi tulla myös liiketoimintakysymys. siksi tällaiset sovellukset ovat parasta ottaa käyttöön laskentainfrastruktuurissa lähempänä käyttäjiä. tämä selittää myös sen, miksi v100-sirut, jotka eivät ole tarpeeksi tehokkaita harjoitteluun - mutta silti sopivat päättelytehtäviin, vaikka ovat hitaampia - ovat jakautuneet tasaisemmin ympäri maailmaa kuin edistyneemmät sirut.

on kuitenkin olemassa muutamia poikkeuksia, jotka eivät sovi yhdysvaltojen yleiseen malliin, jossa on edistyneimmät gpu:t.japanissa, isossa-britanniassa ja ranskassa on kummallakin sama määrä a100-tukialueita kuin v100-tukialueita. jokaisella näistä maista on merkittävää paikallista tekoälykehitystoimintaa.voi olla lainsäädännöllisiä tai poliittisia esteitä, jotka estävät paikallisia kehittäjiä lähettämästä tietoja yhdysvaltoihin koulutusta varten. eräs informantti totesi: "tällä hetkellä on julkisen sektorin tai tärkeitä eurooppalaisia ​​toimijoita, joiden on koulutettava gpt-4-tason malleja tiedoilla, jotka eivät voi poistua euroopasta… jos hyperscale-pilvipalveluntarjoajat eivät vastaa tähän kysyntään, olisin yllättynyt."

tässä yhteydessä informantit mainitsivat politiikkakeskustelut "digitaalisesta itsemääräämisoikeudesta", "datan itsemääräämisoikeudesta" ja "laskennallisesta itsemääräämisoikeudesta", mikä voisi lisätä paikallisen koulutuksen tarvetta. alankomaissa ja irlannissa on myös pieniä, mutta suhteellisen kehittyneitä gpu-kokoonpanoja. tämä saattaa liittyä näiden maiden strategiseen asemaan joidenkin hyperscale-pilvipalveluntarjoajien infrastruktuurikeskuksina. erityisesti alankomaat on ainoa maa yhdysvaltojen ulkopuolella, jossa on pilvialue h100-grafiikkasuorittimilla.

yksityisen ja valtion tietojenkäsittelyn maailmanlaajuinen jakelu

tämä tutkimus keskittyy julkiseen pilvipalveluun, joka on tärkeä mutta ei ainoa tietojenkäsittelyn lähde. julkisessa pilvipalvelussa tiedonkeruumme keskittyy nvidian gpu:ihin ja kuuteen johtavaan hyperscale-pilvipalveluntarjoajaan.

muuttuuko erityyppisten suurten tietojenkäsittelytoimittajien suhteellinen asema, mikä haastaa tällä hetkellä havaittavan laskennan maantieteen? gpu-klusterit ovat kalliita pääomahyödykkeitä, jotka vaativat korkeaa käyttöastetta kohtuullisen sijoitetun pääoman tuottoprosentin saavuttamiseksi, mikä selittää, miksi suuret klusterit rakennetaan ensisijaisesti jaetuksi infrastruktuuriksi, olivatpa ne valtion omistuksessa (kuten tieteellinen supertietokone) tai viime vuosina yksityisiä (kuten julkinen pilvipalvelu). ). valtion omistama tietojenkäsittely näyttää tekevän pienen mittakaavan paluun ympäri maailmaa national ai computing -aloitteen muodossa. esimerkiksi yhdysvaltojen national ai resources (nair) -työryhmä pyrkii luomaan julkisen tietojenkäsittelyinfrastruktuurin "tekoälytutkimuksen demokratisoimiseksi". monissa tapauksissa julkisten investointien mittakaava ei kuitenkaan näytä riittävän haastamaan valta-asemaa hyperscale-pilvipalveluntarjoajien tila. monet viimeaikaiset hallituksen ponnistelut ovat myös toteutettu yhteistyössä näiden hyperscale-pilvipalveluntarjoajien kanssa, ja itse asiassa nämä projektit perustuvat yksityiseen infrastruktuuriin.

european high performance computing consortiumin uusi lumi-supertietokone tarjoaa vastaesimerkin.suomen kajaanissa sijaitseva lumi on perustettu yhteistyössä eu-maiden hallitusten kanssa ja se koostuu 11 912 gpu:n klusterista, jonka on suunnitellut nvidian kilpaileva amd. sen mittakaava voisi tehdä siitä vakavan vaihtoehdon yksityiselle "julkiselle" pilvilaskentainfrastruktuurille tekoälykehitysinfrastruktuurille. koska se sijaitsee eu:ssa, se ei kyseenalaista kuvassa 2 näkyvää pohjois-etelä-jakoa. se voi kuitenkin auttaa murtamaan kaksinapaisen kuvan yhdysvalloista ja kiinasta ainoana tekoälyn suurvaltana.

myös uusia yksityisiä laskentaklustereita on kasvussa. googlen tpu voi muodostaa merkittävän osan tekoälyn laskemisesta. sekä aws että microsoft suunnittelevat valmistavansa omia siruja. meta ilmoittaa massiivisista investoinneista yksityisen laskentatehon rakentamiseen: toimitusjohtaja mark zuckerberg väittää investoivansa 340 000 nvidia h100- ja a100-yksikköä vuonna 2023 microsoft väittää käyttävänsä satoja miljoonia dollareita openai:n chatgpt-keskustelubotin käyttöön. suuret teknologiayritykset voivat pystyä saavuttamaan suurien klustereiden korkean käyttöasteen pelkästään sisäisten ja kumppanitarpeidensa perusteella. mutta alun perin yksityisinä käyttöön otetut klusterit voivat siirtyä jaettuun pilviinfrastruktuuriin, kun sisäiset tarpeet vähenevät.tämä hämärtää eron yksityisten ja julkisten (kuten julkisten asuntojen) pilvilaskentaominaisuuksien välillä.

aukko tekoälyn laskennassa

tekoälyn hallinta laskennan avulla on tehokas idea, koska laskenta koostuu suuresta, havaittavasta fyysisestä infrastruktuurista. näiden infrastruktuurien on sijaittava fyysisesti jossain, ja siksi ne ovat alttiina alueelliselle lainkäyttövallalle, joka on täytäntöönpanokelpoisin lainkäyttövalta kaikissa valtioissa, niin suurissa kuin pienissäkin. tutkimukset osoittavat kuitenkin, että tietojenkäsittelyinfrastruktuuri ei ole jakautunut tasaisesti ympäri maailmaa, ja niiden maantieteellinen jakautuminen määrää suurelta osin sen todennäköisyyden, että eri maat käyttävät tietojenkäsittelyä tekoälyn interventiopisteenä.

tutkimus herättää henkiin tutun ajatuksen kahdesta tekoälysupervallasta, jotka ovat lukittuina tietojenkäsittelyn "kilpa-aseisiin", jossa yhdysvalloilla on etu sirujen laadussa ja kiina yrittää kuroa umpeen määrän avulla.yhdysvaltain vientirajoituksilla edistyneille grafiikkasuorituksille näyttää olleen oma roolinsa, koska mikään julkinen pilvipalveluntarjoaja ei tarjoa 2023 h100 -siruja kiinassa eikä h800- tai a800-siruja, jotka on kehitetty näiden rajoitusten kiertämiseksi. samoin venäjällä ja iranilla, kahdella länsimaisten pakotteiden alaisena maalla, ei ole otoksessamme julkisia pilvi tekoälylaitteita.

geopoliittisen suurvaltakilpailun näkökulman lisäksi tutkimuksessa ehdotetaan kuitenkin myös muita laskentaperustaiseen tekoälyjohtamiseen liittyviä käsitteellisiä luokkia. yhdysvaltojen ja kiinan lisäksi 15 muussa maassa on tekoälyn kehityksen kannalta tärkeimpiä gpu:ita, nimittäin a100 ja h100. nämä ensimmäisen tason maat intiaa lukuun ottamatta sijaitsevat kaikki niin sanotussa "globaalissa pohjoisessa". sanokaa niitä analogisesti "pohjoisen laskemiseksi". nämä laskennan pohjoismaat voivat käyttää alueellista lainkäyttövaltaansa puuttuakseen tekoälyn kehittämiseen, varsinkin kun malleja lähetetään paikallisille julkisille pilvialueille koulutukseen. ne voivat esimerkiksi vaikuttaa maailmanlaajuisille markkinoille tulevien tekoälyjärjestelmien tyyppeihin vaatimalla, että algoritmit ja tietojoukot läpäisevät auditoinnit ja sertifioidaan paikallisten sääntöjen mukaisiksi ennen kuin koulutus voidaan aloittaa.

toiseen tasoon kuuluu 13 maata, joiden laskentateho soveltuu paremmin tekoälyjärjestelmien käyttöönottoon kuin niiden kehittämiseen. sveitsiä lukuun ottamatta nämä maat sijaitsevat globaalissa etelässä, mistä johtuu termi "laskennallinen etelä". esimerkiksi latinalaisessa amerikassa on viisi gpu-tuettua pilvialuetta, mutta yhdessäkään niistä ei ole tehokkaampaa gpu:ta kuin vuonna 2017 julkaistussa v100:ssa. nämä maat voivat käyttää alueellista toimivaltaansa tietojenkäsittelyyn valvoakseen, mitkä tekoälyjärjestelmät voidaan ottaa käyttöön paikallisesti, mutta niillä on vähemmän vaikutusta tekoälyjärjestelmien kehittämiseen.

"computing north" ja "computing south" lisäksi on olemassa myös "computing desert", termillä tarkoitetaan kaikkia maailman maita, joissa ei ole julkista tekoälyn pilvilaskentaa (joko koulutusta tai käyttöönottoa varten). ).näille maille siirtyminen pilvipohjaisiin tekoälypalveluihin tarkoittaa ulkomailla kehitettyä ja käyttöön otettua infrastruktuuria. laskennallisiin aavikoihin kuuluu joitakin rikkaita maita, mutta myös kaikkia kansainvälisen valuuttarahaston (imf) luokittelemia matalan keskitulotason ja matalan tulotason maita. aavikkomaihin kohdistuvien vaikutusten laskeminen voi vaihdella sen mukaan, kuinka varakkaita ne ovat. rikkaat maat autiomaassa voivat pystyä hyödyntämään muita etujaan – kuten diplomaattista vaikutusvaltaa pohjoiseen tietojenkäsittelyyn ja vaurautta, joka on riittävä valtion omistaman laskentatehon rakentamiseen – kompensoidakseen paikallisen julkisen tekoälylaskennan pilvipalvelun puutteen, mutta laskenta-aavikon. köyhillä mailla on vähän mahdollisuuksia vaikuttaa tekoälyyn laskennallisen hallinnon avulla.

samalla tavalla kuin tutkijat, jotka havainnoivat "tietotekniikan kahtiajakoa" akateemisen ja teollisuuden välillä, tutkimuksessa havaittiin myös globaali tietojenkäsittelyn jakautuminen, ja julkisen pilvi tekoälylaskennan maantieteellinen jakautuminen näyttää toistavan tuttuja maailmanlaajuisen epätasa-arvon malleja. 1990-luvun puolivälistä lähtien keskustelut digitalisaatiosta ehdottivat, että onnistunut pääsy uuteen globaaliin "tietotalouteen" perustuisi aineettomiin omaisuuseriin, kuten tietoon ja luovuuteen, sen sijaan, että luottaisivat teollisen talouden aikakaudella tarvittaviin aineellisiin omaisuuseriin ja resursseihin. tämä tarkoittaa, että kehitysmaat voivat ohittaa kalliit infrastruktuuri-investoinnit ja hypätä suoraan osaamiseen perustuvaan talouteen. tämänpäiväinen tekoälykeskustelu korosti kuitenkin jälleen kerran fyysisen infrastruktuurin, kuten sirutehtaiden, datakeskusten ja sähköverkkojen, kriittistä roolia kansallisessa kilpailukyvyssä. jos tietojenkäsittelystä tulee keskeinen hallintasolmu, nämä fyysiset infrastruktuurit voivat myös osoittautua ratkaisevaksi riippumattoman sääntelyvallan ylläpitämiseksi (lehdonvirta 2023). siksi maan laskentateho rinnastetaan jossain määrin myös sen poliittiseen voimaan.

muuttuuko tämä? jos huippuluokan tekoälytekniikan keskittyminen yhdysvaltoihin ja "computing northiin" johtuu yksinkertaisesti innovaatioiden leviämisen kitkasta, niin ajan myötä maailma voi vähitellen tulvii laskentatehoa, mikä kaventaa tätä kuilua. nvidian kilpailijat, kuten amd ja intel, ovat kuromassa kiinni sirujen suorituskyvyssä. kiinalaiset valmistajat kehittävät myös tekoälyn prosessointisiruja, ja yhdysvaltojen vientivalvonnan vuoksi niille on valtava kotimainen kysyntä yhdessä valtion tuen kanssa, ja tämä ero voi vähitellen kasvaa.

kuitenkin, jos havaitut maantieteelliset kuviot selittyvät enemmän polkuriippuvuudella, joka johtuu ensimmäisen toimijan eduista ja mittakaavaetuista, niin maantieteellinen keskittyminen, alueellinen erikoistuminen ja kansainvälinen työnjako voivat muodostua laskentatuotannon pysyviksi piirteiksi, kuten monissa muissakin. toimialat sama.

kirjoittaa loppuun

kenellä on eniten gpu:ta? vastaus tähän kysymykseen näyttää olevan valmis, mutta tämän kysymyksen takana on olennaisesti laskentatehon epätasainen jakautuminen. se, kuinka parantaa laskentatehon epätasapainoa ja antaa useammalle laskenta-aavikoille mahdollisuuden nauttia tekoälyn tuomasta mukavuudesta, on luultavasti vaikea ratkaista lyhyessä ajassa.