Vuoropuhelu Yizhu Technologyn puheenjohtajan Xiong Dapengin kanssa: Tallennuksen ja tietojenkäsittelyn integrointi voi aloittaa laskentatehon toisen kasvukäyrän tekoälyn aikakaudella
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Tekoälyn (AI) räjähdysmäinen kasvu on aiheuttanut valtavan kysynnän laskentateholle Mooren jälkeisellä aikakaudella kehittyneet sirujen valmistusprosessit lähestyvät fyysisiä rajoja, ja varastoinnin ja tietojenkäsittelyn integroinnista odotetaan muodostuvan yksi tärkeimmistä teknologiareiteistä. tulevaisuudessa.
Tallennus ja laskenta on integroitu, eli tiedon tallennus ja laskenta on integroitu samalle sirulle. Millä näkökohdilla integroitujen tallennus- ja laskentaarkkitehtuurisirujen suorituskyky- ja kustannusedut näkyvät? Mitkä ovat suuren mittakaavan kaupallistamisen tämän hetken haasteet? Tuleeko tallennuksen ja tietojenkäsittelyn integroinnista kotimaiselle siruteollisuudelle mahdollisuus vaihtaa kaistaa ja ohittaa se?
China Business News kävi äskettäin keskustelua Yizhu Technologyn perustajan, puheenjohtajan ja toimitusjohtajan Xiong Dapengin kanssa yllä mainituista aiheista. Hänen mukaansa integroidulla tallennus- ja laskentateknologialla on muutospotentiaalia tulevaisuuden laskenta-alalla ja se rikkoo Mooren lain ja käynnistää laskentatehon toisen kasvukäyrän. "Varsinkin tekoälyn aikakaudella tästä tekniikasta voi tulla avaintekijä laskentatehon kasvua ajamassa."
Riko von Neumannin arkkitehtuuri ja poista kolme suurta ongelmaa
Perinteisessä von Neumannin arkkitehtuurissa laskenta- ja tallennustoiminnot täydentävät laskentayksiköt (CPU, GPU jne. XPU) ja tallennusyksiköt. Tiedot saadaan muistista ja palautetaan muistiin käsittelyn jälkeen. Aika, joka kuluu tiedon siirtämiseen ja lukemiseen muistista prosessointiyksikön ulkopuolella, on usein moninkertainen laskenta-aikaan verrattuna, mikä johtaa laskennan tehokkuuden tai tehollisen laskentatehon laskuun.
"Nykyään, kun suuret mallit ovat vallitsevia, malliparametreja on siirrettävä, jotta laskelmat saadaan valmiiksi. Parametrien määrä on erittäin suuri ja aika on suuri, jopa yli 80%. Joissain tapauksissa tämä Tämän vuoksi datakaistanleveys rajoittaa todellista Sirun tehollinen suorituskyky voi olla P, mutta todellinen suorituskyky voi olla paljon pienempi kuin tämä luku", Xiong Dapeng kertoi China Business Newsille.
"Säilytysseinäongelman" ohella siirtoprosessissa kuluu suuri määrä energiaa, mikä johtaa sirun energiatehokkuussuhteen merkittävään laskuun, mikä on "energiaseinäongelma".
Lisäksi ongelmana on "käännösseinä" - eli dynaaminen tietovirran ajoitus on monimutkainen, eikä kääntäjä voi automaattisesti optimoida operaattoreita ja suoritettavia ohjelmia saavuttaakseen tietovirran optimoinnin staattisissa ja ennakoitavissa olosuhteissa Viritys tämän saavuttamiseksi Suurempi tehokas laskentateho lisää todellisen käyttöönoton ja siirtymisen aikaa ja työvoimakustannuksia. "Nämä kolme kohtaa ovat rajoittaneet suuresti tekoälyteollisuuden kehitystä, sillä resursseista on yhä enemmän pulaa ja joka on lisännyt virrankulutusta merkittävästi."
Integroitu tallennus- ja laskentatekniikka rikkoo von Neumannin arkkitehtuurin, integroi tallennustoiminnot ja laskentatoiminnot samalle sirulle ja käyttää suoraan tallennusyksiköitä "luku"-piirin muistissa olevaa laskenta-arkkitehtuuria muokkaamalla "luku"-piirissä "Toimintatulos saadaan piirissä ja tulos "kirjoitetaan" suoraan takaisin muistin kohdeosoitteeseen. Toistuvia tiedonsiirtoja laskentayksikön ja tallennusyksikön välillä ei enää tarvita. tiedonsiirron aiheuttama kulutus ja vähentää huomattavasti virrankulutusta, mikä parantaa huomattavasti laskentatehoa.
"Integroidun tallennus- ja laskentatekniikan odotetaan muodostuvan yhdeksi tärkeimmistä teknisistä reiteistä Mooren jälkeisellä aikakaudella. Ensimmäisestä tehokkaan laskentatehon periaatteesta, tallennus- ja laskentaintegraatiossa, tiedonsiirron määrä vähenee merkittävästi ja tehokas laskentateho osoittaa lineaarista kasvua Voidaan sanoa, että tallennus- ja laskentateho ovat integroituja. Tietojenkäsittelyintegraatio rikkoo Mooren lain ja avaa laskentatehon toisen kasvukäyrän Tulevaisuuden tietojenkäsittelyalalla, erityisesti tekoälyn aikakaudella, tästä tekniikasta voi tulla avaintekijä laskentatehon kasvun edistämisessä", Xiong Dapeng sanoi.
Ratkaisu, jolla on parempi energiatehokkuus ja kustannustehokkuus
Verrattuna äskettäin suosittuun suuren kaistanleveyden muistisiruun HBM, tallennus- ja tietojenkäsittelyn integroidun arkkitehtuurin sirulla on parempi järjestelmän energiatehokkuus ja kustannustehokkuus.
HBM on korkean suorituskyvyn muistirajapintatekniikka, jota käytetään pääasiassa parantamaan GPU- ja HPC-järjestelmien tietojenkäsittelyominaisuuksia. Tämä tekniikka lisää dramaattisesti kaistanleveyttä pinoamalla DRAM-siruja pystysuoraan ja yhdistämällä ne tiukasti prosessoriin nopeiden liitäntöjen avulla.
"HBM on tehokas tekninen tapa ratkaista "tallennusseinä" -ongelma, mutta se vaatii kustannuksia ja virrankulutusta, koska suuren kaistanleveyden tarjoaminen vaatii suurempaa virrankulutusta, ja hinta on myös erittäin kallis, ylittää huomattavasti perinteisen DRAMin hinnan." Xiong Dapeng sanoi: "Pohjimmiltaan HBM on muistisiru eikä siinä ole laskentatoimintoja. Se on yhdistettävä laskentapiirien, kuten GPGPU:n, kanssa laskentatoimintojen saavuttamiseksi."
Järjestelmäkustannusten näkökulmasta integroitu tallennus- ja laskentasiru voi olla pienempi kuin perinteisen GPGPU:n ja HBM:n yhdistelmä.
Yhtäältä se johtuu integroidun tallennus- ja laskenta-arkkitehtuurin korkeammasta laskentatehotiheydestä tai PPA:sta. "Integroidun tallennus- ja laskenta-arkkitehtuurin vastaava datakaistanleveys on paljon suurempi kuin HBM:n, joka voi olla useita kertoja tai jopa kymmenkertainen ero. Samalla sen laskentatehotiheys on edullisempi. Todellinen tehollinen laskentateho , kustannustehokkuus ja energiatehokkuussuhde ovat paljon korkeammat kuin GPGPU+HBM-ratkaisu", Xiong Dapeng sanoi.
Toisaalta integroitu tallennus- ja laskentatekniikka on suhteellisen vähemmän riippuvainen edistyneistä prosesseista, kun taas sekä GPGPU että HBM ovat vahvasti riippuvaisia edistyneistä prosesseista. "HBM luottaa edistyneisiin prosesseihin ja sillä on suuria toimitusketjun riskejä. Jos se kuitenkin käyttää integroitua tallennus- ja laskentateknologiaa, vaikka se ei käyttäisikään edistyneitä prosesseja, kuten 12nm ja 22nm, suorituskyky ei saa olla huonompi kuin 4nm tai jopa 3nm. Tämä on myös ohituksen käsite.
Vaikka integroitu tallennus ja tietojenkäsittely saattavat vaatia enemmän siruja saavuttaakseen saman suorituskyvyn, sen korkea kustannustehokkuus ja korkea energiatehokkuussuhde ovat yksi sen merkittävistä eduista.
Se voidaan toteuttaa suuressa mittakaavassa suurten mallien alalla seuraavan 2-3 vuoden aikana.
Integroidun tallennus- ja laskentateknologian tutkimus ja soveltaminen kiihtyy kaikkialla maailmassa.
Tällä hetkellä ulkomaiset suuret laskentasiruyritykset, jotka ottavat käyttöön integroidun tallennus- ja laskentareitin, sisältävät tekoälyn aloittavan Groqin, jonka arvo on yli 2,8 miljardia dollaria ja jota pidetään Nvidian vahvana kilpailijana osti Microsoft, Temasek, Samsung, Marvell, Hainan jne. Lux, Ericsson ja monet muut yritykset ovat investoineet.
Lisäksi Samsung on myös julkaissut tutkimusta MRAM-pohjaisesta muistin sisäisestä laskennasta Naturessa ja osoittanut tekoälyalgoritminsa suuren tarkkuuden. SK Hynix on tuonut markkinoille GDDR-rajapintaan perustuvat DRAM-muistin laskentatuotteet, jotka voivat merkittävästi lisätä laskentanopeutta ja vähentää virrankulutusta.
"Ymmärtääkseni useimmat ulkomaiset yritykset toteuttavat SRAM-pohjaista tallennus- ja laskentaintegraatiota, mutta sen kapasiteetti on pieni ja kustannukset korkeat. Esimerkiksi Groqin täydellinen ratkaisu vaatii yli 570 sirua. Jos käytössä on NVIDIA H100, sirujen määrä on vain yksinumeroinen. Tämä johtuu pääasiassa riittämättömästä tallennustiheydestä "Xiong Dapeng sanoi, että monet kotimaiset nousevat yritykset ovat tehneet läpimurtoja integroidussa tallennus- ja laskentateknologiassa, mikä tarjoaa Kiinan siruteollisuudelle mahdollisuuden vaihtaa kaistaa ja ohittaa.
Kuitenkin, kun integroitujen tallennus- ja laskentasirujen laskentatehoa laajennetaan suuressa mittakaavassa, se kohtaa edelleen monia haasteita: ensinnäkin epäluotettavan tarkkuuden ongelma, joka perustuu analogisiin laskelmiin, digitaalisesta analogiseksi muuntaminen tuo energian pullonkauloja Kolmanneksi suurilla tekoälymalleilla on kapasiteettivaatimukset.
"Täysin digitaalinen polku voi ratkaista nämä ongelmat hyvin, mikä on myös perusta Yizhu Technologylle suurten laskentatehon päättelypiirien kehittämiseen."
Yleisessä analogisessa tallennus- ja laskentajärjestelmässä tiedot tallennetaan analogisten signaalien muodossa, joita edustavat tallennusyksikön eri jännitetasot, ja toiminnot, kuten MAC, suoritetaan Ohmin lain ja Kirchhoffin lakien perusteella. Tämän lähestymistavan suurin ongelma on, että tarkkuus ja tarkkuus eivät ole luotettavia analogisten piirien kohinan ja eri muuttujien vuoksi. Valmistusprosessista tai työympäristöstä riippumatta memristorin edustamissa arvoissa on virheitä tai poikkeamia. Digitaali-analogiset hybridimenetelmät yrittävät tasapainottaa tehokkuus- ja tarkkuusongelmat, mutta ne eivät silti voi taata suurta tarkkuutta ja tarkkuuden luotettavuutta.
Xiong Dapeng esitteli, että Yizhu Technologyn ratkaisu on täysin digitaalinen tallennus- ja laskentaintegraatio, joka perustuu memristoriin (ReRAM). Koska se on täysin digitaalinen, muistiyksikkö edustaa vain yhtä bittiä, ja siinä on vain eroja korkean ja matalan tason, korkean ja alhaisen virran välillä. se voi olla luotettava.
Lisäksi integroidun tallennuksen ja tietojenkäsittelyn kehittäminen kohtaa myös projektien toteutusongelmia. "Uutena teknologiareittinä olemassa olevan ekologian hyödyntäminen ja integrointi on suuri haaste. Ohjelmoitavuus ja yhteensopivuus olemassa olevan ekologian kanssa ovat ratkaisevan tärkeitä." Xiong Dapeng kertoi China Business Newsille.
Yhdessä integroitua tallennus- ja laskentatekniikkaa pidetään maailmanlaajuisesti tehokkaana keinona ratkaista suuren laskentatehon kysynnän ja korkeiden energiankulutuskustannusten välinen ristiriita. Se tarjoaa myös Kiinan siruteollisuudelle tärkeän mahdollisuuden kuroa kiinni. Tulevina vuosina teknologian kypsyessä ja markkinoiden kysynnän kasvaessa integroitujen tallennus- ja laskentasirujen odotetaan tulevan laajasti käyttöön monilla aloilla ja edistävän koko alan innovatiivista kehitystä. Tällä hetkellä integroitujen tallennus- ja laskentasirujen soveltaminen suurten mallien alalla on vielä kehitysvaiheessa, ja Xiong Dapeng ennustaa, että se otetaan käyttöön suuressa mittakaavassa seuraavien 2-3 vuoden aikana.
(Tämä artikkeli on peräisin China Business Newsista)