suora katsaus kotimaisten ai-sirujen selviytymistilaan: gpu-verentuotanto, tpu-raid, siruista tulee trendi ja verkko on jumissa

suora katsaus kotimaisten ai-sirujen nykytilaan: gpu-verentuotanto, tpu-raidit, sirujen trendi ja verkon pullonkaulat

2024-09-06

kirjoittaja |. gacs

xinxi raportoi 6. syyskuuta, että vuotuinen global ai chip summit (gacs 2024) avattiin tänään pekingissä. paikka oli täynnä istumapaikkoja, ja pilvisuoralähetyksen katsojamäärä nousi 1,2 miljoonaan.

▲paikalla ja sen ulkopuolella oli valtavasti väkeä.

konferenssia sponsoroivat zhiyi technologyn core east west ja intelligent orangutan. konferenssi kutsui 50+ vierasta ai-sirujen, risc-v:n ja älykkäiden aloilta. laskentaklusterit, ai infra ja muut kentät vieraat jakavat hyödyllistä tietoa kokouksessa.

on kulunut viides vuosipäivä kotimaisen gpgpu-yksisarvisen biren technologyn perustamisesta alalla se voi tukea kolmea tai useampaa heterogeenista gpu-tyyppiä samaa suurta mallia.

▲biren technology lanseeraa kotimaisen heterogeenisen gpu-yhteistyökoulutuksen ratkaisun hgct

gong lunchang, yksi zhiyi technologyn perustajista ja toimitusjohtaja, piti puheen järjestäjänä. tämä on seitsemäs vuosi, jolloin global ai chip summit on pidetty. huippukokouksesta on tullut kiinan vaikutusvaltaisin alan konferenssi on hyvä paikka ymmärtää ai-sirujen kehitystä kotimaassa ja ulkomailla.

▲gong lunchang, yksi zhiyi technologyn perustajista ja toimitusjohtaja

global ai chip summit kestää kaksi päivää. pääpaikka sisältää avajaiset ja kolme suurta istuntoa (ai-siruarkkitehtuuri, datakeskuksen ai-siru, reuna-ai-siru). ja risc-v innovation -foorumi.

avajaisissa yin shouyi, tsinghuan yliopiston professori ja integroitujen piirien koulun apulaisdekaani, piti pääpuheen "keskustelu high-computing power chips:n kehityspolusta: tietojenkäsittelyarkkitehtuurista integroituun arkkitehtuuriin", arvioiden järjestelmällisesti. korkean laskentatehon sirut olemassa olevat tekniset haasteet ja analysoida kattavasti viisi innovatiivista teknologiapolkua: tietovirtasirut, integroidut tallennus- ja laskentasirut, uudelleenkonfiguroitavat sirut, kolmiulotteiset integroidut sirut ja kiekkotason sirut.

tänään jakaa 21 asiantuntijaa, yrittäjää ja johtajaa huippuyliopistoista, tutkimuslaitoksista ja tekoälysiruyrityksistä. heidän joukossaan huippuluokan dialogi-istunto kutsui kolmen ai-sirun startupin edustajat kiihkeästi keskusteluun, nimittäin biren technology, kotimainen suuritehoinen siruyksisarvis, aixin yuanzhi, laite- ja reunapuolen ai-siru yksisarvinen, ja yritys. että vain lingchuan technology, puoli vuotta sitten perustettu nuori tekoälystartup. he keskittyivät keskustelemaan ai-siruteollisuuden nykytilasta, uusimmista käytännöistä ja edistyneistä suuntiin.

1. ratkaistaan suuren mittakaavan mallinlaskentatehon ja innovatiivisen arkkitehtuurin kysynnän ja tarjonnan haasteet suorituskyvyn pullonkaulojen läpimurtamiseksi

tsinghuan yliopiston professori ja integrated circuits schoolin apulaisdekaani yin shouyi selitti laskentatehon tarjonnan ja kysynnän välisiä vaikeuksia suurten mallien aikakaudella: siruteknologialla on edessään skaalausrajat, mikä saa laskentatehon kasvun. prosessin osinko kestämätön;

mahdollisuus ratkaista nämä kaksi suurta ongelmaa piilee laskentapiirin laskenta-arkkitehtuurin ja integroidun arkkitehtuurin yhteisessä innovaatiossa: laskenta-arkkitehtuurin innovaatio mahdollistaa jokaisen transistorin täysimääräisen hyödyntämisen ja tehokkaamman laskentatehon käyttämisen integroidussa arkkitehtuurissa mahdollistaa sirumittakaavan läpimurron rajoja.

tällä hetkellä korkean laskentatehon sirujen kehittämiseen on olemassa viisi uutta teknologista polkua: tietovirtasirut, uudelleenkonfiguroitavat sirut, integroidut tallennus- ja laskentasirut, kolmiulotteiset integroidut sirut ja kiekkotason sirut. mikään näistä poluista ei ole täysin riippuvainen edistyneimmistä valmistusprosesseista, mikä auttaa avaamaan kotimaiselle siruteollisuudelle uutta tilaa laskentatehon parantamiseksi.

▲yin shouyi, tsinghuan yliopiston professori ja integrated circuits schoolin apulaisdekaani

amd on luonut kattavan tuotelinjan päästä päähän ai-infrastruktuurin alalla, joka kattaa datakeskuspalvelimista, tekoälytietokoneista älykkäisiin sulautettuihin ja reunalaitteisiin, ja tarjoaa johtavan tekoälyn avoimen lähdekoodin ohjelmiston ja avoimen ekosysteemin. microsoftin kaltaiset jättiläiset ovat ottaneet käyttöön amd:n cpu-prosessorialustan, joka perustuu edistyneeseen zen4-arkkitehtuuriin ja mi-sarjan kiihdyttimiin, jotka perustuvat cdna3-arkkitehtuuriin tekoälyn päättelyyn ja koulutukseen.

amd:n tekoälyosaston vanhemman johtajan wang hongqiangin mukaan amd edistää myös korkean suorituskyvyn verkkoinfrastruktuuria (ualink, ultra ethernet) datakeskuksissa, mikä on ratkaisevan tärkeää tekoälyverkkorakenteille, jotka tukevat nopeaa vaihtoa ja erittäin pientä latenssia. laajentaa tekoälyn datakeskuksen suorituskykyä.

amd on julkaisemassa seuraavan sukupolven korkean suorituskyvyn ai pc:tä. sen toisen sukupolven xdna-arkkitehtuuriin perustuva ryzen ai npu voi tarjota 50tops laskentatehoa ja nostaa energiatehokkuussuhteen 35-kertaiseksi yleiskäyttöiseen arkkitehtuuriin verrattuna. tekoäly-pc:n pyrkimyksenä yksityisyyteen, tietoturvaan ja tietojen riippumattomuuteen, tärkeitä tekoälytyökuormia aletaan ottaa käyttöön pc:issä. yhtenä maailman johtavista tekoälyinfrastruktuurin toimittajista amd on valmis työskentelemään asiakkaiden ja kehittäjien kanssa rakentaakseen muuttuvaa tulevaisuutta.

▲wang hongqiang, amd:n tekoälyosaston johtaja

vuodesta 2015 lähtien qualcomm on jatkuvasti innovoinut npu-laitteistosuunnittelua tekoälysovellusten käyttötapauksissa tapahtuneiden muutosten perusteella. kolmannen sukupolven snapdragon 8:n edustama qualcomm ai engine käyttää heterogeenista laskenta-arkkitehtuuria, joka integroi useita prosessoreita, kuten cpu:n, gpu:n ja npu:n. niistä qualcomm hexagon npu optimoi suorituskyvyn ja energiatehokkuuden suuren mittakaavan muistin, kiihdyttimille omistetun virtalähteen, mikroarkkitehtuuripäivitysten ja muiden mallien avulla. tekoälyllä on runsaasti käyttötapauksia ja vaihtelevia laskentatehovaatimuksia. siksi heterogeenisten tietojenkäsittelyn ja prosessorien integrointi on olemassa pitkään, mikä tuo mukanaan myös useita parannuksia huippusuorituskykyyn, energiatehokkuuteen, kustannuksiin jne.

qualcommin tuotevalikoima kattaa laajan valikoiman reunapuolen sovellusskenaarioita, kuten matkapuhelimet, pc:t, xr, autot ja iot. se voi tukea kehittäjiä käyttämään qualcommin tekoälyohjelmistoja ja laitteistoratkaisuja algoritmien kiihdyttämiseen eri tuotemuodoissa, mikä tuo vaurautta. etuja kuluttajille. lopuksi wan weixing, qualcomm ai product technology kiinan johtaja, ilmoitti myös, että uuden sukupolven snapdragon-mobiilialusta, joka on varustettu uusimmalla qualcomm oryon -suorittimella, julkaistaan snapdragon summitissa, joka pidetään 21.-23. lokakuuta tänä vuonna.

▲wan weixing, qualcommin ai-tuoteteknologian johtaja kiinassa

yang yue, pingxin technologyn perustaja ja toimitusjohtaja, katkaisi integroidun tallennus- ja laskentateknologian etenemisprosessin. valtavirtasirujen syntyminen ja kasvu teollisuudessa liittyvät läheisesti nykyisten laskentatarpeiden ominaisuuksiin vuoden 2015 tienoilla laskenta-arkkitehtuurin laskenta- pullonkaula siirtyi prosessorin puolelta tallennuspuolelle, erityisesti hermoverkkojen ilmaantuminen, mikä kiihtyi. ai-sirujen laskentatehokkuus parantuneen nopeuden myötä tallennus- ja laskentatekniikka on herättänyt huomiota.

yang yue uskoo, että suurten mallien aikakaudella integroidun tallennus- ja laskentateknologian mahdollisuus on lisätä tietojenkäsittelyä kaikkialla, missä on dataa. ohjelmistojen jatkuvan kehityksen myötä tallennus- ja laskentapohjaiset loppusirut ovat vähitellen kypsyneet tänä vuonna. tulevaisuudessa pilven datakaistanleveyden pullonkaulojen ratkaisemisesta voi tulla seuraava tallennus- ja laskentasirujen tappajasovellus.

▲yang yue, pingxin technologyn perustaja ja toimitusjohtaja

tan zhanhong, arctic xiongxinin teknologiajohtaja, sanoi, että korkean suorituskyvyn laskennan alalla palvelinsuunnittelussa on kaksi erilaista paradigmaa: vakiopalvelinmuoto ja räätälöity palvelinarkkitehtuuri. vakiopalvelimien muodossa arctic xiongxin keskittyy saavuttamaan korkeamman kustannustehokkuuden asianmukaisilla sirunjako- ja pakkausratkaisuilla ei-standardipalvelimien muodossa. se tarjoaa mahdollisuuksia kiekkotason integraatioon keskittyen integraatioon siru- ja järjestelmäsuunnitteluun sekä palvelimien ja sirujen yhteissuunnitteluun, jonka tavoitteena on saavuttaa "palvelin siruksi" -tavoite.

erityisesti tan zhanhong korosti, että eri sirujen vaatimukset ovat erilaiset. esimerkiksi yli 7 nm:n prosesseissa ei usein tarvita suurta kaistanleveyden tiheyttä pystyy täyttämään suorituskykyvaatimukset ja saavuttamaan kustannustehokkaan ratkaisun. arctic xiongxinin "core chip interconnect interface standardiin" perustuva pb-link ip on virallisesti toteuttanut alhaisten pakkauskustannusten yhteenliittämisen ja on nyt alkanut valtuuttaa ulkopuolisia osapuolia.

▲ arktinen xiongxinin teknologiajohtaja tan zhanhong

2. korkeatasoinen dialogi: kotimaiset tekoälysirut ovat parantaneet hematopoieettisia ominaisuuksia, ja nuorimman start-up-yrityksen tuotteet on julkaistu kuaishoussa

zhang guoren, yksi zhiyi technologyn perustajista ja päätoimittaja, ja ding yunfan, biren technologyn tekoälyohjelmiston varapresidentti ja pääarkkitehti, liu li, lingchuan technologyn perustaja ja varapresidentti, ja liu jianwei, yhteistyössä -aixin yuanzhin perustaja ja varapresidentti, aloitti keskustelun pyöreän pöydän dialogi teemalla "konsensus, yhteisluominen ja win-win kotimaisten ai-sirujen käyttöönotossa".

zhang guoren sanoi pyöreän pöydän keskustelun alussa, että zhidongxin, coredongxin ja zhiangzhin käynnistämä kuudes kuudes ai chip summit on kiinan pisimpään käynnissä ollut ammattikonferenssi viime vuosina ai-sirujen ja suurten mallien kehitys on myös todistanut useiden kotimaisten ydinten "uusien voimien" nousua.

▲zhang guoren, zhiyi technologyn perustaja ja päätoimittaja

ding yunfan sanoi, että suuret laskentatehosirut ovat teknologiaintensiivinen, lahjakkuusintensiivinen ja pääomavaltainen ala. markkinoiden suurimman julkisen rahoituksen saaneena siruunisarvisena biren technologyn ensimmäisen sukupolven tuotteet on massatuotettu ja markkinoille on tuotu useita kotimaisia gpu-kilokorttiklustereita, jotka voivat tuottaa itsenäisesti verta. kotimaisen haketeollisuuden kokonaistilanne ei kuitenkaan ole vieläkään helppo, ja ekologisten näkökohtien ja ulkomaiden välillä on edelleen kuilu.

monia kotimaisia tekoälysiruja on alettu ottaa käyttöön datakeskuksissa ja älykkäissä laskentakeskuksissa. ding yunfanin mielestä nvidian kotimaiset tuotteet eivät ole kovin kustannustehokkaita niin kauan kuin kotimaiset sirut voivat tarjota korkean suorituskyvyn ja kustannustehokkuuden, markkinat ovat olemassa. tällä hetkellä kotimaisen siruteollisuuden lanseerauksesta ja hematopoieettisten ominaisuuksien tehostamisesta kuullaan yhä enemmän.

▲ ding yunfan, biren-teknologian varapuheenjohtaja ja tekoälyohjelmiston pääarkkitehti

liu jianwei uskoo, että alhaiset kustannukset ovat erittäin tärkeä osa, ja yritysten on lopulta suoritettava tilit ja sijoitettava infrastruktuuriin takaisin. liu li uskoo, että jatkossa segmentoiduilla kappaleilla, kuten ruumiillistuneella älykkyydellä ja älykkäällä videolla, useamman yrityksen tulo tuo yleisiä tuotteita korkeampaa arvoa, mikä pakkaa nvidian tuloja ja voittoja.

lingchuan technology on yksi nuorimmista kotimaisista ai-siruista. se perustettiin tämän vuoden maaliskuussa ja on saanut päätökseen tällä hetkellä myynnissä olevat älykkäät videonkäsittelysirut, joiden osuus kuaishoun käytöstä on 99 prosenttia. videoprosessointikenttä laskentatehon päättelypiirin odotetaan nauhoittavan ensi vuoden alussa.

liu li näkee, että ai-sirujen markkinaikkuna on vielä kaukana sulkeutumisesta kun otetaan huomioon jättiläisten resurssien, rahastojen ja ekologian edut, startup-yritysten on ponnisteltava vertikaalisilla ja segmentoiduilla aloilla. lingchuan technology yhdistää älykkään videoprosessoinnin ja tekoälyn laskentatehon tavoitteenaan alentaa sen merkkikohtaiset päättelykustannukset 10 prosenttiin nvidia h800:sta.

▲ liu li, lingchuan technologyn perustaja ja varapuheenjohtaja

aixin yuanzhi, joka kohdistuu sekä pääty- että reunapuolelle, on saavuttanut merkittäviä tuloksia markkinaosuudessa. liu jianwei uskoo, että nämä kaksi kenttää toteuttavat kaupallisen suljetun silmukan nopeammin. hän lisäsi, että tekoälysirujen tekeminen tuottaa lopulta rahaa, mutta todelliseen tuottoaikatauluun vaikuttavat sellaiset tekijät kuin tekoälyn käyttöönottokustannukset, ja yritysten tulisi saada aikaan itsetuotanto ja suljettu silmukka mahdollisimman pian. jatkossa aixin yuanzhi tutkii suurten mallien toteutusskenaarioita pääty- ja reunapuolella.

aixin yuanzhin tuotetoimitukset autoteollisuudessa ovat erittäin vaikuttavia, koska aixin yuanzhi on kerännyt älykkäiden kaupunkien siruteknologiaa ja siirtynyt sitten älykkääseen ajoon saavutettu pian. samalla autoalan hintasota edistää teollista työnjakoa, joka on mahdollisuuksien aikaa.

▲liu jianwei, yksi aixin yuanzhin perustajista ja varapuheenjohtaja

mitä tulee siihen, kuinka kotimaiset ai-sirut löytävät nopeasti ekologisen markkinaraon, liu jianwei otti esimerkkinä aixin yuanzhin syvän kehitysskenen. älykkäissä kaupungeissa ei periaatteessa ole ulkomaisia yrityksiä 1, ja 1-100, vaihe, joka kiinnittää enemmän huomiota kustannuksiin, on kotimainen. ding yunfan mainitsi neljä tekijää: vakaa ja luotettava toimitustakuu, kustannustehokkuus, tehokkaat asiakastarpeisiin perustuvat tukipalvelut sekä tehokkuus ja helppokäyttöisyys. liu li uskoo, että meidän pitäisi syventää vertikaalisia kenttiä ja luoda tehokkaampia ja optimoituja ratkaisuja kuin yleiskäyttöiset sirut.

tulevaisuutta silmällä pitäen liu jianwei ennustaa, että seuraavien 4-5 vuoden aikana tulee olemaan suuria kehitysmahdollisuuksia sekä laite- että pilvipuolella kun alan käyttöönottokustannukset ovat pienentyneet, data voi saavuttaa enemmän arvoa . liu li uskoo, että kun tekoälysovellukset alkavat räjähdysmäisesti, pilvipuolella tulee olemaan paljon perustelujen kysyntää. ding yunfan sanoi, että huippuluokan laskentatehoa on kiinassa edelleen vähän, mutta teollisuusketjun yhteistyöllä voidaan saavuttaa tasaista kehitystä.

3. älykkäiden laskentakeskusten rakentaminen on nousussa: uudet läpimurrot gpu:ssa, kotimaisessa tpu:ssa, chiplet voittaa

habana kiinan johtaja yu mingyang kertoi iltapäivällä pidetyssä palvelinkeskuksen ai-siruistunnossa, että viimeisten kolmen vuoden aikana on rakennettu yli 50 hallituksen johtamaa älykäs laskentakeskusta ja yli 60 on suunnittelussa ja rakentamisessa älykkäiden laskentakeskusten rakentaminen on vähitellen ensimmäisen tason kaupungeista toisen tason ja kolmannen tason kaupunkeihin ja valtion vetämistä yritysvetoisiin vaatimuksiin kustannusten alentamisesta ja investointien tuottosyklistä kasvaa myös vähitellen.

hänen havaintojensa mukaan suurten mallien kehitys on yhä kypsempää ja johtopäätösten kysyntä kasvaa edelleen päättelypuoli.

suuren mallikoulutuksen kysyntä ulkomailla säilyy edelleen vahvana, ja kotimaisen mallikoulutuksen laskentatehon kysyntä on periaatteessa kylläistä lähinnä hienosäätöliiketoiminnasta. tulevan tekoälykehityksen tukemiseksi sirujen, nopean suuren kapasiteetin muistin ja yksityisten/yleisten nopeiden yhteenliittämistekniikoiden integrointi on avainasemassa.

▲ yu mingyang, habana kiinan johtaja

katkaistakseen heterogeenisten laskentatehosiilojen ongelman suurille malleille, biren technologyn varatoimitusjohtaja ja tekoälyohjelmiston pääarkkitehti ding yunfan ilmoitti lanseeraavansa birenin oman alkuperäisen heterogeenisen gpu-yhteistyökoulutuksen ratkaisun hgct. tämä on ensimmäinen kerta alalla, joka tukee kolmea tai useampaa heterogeenista gpu:ta saman suuren mallin yhteiskoulutuksessa, eli se tukee yhdistettyä koulutusta "nvidia + biren + muiden merkkien gpu:illa". viestinnän tehokkuus on yli 98 %. ja päästä päähän -harjoittelutehokkuus saavuttaa 90–95%.

bi ren työskentelee asiakkaiden ja kumppaneiden kanssa edistääkseen yhdessä heterogeenista gpu-yhteistyökoulutuksen ekosysteemiä, mukaan lukien china telecom, zte, sensetime, state grid intelligence research institute, shanghai intelligent computing technology co., ltd., shanghai artificial intelligence laboratory, china institute of china. tieto- ja viestintätekniikka jne.

sen tuotteet on otettu kaupallisesti käyttöön useissa kilokorttien gpu-klustereissa. biren on kehittänyt laajan mallin kokonaisratkaisun, joka yhdistää ohjelmistot ja laitteistot, täyden pinon optimoinnin, heterogeenisen yhteistyön ja avoimen lähdekoodin. biren on ensimmäistä kertaa toteuttanut suurten mallien 3d-rinnakkaistehtävien automaattisen joustavan laajenemisen ja supistumisen pitäen klusterin käyttöasteen lähes 100 %:ssa. se on saavuttanut 100 miljardin parametrimallin automaattisen palautuksen 10 minuutissa 10 minuutissa. , ei vikoja 4 päivään, eikä keskeytyksiä 15 päivään.

▲ ding yunfan, biren-teknologian varapuheenjohtaja ja tekoälyohjelmiston pääarkkitehti

zheng hanxun, yksi zhonghao xinyingin perustajista ja teknologiajohtaja, sanoi, että nykypäivän suuret tekoälymallit ylittävät huomattavasti laskennan monimutkaisuuden ja laskentatehovaatimukset milloin tahansa laskentahistorian aikana ja vaativat erikoissiruja, jotka ovat parempia tekoälylaskelmissa. verrattuna gpu:hun, joka oli alun perin suunniteltu reaaliaikaiseen renderöintiin ja kuvankäsittelyyn, tpu on suunniteltu pääasiassa koneoppimiseen, syväoppimismalleihin ja hermoverkkolaskelmiin prosessointitehokkuus on parantunut huomattavasti gpu:han verrattuna.

zhonghao xinyingin itse kehittämä "snap"-siru on kiinan ensimmäinen massatuotettu korkean suorituskyvyn tpu-arkkitehtuurin ai-siru. laskennan suorituskyvystä, kustannuksista ja energiankulutuksesta yksikkölaskentakustannukset ovat vain 50 % johtavien ulkomaisten gpu:iden vastaavista. . zheng hanxun uskoo, että suuren mittakaavan mallikehityksen myöhemmissä vaiheissa kilo- ja 10 000 ka:n klustereiden paras kustannustehokkuussuhde on ratkaiseva. suora nopea liitäntä jopa 1 024 sirun välillä on setsana-sirujen välillä. kriittinen tekijä suurten laskentaklustereiden rakentamisessa. suorituskyky voi moninkertaisesti ylittää perinteisen gpu:n.

▲zheng hanxun, zhonghao xinyingin perustaja ja teknologiajohtaja

inspur informationin avoimien kiihdytettyjen laskentatuotteiden johtajan stephen fengin mukaan suurten mallien parametriskaalan kasvaessa generatiivisen tekoälyn kehittäminen kohtaa neljä suurta haastetta: klusterin riittämätön skaalautuvuus, suuri sirujen virrankulutus, vaikea klusterin käyttöönotto ja alhainen järjestelmä. luotettavuus iso haaste. inspur information on aina ollut sovelluslähtöistä ja järjestelmäkeskeistä, mikä stimuloi generatiivisen ai-innovoinnin elinvoimaa kaiyuanin avoimen järjestelmän kautta.

laitteiston avoimuuden osalta olemme laatineet oam (open acceleration module) -määritykset, jotka nopeuttavat edistyneen laskentatehon online-käyttöönottoa ja tukevat suurten mallien ja tekoälysovellusten iteratiivista kiihdytystä. mitä tulee ohjelmistojen avoimuuteen, suuren mallinkehitysalustan "yuannao qizhi" epai:n kautta luomme yrityksille täyden prosessin sovelluskehitystukialustan kattavien ratkaisujen avulla ratkaisemme perusalan illuusioongelmia suuria malleja ja ratkaista sovelluskehitysongelmia, kuten monimutkaisia prosesseja, korkeat kynnykset, useiden mallien mukauttamisvaikeudet ja korkeat kustannukset nopeuttavat yritysten suurten mallisovellusten innovointia ja käyttöönottoa.

▲stephen feng, inspur information open accelerated computing products -yksikön johtaja

qingcheng jizhi perustettiin vuonna 2023, ja se keskittyy ai-infra-rataan. tiimi haudottiin tsinghuan yliopiston tietojenkäsittelytieteen laitoksella, ja sillä on yli kymmenen vuoden kokemus älykkään laskentatehon optimoinnista.

shi tianhui, yksi qingcheng jizhin perustajista, kertoi, että kotimaiset korkean suorituskyvyn tietokonejärjestelmät kohtaavat haasteita, kuten vikojen korjausvaikeudet ja huonon suorituskyvyn. ne edellyttävät 10 perusohjelmistojärjestelmän yhteistyötä, ja qingcheng jizhi on jo yksi yli puolella aloista on itse kehitettyjä tuotteita.

tällä hetkellä qingcheng jizhi on hallinnut täyden pinon teknologian keräämisen pohjatason kääntäjästä ylemmän tason rinnakkaislaskentajärjestelmään, saavuttanut täyden pinon kattavuuden suuren mallin teollisuuden ekologiassa ja suorittanut useita korkean suorituskyvyn päätelmien optimointeja. kotimaiset sirut ja valtavirran laajamittaiset malli siirretään ja optimoidaan nopeasti, ja laskentateho paranee merkittävästi. niistä erittäin suurille kotimaisille laskentatehoklustereille kehitetty suuri mallikoulutusjärjestelmä "bagua furnace" voidaan laajentaa 100 000 palvelimen mittakaavaan ja sitä käytetään 174 biljoonan parametrin mallien kouluttamiseen.

▲shi tianhui, yksi qingcheng jizhin perustajista

xinhe semiconductorin teknologiamarkkinointijohtaja huang xiaobo sanoi, että laskentatehon kysyntä on kasvanut 60 000 kertaa viimeisen 20 vuoden aikana ja voi nousta 100 000 kertaiseksi seuraavan 10 vuoden aikana. chiplet-integroiduista järjestelmistä on tullut tärkeä suunta edistyneiden prosessirajoitusten ja korkean suorituskyvyn laskentatehon parannuksille mooren jälkeisellä aikakaudella. niitä on käytetty laajasti tekoälyn suurissa laskentatehon siruissa ja tekoälyn laskentatehoklusterin verkkokytkentäsiruissa.

tässä suhteessa xinhe semiconductor tarjoaa yhden luukun monifysiikan simulointi-eda-alustan chiplet-integroitujen järjestelmien suunnitteluun ja kehittämiseen. alusta tukee liitäntärakenteiden parametrista mallintamista tavanomaisissa prosessimalleissa. sen simulointiominaisuudet ovat 10 kertaa nopeampia kuin muut alustat. siinä on myös sisäänrakennettu hbm/ucie-protokollaanalyysi se on voittanut useita palkintoja kotimaisilta ja ulkomaisilta johtajilta.

▲huang xiaobo, xinhe semiconductorin teknologiamarkkinointijohtaja

suurten mallien koulutuksen aikana verkkoinfrastruktuurin osuus kustannuksista on 30 %, mikä korostaa verkon suorituskyvyn merkitystä. qimo:n perustajan ja tuotteiden ja ratkaisujen varatoimitusjohtajan zhu jundongin mukaan verkosta on tullut älykkään laskentasuorituskyvyn pullonkaula. tekoälyverkon rakentaminen vaatii kolmen verkon integrointia, nimittäin klusteriverkkojen välisen liittämisen, kaappien välisen liittämisen, ja yhteenliittäminen sirujen sisällä.

suuret älykkäät laskentaklusterit vaativat korkean suorituskyvyn yhteenliittämistä, ja modernize rdma ja chiplets on tullut avaintekniikoiksi. rdma:n optimoimiseksi qimon ndsa-verkkokiihdytyksen ydinsarja perustuu ohjelmoitavaan moniytimiseen suoratoistoarkkitehtuuriin ja käyttää korkean suorituskyvyn datamoottoria tehokkaan datavirran ja joustavan tiedonkiihdytyksen saavuttamiseksi. ge:n edelläkävijä gpu link chiplet "ndsa-g2g" perustuu ethernet-infrastruktuuriin ja korkean suorituskyvyn datamoottorin ja d2d-rajapintatekniikan ansiosta se voi saavuttaa teratavutason suuren kaistanleveyden scale-up-verkossa, ja sen suorituskyky on verrattavissa maailmanlaajuisen yhteenliittämisteknologian vertailukohtana.

▲ zhu jundong, yksi qimon perustajista ja tuotteiden ja ratkaisujen varatoimitusjohtaja

alphawave on yritys, joka tarjoaa ip-, siru- ja asic-suunnitteluratkaisuja hpc-, ai- ja nopeille verkkosovelluksille. guo dawei, sen aasian ja tyynenmeren alueen johtava liiketoimintajohtaja, kertoi, että alphawave ip -tuotteiden bittivirhesuhde on 2 suuruusluokkaa pienempi kuin kilpailevilla tuotteilla integraatio ja todentaminen, ja ne ovat syvästi integroituneet arm-ekosysteemiin. ne voivat myös tarjota täyden elinkaarituen asiakkaiden soc:ille.

mitä tulee siruihin, alphawave auttaa asiakkaita lyhentämään kiertoa, alentamaan kustannuksia sekä parantamaan tuottoa ja iterointinopeutta. se on nyt tehnyt alan ensimmäisen usean protokollan io-yhteyspiirin, joka on teipattu tänä vuonna. mitä tulee räätälöityihin siruihin, alphawave keskittyy pääasiassa alle 7 nm:n prosesseihin, ja se voi suorittaa koko prosessin teknisistä tiedoista nauhalähtöön asiakkaan tarpeiden mukaan 25.

▲guo dawei, alphawave aasian ja tyynenmeren alueen liiketoimintajohtaja

johtopäätös: loppupään älykkyys kasvaa, ja tekoälysirut kohtaavat historiallisia mahdollisuuksia

matkalla kohti yleisen tekoälyn äärimmäistä aihetta ai-algoritmien muoto muuttuu jatkuvasti, ja tekoälysirut seuraavat perässä. kun muinainen sora kohtaa tulevaisuuden koneälyn, teknologia ja tekniikan viisaus yhdistyvät ja törmäävät hienosti muotoilluilla tekoälysiruilla laskentaklustereihin ja tuhansiin kotitalouksiin tukeen piipohjaisen elämän kehitystä.

älykkäistä laskentakeskuksista ja älykkäästä ajamisesta tekoälytietokoneisiin, tekoälymatkapuhelimiin ja uusiin tekoälylaitteistoihin, loppupään älykkyyden trendi on tuonut uusia historiallisia mahdollisuuksia eri skenaarioita ankkuroiviin tekoälysiruihin. nopeasti kehittyvät generatiiviset tekoälyalgoritmit ja -sovellukset avaavat edelleen uusia laskentatehohaasteita. teknologiset innovaatiot ja markkinakysyntä edistävät ai-sirumarkkinoiden laajentumista ja monipuolistavat tekoälysirujen kilpailuympäristöä.

syyskuun 7. päivänä 2024 global ai chip summit jatkaa intensiivisen tiedon toimittamista: päätapahtumapaikassa pidetään erityinen ai-siruarkkitehtuuriinnovaatioita käsittelevä erityinen istunto reuna/pään ai-siruista, ja vuoden 2024 kiinan 20 parasta älykkään laskentaklusteriratkaisuyritystä" ja "2024" on kaksi listaa "kiinan 10 nousevista tekoälyyrityksistä". .

uutiset

suora katsaus kotimaisten ai-sirujen nykytilaan: gpu-verentuotanto, tpu-raidit, sirujen trendi ja verkon pullonkaulat

johdanto

yhteystietoni