uutiset

16 kuukautta perustamisensa jälkeen se keräsi 1 miljardi yuanin rahoitusta wuwen core qiongin tavoitteena on olla suurin "laskentatehooperaattori" suurten mallien aikakaudella.

2024-09-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

kuvia ja tietoa tästä lehdestä
infinigence ai, suuren mallin infrastruktuurin startup, ilmoitti tänään saaneensa päätökseen lähes 500 miljoonan yuanin a-sarjan rahoituksen. toistaiseksi vain 16 kuukautta perustettu wuwen xinqiong on rahoittanut lähes miljardi juania.
xia lixue, wuwen xinqiongin toinen perustaja ja toimitusjohtaja, uskoo, että ai 2.0 -aallon tuoman uuden "kahdeksas kahdeksas lain" tarvitsee ratkaista vain 20 % keskeisistä teknisistä ongelmista tukeakseen 80 % vertikaalisista skenaarioista, ja kiinan laskentatehoekosysteemi edessämme on kysynnän ja tarjonnan epätasapaino sekä resurssien epätasainen jakautuminen, mikä epäilemättä luo wuwenxinqiongille mahdollisuuksia työskennellä yhdessä alku- ja loppupäässä saavuttaakseen monipuolisen ja heterogeenisen laskentatehon tehokkaan integroinnin.
wuwen xinqiong sanoi, että tästä rahoituksesta saadut varat käytetään vahvistamaan teknisten kykyjen rekrytointia ja teknologian tutkimusta ja kehitystä, ylläpitämään teknologista johtajuutta ohjelmisto- ja laitteistoyhteistyössä sekä edistämään tuotteiden kaupallistamista ja monimuotoisuutta infini-ai heterogeeninen pilvi tiivis integraatio alustatuotteiden ja markkinoiden välillä vahvistaa ekologista yhteistyötä, aktivoi heterogeeniset klusterilaskentaresurssit, rakentaa tekoälyn laskentatehokanta, joka tukee "m-tyyppisiä malleja" ja "n-tyyppisiä siruja" ja toimii "tekoälymallin laskentatehon supervahvistin" "...wuwen xinqiong on sitoutunut olemaan ykkösvalinta "laskentatehon operaattoriksi" suurten mallien aikakaudella.
ole "supervahvistin" ai-mallin laskentateholle
todellinen teollinen mittakaava, jota suuret mallit voivat tukea, riippuu ai-mallin todellisesta käytettävissä olevasta laskentatehosta. wuwen core qiong uskoo, että suuren mallin todellinen käytettävissä oleva laskentateho ei riipu vain sirun teoreettisesta laskentatehosta, vaan se voi myös vahvistaa laskentatehon käyttötehokkuutta optimointikertoimien avulla ja vahvistaa yleistä laskentatehoa klusterin koon kautta. siksi wuwen core qiong ehdotti "chip-laskentateho × optimointikerroin (ohjelmisto- ja laitteistoyhteistyö) × klusterin koko (useita heterogeenisia) = ai-mallin laskentateho". tätä kaavaa noudattaen wuwen core qiong jatkaa sirulaskentatehon hyödyntämisen parantamista suurissa mallitehtävissä ohjelmistojen ja laitteistojen yhteisen optimointiteknologian avulla sekä parantaa klusterin laskentatehon käyttöä ja laajentaa klusterin laskentatehon käyttöä useiden heterogeenisten tietojen avulla. tehonsovitustekniikka teollisuuden yleinen laskentavirtalähde.
ohjelmistojen ja laitteistojen yhteisen optimoinnin osalta wuwen xinqiong on parantanut huomattavasti valtavirran ja heterogeenisten laitteistojen käyttöä itse kehittämällään flashdecoding++-johtopäätöskiihdytysteknologiallaan, ylittäen edellisen sota:n, ja saanut valmiiksi useita valtavirran avoimen lähdekoodin suuria malleja amd:ssä, huawei ascendissa. , se on mukautettu yli 10 tyyppiseen tietokonekorttiin, kuten biren, cambrian, suiyuan, haiguang, tianshu zhixin, muxi, moore thread, nvidia jne., ja se on saavuttanut alan johtavia päättelykiihtyvyystuloksia joillakin tietokonekorteilla. vastaa tehokkaasti suuren mallipohjaisen päättelyn kasvavaan kysyntään eri toimialoilla. tällä ratkaisulla saavutettuihin optimointituloksiin perustuen wuwen core dome on allekirjoittanut strategisen yhteistyön amd:n kanssa edistääkseen yhdessä kaupallisten tekoälysovellusten suorituskyvyn parantamista.
mitä tulee moniheterogeeniseen laskentatehon mukauttamiseen, wuwen xinqiongilla on myös heterogeenisia sopeutumis- ja klusterointikykyjä, joita alalla on vähän. heinäkuussa julkaistu laajamittainen heterogeeninen hajautettu hybridikoulutusjärjestelmä hethub on ensimmäinen kerta alalla. edistänyt huawei yhteensä kuusi "4+2" -sirujen yhdistelmää, mukaan lukien tianshu zhixin, muxi, moore threads, amd ja nvidia, on käytetty kilokaloritason heterogeenisen laskentatehon sekakoulutukseen saavuttaa maksimiarvon 97,6 % keskimäärin korkealla. vertailuratkaisu on noin 30 % parempi, mikä tarkoittaa, että samoissa monisiruisissa tietokonehuoneissa tai klusteriolosuhteissa wuwen core dome voi tiivistää harjoittelun kokonaisajan 30 %.
tarjoaa täyden pinon ominaisuudet heterogeenisestä laskentatehon käytöstä suuriin mallisovelluskehitykseen
viime vuosina mallikerros ja sirukerros ovat vähitellen muodostaneet kansainvälisesti "kaksipäisen konvergenssimallin", kun taas kiinan mallikerros ja sirukerros esittävät edelleen "m×n" -kuvion, joka koostuu "m-tyyppisistä malleista" ja " n tyyppisiä siruja". eri laitealustojen on kuitenkin mukauduttava erilaisiin ohjelmistopinoihin ja työkaluketjuihin, ja heterogeenisten sirujen välillä on pitkään ollut "ekologinen siilo" -ilmiö, jota on vaikea käyttää samanaikaisesti. koska yhä enemmän kotimaisia ​​heterogeenisia laskentatehosiruja käytetään paikallisissa laskentatehoklustereissa eri puolilla maata, heterogeenisen laskentatehon tehokkaan hyödyntämisen ongelma on yhä vakavampi ja siitä on vähitellen muodostunut pullonkaula kiinan suuren malliteollisuuden kehityksessä.
ohjelmisto- ja laitteistoyhteistyön sekä moniheterogeenisen teknologian etuihin luottaen wuwen core dome on luonut infini-ai heterogeenisen pilvialustan, joka perustuu monisiruiseen laskentatehopohjaan. alusta on taaksepäin yhteensopiva useiden heterogeenisten laskentatehosirujen kanssa ja voi tehokkaasti aktivoida lepotilassa olevan heterogeenisen laskentatehon koko maassa. tällä hetkellä käytössä oleva laskentateho kattaa 15 kaupunkia eri puolilla maata. lisäksi infini-ai:n heterogeeniseen pilvialustaan ​​kuuluu myös yhden luukun tekoälyalusta (aistudio) ja laaja mallipalvelualusta (genstudio). alustan lanseerauksen jälkeen monet suurten malliteollisuuden johtavista asiakkaista, kuten kimi, liblibai, liepin, shengshu technology ja zhipu ai, ovat käyttäneet vakaasti heterogeenista laskentatehoa infini-ai heterogeenisen pilvialustan avulla ja nauttineet vaivattomasti suurten mallien kehittämisestä. core domen tarjoama työkaluketjupalvelu.
infini-ai heterogeeninen pilvialusta ei vain voi auttaa loppupään asiakkaita helposti suojaamaan laitteistoerot ja käyttämään taustalla olevaa heterogeenista laskentatehoa saumattomasti ja tehokkaasti, vaan se myös murtaa tehokkaasti kotimaisen heterogeenisen laskentatehon ekologisen dilemman ja nopeuttaa ylemmän kerroksen asteittaista muutosta. sovelluksia heterogeeniseen laskentaan laskentatehokannan siirtyminen integroi ja laajentaa tehokkaasti käytettävissä olevan laskentatehon mittakaavaa kotimaisessa suurmalliteollisuudessa, muuttaa heterogeenisen laskentatehon aidosti käyttökelpoiseksi, riittäväksi ja helposti käytettäväksi suureksi laskentatehoksi. ja auttaa rakentamaan paikallista laskentatehoa, jolla on kiinalaiset ominaisuudet.
kirjailija: shen qiusha
teksti: shen qiusha kuvat: toimittaja: haastateltava toimittaja: shen qiusha toimittaja: ren quan
ilmoita lähde, kun painat tämän artikkelin uudelleen.
raportti/palaute