2024 Global AI Chip Summitissa, joka järjestetään 6.–7. syyskuuta tänä vuonna, Yang Gongyifan...
2024-08-07
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"Toivon, että seuraavan sukupolven tuotteemme voivat toistuaVerrattuna nykyiseen NVIDIA B200:aanEdistyneempiä tuotteita…”
Tämä on viimeisin "pieni tavoite", jonka Yang Gongyifan, tekoälyharjoittelusirun startup-yrityksen Zhonghao Xinyingin perustaja ja toimitusjohtaja, jakoi äskettäin Xinyingissä.Yang Gongyifan on vanhempi sirujen T&K-veteraani Hän on ollut mukana huippuluokan sirututkimuksessa yli kymmenen vuoden ajan sellaisissa yrityksissä kuin Oracle ja Google, ja hän on osallistunut sirujen T&K-ydintiimiin.Google TPU 2/3/4Suunnittelu ja tuotekehitys palasivat Kiinaan vuoden 2018 lopussa täydellisen sirusuunnittelutiimin ja prototyyppien tarkistustiimin muodostamiseksi ja perustivat Zhonghao Xinyingin vuonna 2020.
Hänen mukaansa vuonna 2023 Zhonghao XinyingEnsimmäistä kertaa positiivinen voitto, emoyhtiön nettotulos oli 81,33 miljoonaa yuania, ja vuositulot olivat 485 miljoonaa yuania. Toistaiseksi se on kertynyt yhteensä5rahoituskierroksia;EttäItse kehitetty TPU-koulutussiru "Snap" on otettu massatuotantoon, jossa "Snap" -harjoitusmallin laskentateho saavuttaa NVIDIA A100:nMelkein 1,5 kertaa .Zhonghao Xinying käyttää AI-koulutussirua "Snap" kulmakivenä ja rakentaa laajamittaisen tekoälyn älykkään laskentaklusterin "Taize" nopeiden 1 024 sirun välisten sirujen välisten yhteyksien avulla.Kilokorttiklusterin laskentateho on 200PFLOPS。
▲ Zhonghao Xinying AI harjoitussiru "Snap"
Poikkeaa tällä hetkellä tekoälymarkkinoita hallitsevasta GPU:sta, Yang Gongyifanin valitsema raita on erityisesti syvään oppimiseen suunniteltu TPU-arkkitehtuuri Sama tuotantoprosessi ja sama prosessi saavuttaa 3-5 kertaa perinteisen GPU-arkkitehtuurin suorituskyvyn."
Yang Gong Yifan sanoi, että Zhonghao Xinying on tällä hetkelläAinoa maassa, jolla onTPUIntegroitu arkkitehtuurin koulutus ja edistäminenAIChip ydinteknologiayritys . Hän ennustaa, että seuraavien 5-10 vuoden aikanaTPUja luokkaTPUArkkitehtuurin markkinaosuus nousee80%,jäljellä oleva10%-20%Se on perinneGPU。
Sen lisäksi, että Zhonghao Xinying on edistänyt tekoälysirujen tutkimusta, kehitystä ja käyttöönottoa, se on myös itse kehittänyt valmiiksi koulutetun suuren mallin, joka voi tarjota "jäykkiä" tulostusominaisuuksia ja joka lopulta avataan rahoituksen, sairaanhoidon ja koulutuksen kumppaneille. jne. ammattimaisten suurten mallien toteuttamiseen pystysuunnassa.
AI-sirut ovat tunnettuja rahaa polttava pitkän matkan kilpailu. Kuinka Zhonghao Xinying voi saavuttaa kannattavuuden viidessä vuodessa? Miksi se siru-startupina kehittää omia suuria malleja ja rakentaa oman älykkään laskentakeskuksen, ja miten se aikoo erottua kotimaisten AI-sirujen kovenevasta kilpailusta? Äskettäin Yang Gongyifan, Zhonghao Xinyingin perustaja ja toimitusjohtaja, kävi syvällisen keskustelun Xinying Xinyingin kanssa, jakaen kaikki ajatukset ja valinnat yrittäjyysprosessissa sekä analyysin ja arvioinnin teknologian kehityksestä ja liiketoiminnan toteuttamisen suuntauksista.
▲ Yang Gongyifan, Zhonghao Xinyingin perustaja ja toimitusjohtaja
Yang Gongyifanin yli 10 vuoden kokemus huippuluokan sirualalta loi perustan oikean yrittäjyyssuunnan löytämiselle.
Suoritettuaan tietojenkäsittelytieteen maisterin tutkinnon Stanfordin yliopistosta, Yang Gongyifan osallistui ja johti 12 huipputason korkean suorituskyvyn prosessorin, mukaan lukien SPARCT8/M8, suunnittelua ja tuotantoa Oracle Corporationissa. Lisäksi hänellä on kokemusta menestyksekkäästä nauha- ulos yli kymmenen kertaa.
▲ Yang Gongyifanin Oraclen palveluksessa ollessaan julkaisemat asiaankuuluvat paperit (Lähde: IEEE Xplore)
Googleen liittyminen vuonna 2017 antoi hänelle mahdollisuuden palata Kiinaan perustamaan liiketoimintaa tulevaisuudessa.
Ollessaan Googlessa Yang Gongyifan osallistui TPU:n 2/3/4 suunnitteluun ja tuotekehitykseen sirujen T&K-ydintiimin jäsenenä. Hän mainitsi, että edellisen kymmenen vuoden kokemus antoi heille mahdollisuuden tehdä tutkimusta tietojenkäsittelyn perusteella sovellusten ja laskentamallien tarpeet Parhaan optimoinnin jälkeen TPU 2/3/4 kehitettiin onnistuneesti.
Kesäkuussa 2017 kahdeksan Googlen kirjoittajaa julkaisivat mestariteoksen nimeltä "Attention is All You Need", joka on vallankumouksellinen järjestelmä, joka on koulutettu TPU: lla.Muuntaja Arkkitehtuuri on painunut äärimmäisyyksiinsä, mikä on alku Transformer-arkkitehtuurin yleistymiselle suuressa mallitutkimuksessa. Samaan aikaan Yang Gongyifan uskoo, että suuret mallit varustetaan vähitellen ihmisälyllä ja TPU:lla on suuri vaikutus teolliseen kehitykseen Hän uskoo vakaasti, että suuret mallit korvaavat ihmiset ja niistä tulee sosiaalisen tuottavuuden ydin vuosina 2025 ja 2026.
▲Googlen TPU-arkkitehtuuri (Lähde: YouTube)
Yang Gongyifan uskoo, että tällä kertaa laskenta-alan muutos suurilla malleilla on suurin muutos ihmiskunnan historiassa. Koska kaikki aiemmat laskelmat suoritettiin yhdellä sirulla yhden tai useamman sovelluksen suorittamiseksi, nyt on ensimmäinen kerta, kun yhden sovelluksen suorittamiseen käytetään tuhansia siruja, joten se aiheuttaa valtavia ongelmia koko laskenta-arkkitehtuurin toteuttamiselle se on mahdollisuus.
Hän ajattelee, että on harvinaista saada näin suuri haaste, niin suuri muutos ja niin laaja valikoima sovellusskenaarioita, joten hänen on tehtävä se. Tämän ymmärryksen perusteella hän palasi Shenzheniin vuoden 2018 lopussa, muodosti tiimin rakentamaan kotimaassa tuotetun itsenäisesti ohjattavan TPU AI -koulutussirun ja perusti virallisesti Zhonghao Xinyingin vuonna 2020.
Tämä johti myös hänen ensimmäiseen yrittäjyyteen.2019Vuonna 2016 näimme, että simulaattori oli valmis, ajettiin läpi ja toimi hyvin, mikä osoitti niiden sirusuunnittelun olevan toteutettavissa.
Yrityksen perustamisen alkuaikoina Yang Gong Yifanin idea oli muodostaa ensin tiimi, joka voisi valmistaa tuotteita. Siksi ensimmäinen ryhmä laskeutui Shenzheniin, perusti sirusuunnittelutiimin ja prototyypin todentamisryhmän ja viimeisteli sirun modulaarisen suunnittelun. Sen jälkeen Zhonghao Xinying laskeutui Hangzhouhun vuonna 2020. Tuotepromootiolla, rahoituksella ja sirujen massatuotannolla he perustivat täydellisen toimitusketjutiimin ja markkinointitiimin. Tällä hetkellä tiimin koko on saavuttanut yli 170 henkilöä, joista T&K-henkilöstöä osuus on yli 80 prosenttia.
Mutta yrityksen perustamisen alkuvaihe ei ollut sujuvaa. Tuolloin useimmat kotimaiset toimijat, sijoituslaitokset ja asiakkaat eivät tunnistaneet alan suurten mallien tulevaa kehitystä ja sovellusmahdollisuuksia Yang Gongyifanin muiston mukaan Zhonghao Xinyingillä ei ollut perustamisen alkuaikoina lainkaan tuloja. kahdeksi vuodeksi, ja vasta vuonna 2021 se saavutti ensimmäisen toimintansa, joka on virallisesti kannattava vuonna 2023. Vuonna 2023 yhtiön liikevaihto on 485 miljoonaa yuania, ja emoyhtiön nettotulos on 81,33 miljoonaa yuania.
Tällä hetkellä Zhonghao Xinying on suorittanut 5 rahoituskierrosta, ja julkistettu rahoitusmäärä sisältää2022vuosi9valmistui kuukausissaARahoituskierros on noin 100 miljoonaa yuania, ja sitä johtaa Saizhi Bole Investment, johon osallistuvat Hangzhou High-tech Investment ja muut;2023Valmistunut peräkkäisinä vuosinaPre-BjaPre-B+rahoituskierroksia, arvoltaan satoja miljoonia ja kymmeniä miljoonia yuaneja.
Yang Gongyifanin näkemyksen mukaan sijoittajien tunnustus heistä jakautuu useisiin vaiheisiin Alkuvaiheessa he katsovat tiimiä, keskipitkällä aikavälillä he keskittyvät siihen, vastaavatko heidän tuotteitaan markkinoiden kysyntään, ja myöhemmässä vaiheessa he keskittyvät. siitä, onko tuotteilla ydinkilpailukykyä ja alan uutta kasvusuuntaa. Riippumatta tuotteen asettelun, teknisen reitin valinnan tai joukkueen eheyden näkökulmasta, Zhonghao Xinying ei ole jäänyt jälkeen joka vaiheessa.Tällä hetkellä Zhonghao Xinying on kasvanut ainoaksi yritykseksi maassa, joka hallitseeTPUIntegroitu arkkitehtuurin koulutus ja edistäminenAIYritys, jolla on siruydintekniikka.
“Tulkoon laskentatehon inhimillisen kehityksen liikkeellepaneva voima”, Zhonghao Xinyingin liiketoimintasuunnitelma kehittyy tämän vision mukaan.
Yang Gongyifan selitti, että ensimmäinen asia tämän tavoitteen saavuttamiseksi on tehdä siru ensin, koska se on alhaisin infrastruktuuri Kun taustalla oleva infrastruktuuri on valmis, siru voidaan rakentaa täydelliseen toimitusketjuun sen varmistamiseksi, että infrastruktuuri voi Tuotannon jatkuva tarjonta.
Toisaalta on ekologisia kumppaneita, jotka toteuttavat toimialamalleja algoritmitasolla. Zhonghao Xinyingin rooli tässä on itsetutkiskelu ja suurten mallien esikouluttaminen ja niiden avaaminen alan kumppaneille, kuten rahoitus, koulutus ja sairaanhoito.
Suurten mallien aikakaudellaTPUjaMuuntajaArkkitehtuuri on luonnollisesti mukautuvaa.
VerrattunaprosessoriSkalaarilaskentayksikkö jaGPUVektorin laskentayksikkö sisäänTPULaskennalliset tehtävät voidaan suorittaa käyttämällä kaksiulotteisia tai jopa korkeampia laskentayksiköitä.TPUSuunnittelu helpottaa kilokorttiklustereiden toteuttamista, yhdistämistä1024Sirusta tulee32×32Kaksiulotteisen matriisin avulla jokainen siru voi saavuttaa 100 % symmetrian minkä tahansa sirun kanssa koko verkossa.
Hän lisäsi,TPU Arkkitehtuuri on optimoitu syväoppimisratkaisuille ja sitä voidaan käyttää myös laajamittaisiin syväoppimislaskelmiin, kuten Intelligent Computing Network ja Wanka Internet.Yang Gong Yifan sanoi, vaikkaTPUSuorituskyky on suhteellisen heikko monipuolisuuden suhteen, mutta mitä tuleeAISovellusskenaariossa samassa tuotantoprosessissa ja teknologiassaTPUArkkitehtuuriesitys on perinteistäGPU/3-5ajat.
perusti5 Vuonna 2018 Zhonghao Xinying on saavuttanut sirujen massatuotannon ja teollistumisen hetkessä.Tämä oli hänen toinen saavutuksensa hetki, kun T&K-tiimi valvoi koko yön“sytyttää”, tuotteen varmennusprosessi on vielä tuoreessa muistissaan.
NVIDIAan verrattunaA100, jonka on kehittänyt Zhonghao XinyingGPTPU AIharjoitussiru“hetki”Laskennallinen suorituskyky on sen1.5kertaa, energiankulutus vähenee suoritettaessa sama määrä harjoitustehtäviä.30%, yksikön laskentatehon hinta on42%。
"Taize"AIPalvelin on varustettu8 "Hetken" harjoitussiru voi tukea suurten mallien koulutusta ja päättämistä yli 100 miljardilla parametrilla.Yang Gong Yifan paljasti, että nykyisen koulutusjakson aikana toimitettujen tuotteiden joukossa Zhonghao Xinyingin asiakkaat ovat suorittaneetLaama 2Koulutus ja muiden mallien päättely Kcal-klusterissa.
“hetki”Ainutlaatuisella Gundamilla1024Nopeiden sirujen välisten yhteyksien kyky rakentaa laajamittaisia älykkäitä laskentaklustereita“Tainori”, järjestelmäklusterin suorituskyky on perinteinenGPUKymmeniä kertojaAIlaskentavaatimukset.
Zhonghao Xinying voi tehdäTPU Toinen sirun keskeinen kohta on, että Yang Gongyifan sanoi, etteivät he käytä empirismiä rekrytoiessaan insinöörejä.Hän sanoi, että kun he työskentelivät kokeneiden insinöörien kanssa suunnitteluprosessin varhaisessa vaiheessa, he havaitsivat, että nämä insinöörit eivät pystyneet ymmärtämään suunnitteluprosessia.TPUKonsepti- ja suunnitteluinnovaatiot ovat todennäköisemmin sidoksissa toistuviin kokemuksiin eivätkä pysty ajattelemaan suoremmin ratkaistakseen ongelmia ja optimoidakseen suorituskykyä.
Hän kohtasi suuremman laskentatehon kysynnän suurten mallien aikakaudella, ja hän lisäsi, että Wanka-klusterin on oltava saatavilla, jaTPUArkkitehtuurin luonnollinen etu verkottumisominaisuuksissa määrittää sen, että sillä on enemmän etuja Wanka-klustereiden rakentamisessa ja sen suhteellinen suorituskyky on parempi.
Viime vuonna Zhonghao Xinying esitteli myös huippulahjakkuuksia suuren mallialgoritmiryhmän muodostamiseksi.
TPU-arkkitehtuurin ainutlaatuinen suorituskyky voi lisätä yrityssovelluksissa käytettävien ohjelmistojen vapautta ja helpottaa rinnakkaissuunnittelun suorittamista, mikä saavuttaa suorituskyvyn optimoinnin ja järjestelmän rakentamisen.
Yritysten tarpeita paremmin vastaavien ratkaisujen löytämiseksi sirujen pelaajat voivat kouluttaa omia mallejaan ymmärtämään paremmin mallien ominaisuuksia ja sovellusskenaarioita sekä lisäämään asiakastyytyväisyyttä ja -uskollisuutta siruille. Nykyisillä yleiskäyttöisillä suurilla tuotteilla on yleensä vahvat "joustavat" ominaisuudet, kuten tekstin ymmärtäminen, Internet-tiedonhaku ja monivaiheinen dialogi. Kuitenkin erittäin ammattimaisissa teollisissa sovelluksissa on usein vaikeaa ymmärtää liiketoimintatietoa osiin Samaan aikaan yleisten suurten mallien kvantitatiivisten laskelmien tarkkuus on heikko, ja nykyiset laskentaominaisuudet eivät täysin pysty täyttämään alan sovellusskenaarioita, jotka vaativat suurta numeerista tarkkuutta, kuten siviili-ilmailu ja rahoitus.
Tämän perusteella Zhonghao Xinying rakentaa suuren perusmallin, jossa on "jäykät" tuotantoominaisuudet, ja avoimen lähdekoodin suuren perusmallin rahoitus-, koulutus-, lääketieteen ja muiden alan kumppaneiden yhteistyötä varten, jolloin teollisuuskumppanit voivat toteuttaa mallien toistamisen perustuen Ohjelmistopino ja vastaavat tiedot mahdollistavat sen, että mallilla on alan tietovarantoja ja se voidaan toteuttaa asteittain jaetuissa skenaarioissa tiettyjen tuotantoympäristöjen korvaamiseksi.
Viime vuodesta lähtien he ovat tutkineet demon toteuttamista. Toteutettavuuden nähtyään he aloittivat asteittain alan mallien esikoulutuksen tänä vuonna.
Yang Gongyifan uskoo näin täydellisen liiketoiminta-asetelman ja alan trendien arvioinnin myötä, että suurten mallien aikakaudella seuraavien 5–10 vuoden aikana TPU:n ja TPU:n kaltaisten sirujen markkinaosuus AI-laskentalaitteistojen alalla saavuttaa. 80 % ja loput 20 % ovat perinteisiä GPU:ita.
Hän myös selvensi Zhonghao Xinyingin tavoitteita tuotteiden iteraatiossa ja kaupallistamisessa. Zhonghao Xinyingin kehittämien seuraavan sukupolven sirutuotteiden odotetaan vertailevan NVIDIA B200:n suorituskykyä. Kaupallistamisen kannalta se toivoo syventää yhteistyötä useiden asiakkaiden, kuten integraattoreiden, operaattoreiden ja suurten Internet-valmistajien kanssa.
Perustamisestaan vuonna 2018 lähtien Zhonghao Xinying on nähnyt tekoälysirujen kehitystä markkinoiden kehityksen alkuvaiheista tilaisuuksiin, jolloin suuret mallit herättivät kysyntää markkinoilla. Mutta katsottuna taaksepäin, AI-sirumarkkinoiden alussa startup joutui kohtaamaan erilaisia haasteita, jos se halusi vähitellen miehittää markkinaosuuden TPU-arkkitehtuurin kanssa.
Nykyään suuret mallit ovat nostaneet laskentatehon kysyntää, tekoälysirut ovat siirtyneet uuteen aikakauteen ja TPU-arkkitehtuurin edut ovat tulleet esiin, mikä on myös tehnyt Zhonghao Xinyingin odotukset markkinoiden räjähdysmahdollisuudesta etuajassa. Yang Gongyifan sanoi, että hän uskoo, että tekoälyn sovellusskenaariot ylittävät paljon aiemmat tietojenkäsittelyn käyttöskenaariot, ja tekoälymallien vaatimat laskentaresurssit ylittävät myös mielikuvituksen laskentaresursseista ihmiskunnan historiassa. Tämä tekee TPU-arkkitehtuurin sovellusskenaarioista, Markkinoiden kysyntä kasvaa nopeasti lyhyellä aikavälillä.
Tulevaisuudessa hän toivoo, että Zhonghao Xinyingistä voi tulla Kiinan AI-siruteollisuuden johtaja, ja TPU:lla on parhaat mahdollisuudet tulla jotain samanlaista kuin "x86" tällä kappaleella. Uusi luku Kiinan AI-sirun tarinassa on alkanut…
2024 Global AI Chip Summitissa, joka järjestetään 6.–7. syyskuuta tänä vuonna, Yang Gongyifan...