puoliksi merivettä, puoliksi tulia, missä on kotimaan tekoäly chips

puoliksi merivettä, puoliksi tulia, missä on polku kotimaisille tekoälysiruille?

2024-09-21

yleiskatsaus

ai-siruja kutsutaan myös tekoälykiihdyttimiksi tai laskentakorteiksi. teknisen arkkitehtuurin mukaan ne voidaan jakaa yleiskäyttöisiin grafiikkaprosessoriyksiköihin (gpgpu), keskusyksikköihin (cpu), sovelluskohtaisiin integroituihin siruihin (asic) ja kenttäpiireihin. -ohjelmoitavat porttitaulukot (fpga). tekoälyn kehittämisessä tutkijat ovat havainneet, että rinnakkaislaskenta voi suorittaa tehokkaan mallikoulutuksen ja käsitellä laajamittaista monimutkaista dataa. gpgpu:lla on parempi rinnakkaislaskennan suorituskyky kuin muilla siruilla, ja se soveltuu paljon laskentaa vaativiin sovelluksiin, joten siitä on tullut laskentasirujen valtavirta.

toiminnallisen luokituksen mukaan ai-sirut voidaan jakaa kahteen tyyppiin: harjoituskortit ja päättelykortit. harjoituskorteilla, joita kutsutaan myös suuriksi korteiksi, on yleensä suurempi laskentateho ja muistin kaistanleveys, jotta ne tukevat suurta määrää laskelmia ja tietojenkäsittelyä harjoitusprosessin aikana. päättelykorteilla, joita kutsutaan myös pieniksi korteiksi, on alhaisemmat parametrit ja niiden on täytettävä vain päättelyvaatimukset . yleisesti ottaen harjoituskortteja voidaan käyttää päättelykorttina, mutta päättelykortteja ei voi käyttää harjoituskortteina. yksinkertaisesti sanottuna suurten mallien koulutus vaatii suuren määrän koulutuskortteja näytönohjaimen klusterin muodostamiseksi, kun taas sovelluksissa tarvitaan päättelykortteja tekoälymallin suorittamiseen laskelmia varten.

tämän tekoälyn aallon käynnisti chatgpt, ja se käyttää suuria kielimalleja ja generatiivisia tekoälysovelluksia lähtökohtana. googlen vuonna 2017 julkaisemisesta lähtien transformeria on käytetty laajalti luonnollisen kielen käsittelyssä, tietokonenäössä, autonomisessa ajamisessa ja muilla aloilla, sen lisäksi, että se on tuonut suosittuja c-puolen tuotteita, kuten chatgpt:tä. kiinalaiset ja ulkomaiset teknologiayritykset lisäävät edelleen investointejaan liittyville aloille, mukaan lukien google, meta, microsoft, bytedance, baidu ja muut kotimaiset ja ulkomaiset teknologiajättiläiset ja start-up-yritykset, jotka kaikki toivovat saavansa osuuden piirakasta. teknologiayritykset investoivat jatkuvasti lahjakkuuteen ja teknologiaan sekä resurssien sijoitteluun. bloomberg intelligencen ennustetietojen mukaan vuoteen 2032 mennessä generatiivisen tekoälyn osuus tietotekniikan laitteisto-, ohjelmisto-, palvelu-, mainonta-, peli- jne. kokonaismenoista voi kasvaa nykyisestä alle 1 prosentista 12 prosenttiin.

kaavio 1: globaalit generatiiviset tekoälytulot ja ennuste 2020–2032e (yksikkö: 1 miljardi dollaria)

tietolähde: bloomberg intelligence, lai mi -tietojen lajittelu

vuonna 2018 openai lanseerasi ensimmäisen sukupolven esikoulutuskielimallin gpt-1, jossa on 117 miljoonaa parametria. vuonna 2023 julkaistujen gpt-4-parametrien määrä on noin 1,8 biljoonaa. parametrien lukumäärän yli 10 000-kertainen kasvu viidessä vuodessa on lisännyt eksponentiaalisesti suurten mallien laskentatehovaatimuksia. openai arvioi, että vuodesta 2012 lähtien maailmanlaajuisen ai-mallin koulutuksen laskentatehovaatimukset ovat kaksinkertaistuneet 3-4 kuukauden välein. varsinkin vuoden 2023 jälkeen tekoälyn kehitys on täydessä vauhdissa. kotimaiset ja ulkomaiset valmistajat ovat lisänneet investointejaan generatiiviseen tekoälyyn, ja "sattojen mallien taistelu" on alkanut myös pitkään .

kaavio 2: kiinan älykkään laskentatehon mittakaava ja ennuste vuosina 2019–2026e (yksikkö: 100 miljoonaa yuania)

tietolähde: idc, lai mi -tietojen lajittelu

algoritmitutkimuksen ja joidenkin mallien avoimen lähdekoodin yhteydessä kotimaiset suuret mallit ovat edenneet nopeasti, ja monet kotimaiset suuret tekoälymallit väittävät, että niiden yksilölliset ominaisuudet ovat saavuttaneet gpt-4:n. toistaiseksi suurin kuilu kotimaisten ja ulkomaisten tekoälyominaisuuksien välillä on pääasiassa tekoälysiruissa. tunnetuista syistä kotimaiset teknologiayritykset eivät vain pysty ostamaan kehittyneitä ai-siruja, vaan jopa kokonaisratkaisulla on ai-sirujen valmistaminen yksinään tullut erittäin vaikeaksi. tätä taustaa vasten kotimaisilla tekoälysiruilla on valtava kasvupotentiaali.

ai-sirut ovat voittaja-take all -peli. nvidian monopoli tekoälysiruihin riittää pelottamaan useimmat kilpailijat. laimi-tutkimuslaitos uskoo, että ai-sirujen vaikeus heijastuu pääasiassa kolmeen näkökohtaan, jotka ovat yhden kortin suorituskyky/klusterin suorituskyky, ekologia/joustavuus ja valmistuksen vaikeus/kustannustehokkuus. yhdistämällä nämä kolme näkökohtaa nvidialla on kattavin vahvuus, joten se on saavuttanut yli 90 %:n markkinaosuuden ai-sirujen markkinoilla.

miten kotimaiset yritykset ja teollisuudenalat edistyvät? olemme laskeneet asiaankuuluvien kotimaisten ja ulkomaisten ai-siruyritysten erityisparametrit, ja voimme nähdä, että yksittäisten korttien suorituskyvyssä on edelleen eroa kotimaisten ja ulkomaisten ai-sirujen välillä, mutta suurempi ero tulee wanka internetistä ja ekologisesta rakentaminen koulutuspuolella. kaiken kaikkiaan kotimaisilla ai-siruilla on pitkä matka pitkällä aikavälillä.

kaavio 3:kotimaiset ja ulkomaiset ai-sirujen valmistajat, tuotteet ja tekniset ominaisuudet

tietolähde: julkinen tieto, lai mi -tietojen lajittelu

kotimaiset ai-sirut keskittyvät pääasiassa päättelypuolellenvidiadislokaatiokilpailu on avautumassa. toisaalta ai-tekniikan kehittymisen ja yleistymisen myötä alan kysyntä tehokkaille, vähätehoisille tekoälysiruille kasvaa. on kuitenkin olemassa myös koulutuspuolen sirujen valmistajia, jotka laativat suunnitelmia vuoden 2024 global ai chip summit -tapahtumassa , se tukee kolmen tai useamman heterogeenisen gpu:n sekoitettua koulutusta samalla suurella alustalla. moore thread julkisti mtt s4000 -pohjaisen wanka-älyklusterin kuae (kuae) koulutukseen ja testaukseen. myös valmistajat, kuten huawei, cambrian ja haiguang information, ovat tehneet samanlaisia liikkeitä.

ai-siruliiketoiminnan aloittaminen on erittäin vaikeaa. laimi-tutkimuslaitos uskoo, että ai-siruliiketoiminnan aloittamisen ensimmäinen vaikeus on ratkaista sirusuunnitteluun ja valmistukseen liittyviä kysymyksiä. ulkomaisten rajoitusten vuoksi niihin liittyviä suunnittelutyökaluja on valvottu. valmistusongelma on kuitenkin realistisempi ongelma. nvidian uusin ai-siru käyttää tällä hetkellä 4nm-prosessia, kun taas manner-kiinan sirujen valmistusominaisuudet ovat hieman riittämättömät.

toinen on markkinaongelmat. kotimaiset ai-sirut ostavat edelleen kotimaisia ai-siruja omiin tarpeisiinsa (esimerkiksi valmistajat, kuten bytedance, suunnittelevat omat ai-sirunsa kysynnän perusteella). toisaalta suuret mallit nopeuttavat tekoälysirujen kehitystä, toisaalta ne myös laajentavat siruvalmistajien välistä kuilua. kotimaisten tekoälysirujen valmistajien on harkittava, mitä erityistarpeita heidän tuotteensa voivat vastata asiakkaiden tarpeisiin, ennen kuin asiakkaat ovat valmiita maksamaan korkeita palkkioita.

kolmas on kannattavuus. tunnetuista syistä johtuen tekoälysirujen tutkimus- ja kehityssyklit ovat pitkiä, intensiivisiä ja kalliita, ja näitä investointeja on usein vaikea saada takaisin lyhyellä aikavälillä. siksi on erittäin tärkeää saada hematopoieettinen kyky. ensimarkkinoiden nykyisessä dynamiikassa on äärimmäisen epätodennäköistä luottaa pelkästään riskipääomamarkkinoihin verensiirrossa. tekoälysiruyritysten positiivinen kassavirta on myös testaamisen arvoinen.

investointi- ja rahoitusuutisia

ai-sirumarkkinat ovat osoittaneet voimakasta kasvuvauhtia viime vuosina. maailman ai-sirumarkkinoiden koon odotetaan nousevan 71,252 miljardiin dollariin vuonna 2024, mikä on 33 %:n vuosikasvu, ja sen odotetaan kasvavan edelleen 91,955 miljardiin dollariin vuonna 2025. kiinan markkinoilla tekoälysirumarkkinoiden koko saavuttaa 120,6 miljardia yuania vuonna 2023, mikä on 41,9 prosentin vuosikasvu, ja sen odotetaan kasvavan 141,2 miljardiin juaniin vuonna 2024. laimin tietojen mukaan ai-sirut ovat myös yksi tämän vuoden aktiivisimmista raiteista. kiinnostuneet lukijat voivat kirjautua rime pevc -alustalle saadakseen täydet rahoitustapaukset, investoidut projektit ja syvällisen tietoanalyysin tekoälypiirin radasta.

tietolähde:tule etsimään dataa

näkymät

suuren mallin vallankumouksen pyyhkäistäessä maailmaa laskentatehon kysyntä saavuttaa uusia korkeuksia, mikä edistää pilvi-, reuna- ja sivutekoälypiirien iteraatiota ja kehitystä. datan räjähdysmäisen kasvun, teknologian fyysisten rajojen lähestymisen ja monimutkaisen ja epävakaa kansainvälisen tilanteen kolmen pilven alla monet tekoälysiruyritykset etenevät paineen alla hillitysti ja pragmaattisesti valmistautuen aktiivisesti aikakauden tuomiin mahdollisuuksiin. generatiivisen tekoälyn aallon kautta.

kuten elon musk sanoi: vain raaka-aineet ovat ainoa rajoitus, ja kaikki valmistuksen osa-alueet voidaan keksiä kokonaan uudelleen. tekoälyn valtava potentiaali luo varmasti biljoonien markkinoiden kokoa. "jukkuun jääminen" on vain väliaikaista edistyneiden prosessien ja pääomasijoitusten läpimurron myötä etäisyys meidän ja ulkomaisten tekoälyn välillä on pikemminkin pienentynyt kuin kasvamassa. kotimaisen korvaamisen tila on valtava, ja myös lähiyritykset tuovat nopeita kasvumahdollisuuksia.

loppupeliajattelu vaatii voittajan lukitsemista. tulevaisuuden maailma vaatii ääretöntä laskentatehoa, mutta yhdysvaltojen markkinoiden kilpailutilanteen perusteella voittajia voi olla vain muutama. tekoälysirujen voittaja-take-all -luonteen vuoksi uskomme, että kotimaisilla tekoälysiruyhtiöillä on oltava tekninen vahvuus, kanavavalmiudet ja rahoitusmahdollisuudet voittaakseen. nämä ominaisuudet asettavat valtavia haasteita startup-yrityksille, mutta ne luovat myös teollisuuden esteitä.

lähde: rimedata lai mi data tekijä: lai mi research institute

uutiset

puoliksi merivettä, puoliksi tulia, missä on polku kotimaisille tekoälysiruille?

johdanto

yhteystietoni