kuka voi tulla nvidia-korjaajaksi?

2024-09-23

kirjailija丨 barry

toimittaja丨guan ju

kuvan lähde 丨 midjourney

kuka voi korvata nvidian?

datakeskusten gpu-alueella nvidian toimitukset nousevat 3,76 miljoonaan yksikköön vuonna 2023, mikä vastaa lähes 98 % maailmanlaajuisesta markkinaosuudesta, jonka voidaan sanoa olevan vertaansa vailla.

ai-sirut, jotka tunnetaan myös nimellä ai-kiihdyttimet tai laskentakortit, ovat moduuleja, joita käytetään erityisesti käsittelemään lukuisia laskentatehtäviä tekoälysovelluksissa. ne sisältävät pääasiassa grafiikkaprosessoreja (gpu), kenttäohjelmoitavia porttitaulukoita (fpga) ja sovelluskohtaisia. integroidut piirit (asic) jne.

gartnerin mukaan tekoälysirujen markkinat saavuttavat 53,4 miljardia yhdysvaltain dollaria vuonna 2023, mikä on 20,9 % kasvua vuodesta 2022, ja kasvavat 25,6 % 67,1 miljardiin dollariin vuonna 2024. vuoteen 2027 mennessä tekoälysirujen tulojen odotetaan yli kaksinkertaistuvan markkinoiden koon vuonna 2023 ja saavuttavan 119,4 miljardia dollaria.

suurten suuryritysten järjestämästä laskentatehon asekilpailusta on epäilemättä tullut vahva tekoälypiirimarkkinoiden liikkeellepaneva voima.

vuodesta 2024 lähtien lähes kaikissa valtavirran suurissa malleissa on yli 100 miljardia parametria, llama3:lla 400 miljardia parametria ja gpt4:llä 1,8 biljoonaa parametria. suuri malli, jossa on biljoonia parametreja, vastaa supersuuria laskentatehoklusteria, jonka mittakaava on yli 10 000 kilotavua.

openai:lla on vähintään 50 000 huippuluokan nvidia-grafiikkasuoritinta, meta on rakentanut oman super-10 000 kortin klusterin, joka koostuu 24 576 h100:sta, ja googlella on a3-supertietokone, joka koostuu 26 000 h100:sta... yli 40 000 gpu-yritystä on ostanut nvidia-yritystä, kuten meta, microsoft, amazon ja google tuottivat yhteensä 40 % sen tuloista.

taloudellinen raportti osoittaa, että nvidian bruttokate oli 71%, josta a100- ja h100-sarjojen bruttokate oli jopa 90%. laitteistoyrityksenä nvidian bruttokate on suurempi kuin internet-yrityksillä.

on raportoitu, että nvidian palvelinkeskuksiin tarkoitettujen tekoälysirujen hinta on 25 000-40 000 us$ kappaleelta, mikä on 7-8 kertaa perinteisten tuotteiden hinta. tutkimusyhtiö omdian konsulttijohtaja kazuhiro sugiyama sanoi, että nvidian tuotteiden korkeat hinnat ovat taakka yrityksille, jotka haluavat investoida tekoälyyn.

korkea myyntihinta on myös saanut monet suurasiakkaat etsimään vaihtoehtoja. apple ilmoitti 30. heinäkuuta, että sen tekoälymalli on koulutettu 8 000 googlen tpu:lla. openai:n ensimmäinen siru paljastettiin myös tänään. se käyttää tsmc:n edistyneintä a16-angstrom-tason prosessia ja on suunniteltu erityisesti sora-videosovelluksiin.

ympäri maailmaa ai-sirutähtien startuppeja ja yksisarvisia on noussut esiin yksi toisensa jälkeen yrittäen varastaa ruokaa nvidiasta. heidän joukossaan ovat kiinan tukemat yksisarviset sambanova ja äskettäin nouseva etched sekä openai:n toimitusjohtaja altmanin sijoittama yksisarvinen cerebras systems, joka pyrkii listautumaan softbank groupin presidentti masayoshi sonin listattuaan arm:n viime vuonna tämän vuoden heinäkuussa se osti graphcoren, brittiläisen ai-siruyhtiön, yrittääkseen rakentaa seuraavan nvidian.

sambanova, kiinalaisten stanfordissa rakentama ai-siru yksisarvinen

27. elokuuta yhdysvaltalainen ai-sirun startup sambanova esitteli ensimmäistä kertaa yksityiskohtaisesti äskettäin lanseeratun maailman ensimmäisen ai-sirujärjestelmän biljoonan parametrin mittakaavan tekoälymalleille - perustuu reconfigurable data flow unit (rdu) -ai-siruun sn40l. .

raporttien mukaan sambanovan sn40l:ään perustuva 8-siruinen järjestelmä voi tarjota tukea 5 biljoonalle parametrimallille, ja sekvenssin pituus yhdessä järjestelmäsolmussa voi nousta 256 000+. yingwein h100-siruun verrattuna sn40l ei ainoastaan saavuta 3,1 kertaa h100:n päättelytehoa, vaan myös kaksinkertaistaa harjoitussuorituskyvyn, ja kokonaisomistuskustannukset ovat vain 1/10.

sambanovan toimitusjohtaja rodrigo liang

yrityksen kolmella perustajalla on stanfordin tausta. kaksi muuta perustajaa ovat myös stanfordin professoreita.

sambanovan arvo on tällä hetkellä 5 miljardia dollaria (noin 36,5 miljardia juania), ja se on suorittanut 6 rahoituskierrosta yhteensä 1,1 miljardin dollarin arvosta. sijoittajat ovat intel, softbank, samsung, google venture jne.

ne eivät ainoastaan haasta nvidiaa siruilla, vaan ne menevät myös nvidiaa pidemmälle liiketoimintamallin suhteen: osallistuvat suoraan yritysten auttamiseen kouluttaa yksityisiä suuria malleja. ja siruja ei myydä yksinään, vaan niiden räätälöityjä teknologiapinoja siruista palvelinjärjestelmiin ja jopa suurten mallien käyttöönottoon.

sen tavoitteet kohdeasiakkaille ovat vieläkin suuremmat – se on suunnattu maailman 2 000 suurimmalle yritykselle. tällä hetkellä sambanovan sirut ja järjestelmät ovat saaneet monia suuria asiakkaita, mukaan lukien maailman johtavat supertietokonelaboratoriot, japanilainen fugaku, yhdysvaltalainen argonne national laboratory, lawrence national laboratory ja konsulttiyritys accenture.

rodrigo liang uskoo, että seuraava taistelukenttä suurten mallien ja generatiivisen tekoälyn kaupallistamiselle on yritysten, erityisesti suuryritysten, yksityiset tiedot. loppujen lopuksi yritys luo 150 ainutlaatuista mallia, jotka perustuvat erilaisiin datan osajoukkoon, sen sijaan, että käyttäisivät yhtä hyvin suurta mallia, kuten gpt-4 tai google gemini, yli biljoonalla aggregoidulla parametrilla.

tämä strategia on jyrkässä ristiriidassa gpt-4:n ja google geminiin kaltaisten lähestymistapojen kanssa, jotka enimmäkseen toivovat luovansa jättiläismallin, joka voi yleistää miljooniin tehtäviin.

etched, kahden 2000-luvulla syntyneen harvardin keskeyttäneen perustaman tekoälysiruyritys

etchedin perustajat ovat kaksi vuonna 2000 syntynyttä harvardin keskeyttäjää. gavin uberti on toiminut johtavissa tehtävissä octoml:ssä ja xnor.ai:ssa, kun taas chris zhu on kiinalainen harvardin yliopiston tietojenkäsittelytieteen opettajan lisäksi hänellä on työharjoittelukokemusta esimerkiksi amazonissa.

he olivat optimistisia suurten mallien suunnan suhteen ennen chatgpt:n julkaisua, joten he lopettivat harvardin yliopiston vuonna 2022 ja perustivat yhdessä robert wachenin ja entisen cypress semiconductorin teknologiajohtajan mark rossin kanssa suuria sirujen malleja.

gavin uberti (vasemmalla) ja chris zhu (oikealla)

he valitsivat ainutlaatuisen reitin: he kykenivät käyttämään vain transformerin ai-sirua ja ottivat käyttöön asic-suunnittelun. tällä hetkellä lähes kaikki markkinoilla olevat ratkaisut tukevat laajalti tekoälymalleja, ja he ovat päättäneet transformer-mallin hallitsevan koko markkinoita vuoden 2022 lopusta alkaen. he uskovat, että gpu-suorituskyvyn päivitykset ovat liian hitaita, ja ainoa tapa on käyttää erikoistuneita asic-siruja. vain tällä tavalla voimme saavuttaa harppauksen suorituskyvyssä.

kahden vuoden kuluttua etched julkaisi ensimmäisen ai-sirun sohu-sovelluksen 27. kesäkuuta tänä vuonna, ja siitä tuli maailman ensimmäinen transformer-laskentaan omistettu siru.

se käyttää suuria malleja 20 kertaa nopeammin kuin nvidia h100 ja yli 10 kertaa nopeammin kuin huippuluokan siru b200, joka lanseerattiin tämän vuoden maaliskuussa. kahdeksalla sohu-sirulla varustettu palvelin voi korvata täydet 160 nvidia h100 gpu:ta. vaikka kustannukset pienenevät huomattavasti, suorituskyky ei heikkene.

koska sohu tukee vain yhtä algoritmia, suurin osa ohjausvirtamoduuleista voidaan poistaa. siru voi integroida enemmän matemaattisia laskentayksiköitä, ja laskentatehon käyttö voi olla yli 90%, kun taas gpu voi tehdä vain 30%. pienelle suunnittelutiimille yhden arkkitehtuurin ohjelmistopinon ylläpitäminen on luonnollisesti vähemmän stressaavaa.

samaan aikaan kun sohu-siru julkaistiin, etched ilmoitti myös saaneensa päätökseen 120 miljoonan dollarin a-sarjan rahoituksen, jota johtivat yhdessä primary venture partners ja positive sum ventures.

tämän rahoituskierroksen suurimpia sijoittajia ovat tunnettu piilaakson sijoittaja peter thiel, kryptovaluuttakaupankäyntialustan coinbasen entinen teknologiajohtaja ja entinen a16z:n pääosakas balaji srinivasan, githubin toimitusjohtaja thomas dohmke, cruisen toinen perustaja kyle vogt ja quora yhdessä perustaja charlie cheever ja lisää.

cerebras systems, ultramanin sijoittama tekoälysiru yksisarvinen, aikoo kiirehtiä listautumiseen

ainutlaatuisinta vuonna 2015 perustetussa cerebras systemsissä on se, että sen sirut eroavat suuresti nvidian tavanomaisista gpu:ista. aiemmin sirut ovat pienentyneet mooren lain ohjauksessa. esimerkkinä nvidia h100:ssa on 80 miljardia transistoria 814 neliömillimetrin ydinalueella.

cerebrasin ai-siru päättää tehdä koko sirusta yhä suuremman ja väittää luoneensa "maailman suurimman alueen sirun". raporttien mukaan cerebrasin kehittämä wse 3 -siru leikataan kokonaisesta kiekosta, joka on suurempi kuin lautanen ja vaatii henkilön pitämään sitä ylhäällä molemmin käsin. wse 3 -sirussa on 4 000 miljardia transistoria (50 kertaa enemmän kuin h100) yli 46 000 neliömillimetrin ydinalueella.

levyä suuremmat lastut vaativat molempien käsien pitämistä. lähde: ars technica

cerebras väittää, että heidän sirunsa kouluttaman tekoälyn suuren mallin koko on 10 kertaa suurempi kuin nykyisen alan suurimmat suuret mallit (kuten openai:n gpt-4 tai googlen gemini).

27. elokuuta tänä vuonna cerebras systems ilmoitti käynnistävänsä ai-johtopäätöspalvelun cerebras inference, joka on laskettu "maailman nopeimmaksi". virallisen verkkosivuston mukaan tämä päättelypalvelu on 20 kertaa nopeampi kuin nvidian palvelu, samalla kun se varmistaa, että sen prosessorin muistin kaistanleveys on 7 000 kertaa nvidia:n hinta, kun taas hinta on vain 1/5 gpu:sta ja hinta/suorituskykysuhde on. kasvoi 100 kertaa. cerebras inference tarjoaa myös useita palvelutasoja, mukaan lukien ilmaiset, kehittäjä- ja yritystasot, vastaamaan erilaisiin tarpeisiin pienimuotoisesta kehityksestä laajamittaiseen yrityskäyttöön.

yksi perustajista ja toimitusjohtaja andrew feldmanilla on mba-tutkinto stanfordin yliopistosta, ja teknologiajohtaja gary lauterbach on tunnustettu yhdeksi alan parhaista tietokonearkkitehdeistä. vuonna 2007 he perustivat mikropalvelinyrityksen seamicron, jonka amd osti 334 miljoonalla dollarilla vuonna 2012, ja myöhemmin he liittyivät amd:hen.

ulkomaisten tiedotusvälineiden mukaan cerebras systems on salaa hakenut listautumista yhdysvaltoihin ja listataan heti lokakuussa 2024. tällä hetkellä yhtiö on kerännyt 720 miljoonaa dollaria ja sen arvo on noin 4,2 miljardia dollaria 5 miljardiin dollariin yksi suurimmista yksittäisistä sijoittajista on openai:n toimitusjohtaja sam altman. altmanin kerrotaan osallistuneen cerebrasin 81 miljoonan dollarin d-sarjan rahoitukseen.

tenstorrentista, johon liittyy legendaarinen sirumestari, tulee nvidian "korvaaja"

ennen vuotta 2021 tenstorrent oli vielä tuntematon yritys. yrityksestä tuli kuitenkin jonkin aikaa kuuluisa, kun jim keller, puolijohdeteollisuuden suuri hahmo, joka tunnetaan nimellä "silicon immortal", ilmoitti liittyvänsä yritykseen teknologiajohtajaksi ja toimitusjohtajaksi.

jim kellerin uraa voidaan kutsua tietokoneteollisuuden historiaksi. vuodesta 1998 vuoteen 1999 jim keller työskenteli athlonia tukevien k7/k8-arkkitehtuurien parissa vuosina 2008-2012, hän otti johtoaseman a4- ja a5-prosessorien kehittämisessä applella vuosina 2012-2015. hän toimi k12 arm:n puheenjohtajana projekti amd:llä, zen-arkkitehtuuriprojekti vuosina 2016–2018, hän kehitti fsd-autopilottisiruja teslassa, ja vuosina 2018–2020 hän osallistui mystisiin projekteihin intelillä.

jim keller liittyy tenstorrentiin toivoen tarjoavansa "korvaa" nvidian kalliille gpu:ille. hän uskoo, että nvidia ei palvele tiettyjä markkinoita hyvin, ja nämä markkinat ovat juuri niitä, joita tenstorrent yrittää kaapata.

tenstorrent sanoo, että sen galaxy-järjestelmä on kolme kertaa tehokkaampi ja 33 % halvempi kuin nvidia dgx, maailman suosituin tekoälypalvelin.

raporttien mukaan tenstorrentin odotetaan julkaisevan toisen sukupolven monikäyttöisen tekoälyprosessorin ennen tämän vuoden loppua. tenstorrentin viime syksyn viimeisimmän etenemissuunnitelman mukaan yritys aikoo julkaista black hole - itsenäisen tekoälyprosessorin ja quasar-pienitehoiset ja edullisia siruja monisiruisiin tekoälyratkaisuihin.

yhtiö väittää, että sen tulevat prosessorit tarjoavat suorituskykyä, joka on verrattavissa nvidian ai-grafiikkasuorittimiin. samaan aikaan tenstorrent sanoo, että sen arkkitehtuuri kuluttaa vähemmän muistin kaistanleveyttä kuin kilpailijansa, mikä on keskeinen syy sen korkeampaan tehokkuuteen ja alhaisempiin kustannuksiin.

tentorrent-sirun pääominaisuus on, että jokaisessa sen yli 100 ytimessä on pieni prosessori, "aivot aivoissa". hylätäänkö tietyt tiedot, joita pidetään ei-toivottuina tarpeellisina tehtävinä, mikä lisää yleistä tehokkuutta.

tähän mennessä tentorrent on suorittanut vähintään 6 rahoituskierrosta. aikaisemmin tentorrentin sijoittajat olivat pääosin riskipääomaa, eli jim kellerin liittymisen jälkeen yhtiö sai päätökseen uuden 100 miljoonan dollarin rahoituskierroksen elokuussa 2023 ja sijoittajien joukossa alkoi näkyä teollista pääomaa - hyundai automotive group ja samsung catalyst fund. , samsungin pääomasijoitusyhtiö.

softbank ostaa graphcoren alennuksella luodakseen kilpailijan nvidialle

graphcoren perustivat vuonna 2016 cto simon knowles ja toimitusjohtaja nigel toon. yritys on sitoutunut kehittämään intelligence processing unit (ipu) -prosessorin, joka on erityisesti suunniteltu tekoälyyn ja koneoppimiseen ja jolla on ainutlaatuinen arkkitehtuuri ja etuja, kuten massiivisesti rinnakkainen mimd-arkkitehtuuri, suuri muistin kaistanleveys ja tiiviisti kytketty paikallinen distributed sram jne.

graphcore on peräkkäin julkaissut useita ipu-pohjaisia tuotteita, kuten gc200 ipu-prosessorin, bow ipu:n jne., ja jatkaa teknisten päivitysten ja parannusten tekemistä.

kuitenkin tämän vuoden heinäkuussa softbank osti tämän vaikeuksissa olevan brittiläisen ai-siruyrityksen.

sopimuksen mukaan graphcoresta tulee softbankin kokonaan omistama tytäryhtiö ja se jatkaa toimintaansa nykyisellä nimellä. raporttien mukaan kaupan kokonaisarvo voi olla noin 400 miljoonaa puntaa (noin 500 miljoonaa yhdysvaltain dollaria, 3,56 miljardia juania), mikä on noin 82 % pienempi kuin graphcoren viimeisen 2,8 miljardin dollarin rahoituskierroksen arvo. softbank osti sen vain 20% alennuksella.

graphcorea pidettiin kerran "nvidian brittiläisenä versiona". vuodesta 2020 lähtien yritys ei kuitenkaan ole saanut uusia investointeja, ja se on myös menettänyt tärkeitä tilauksia microsoftilta. tämä on vaikeuttanut sitä taloudellisesti ja toiminnallisesti, eikä se ole pysynyt ai-sirujen yleisessä trendissä. samaan aikaan yhdysvallat jatkaa kiinan tekoälypuolijohteiden vientivalvonnan tiukentamista, mikä vaikuttaa myös graphcoren kehitykseen kiinassa. lopulta se joutui vetäytymään kiinan markkinoilta ja menettämään neljänneksen kokonaistuloistaan.

tämä graphcoren hankinta ei ainoastaan vahvista softbankin asemaa tekoälysirujen alalla, vaan on myös tärkeä askel sonin tekoälystrategiassa.

entiset google-insinöörit perustivat groqin luodakseen uudenlaisen lpu-lajin

tämän vuoden elokuussa groq ilmoitti saavansa päätökseen 640 miljoonan dollarin d-sarjan rahoituksen. sijoittajat ovat blackrock, cisco investments, samsung catalyst fund, jne., joiden arvo on 2,8 miljardia dollaria.

entisen google-insinöörin jonathan rossin vuonna 2016 perustama yritys väittää, että sen kielenkäsittelyyksikön laitteisto lpu pystyy ajamaan olemassa olevia genai-malleja, kuten gpt-4:ää, kymmenen kertaa nopeammin kuluttaen samalla vain kymmenesosan energiasta. yritys teki uuden suuren kielimallin (llm) suorituskykyennätyksen käyttämällä meta's llama 2:ta, 300 merkkiä sekunnissa käyttäjää kohti.

gpu:n monipuolisuuteen verrattuna, vaikka lpu toimii hyvin kielenkäsittelyssä, sen sovellusalue on kapea. tämä rajoittaa niiden yleistettävyyden laajempiin tekoälytehtäviin. lisäksi lpu ei ole nousevana teknologiana vielä saanut laajaa tukea yhteisöltä, ja myös käytettävyys kohtaa haasteita.

groq aikoo ottaa käyttöön yli 108 000 lpu:ta vuoden 2025 ensimmäisen vuosineljänneksen loppuun mennessä, mikä on suurin tekoälyn johtopäätös suurten teknologiajättien ulkopuolella.

uutiset

kuka voi tulla nvidia-korjaajaksi?

johdanto

yhteystietoni