uutiset

NVIDIA on tullut vaikeisiin aikoihin, miksi olemme edelleen optimistisia?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teksti |. Shidao AI Group, toimittaja |

NVIDIA on ollut vaikeuksissa viime aikoina, ja se on iso juttu.

Ensimmäinen on "ulkomainen aggressio" Jatkuvien "pienten liikkeiden" vuoksi yritys on edessään Yhdysvaltain oikeusministeriön kilpailunrajoitustutkimuksessa.

Toinen on "sisäiset huolet" tuotteen suunnitteluvirheiden vuoksi uuden Blackwell-sirun toimitusaika viivästyy kolmella kuukaudella.

Viime viikolla Nvidian osakekurssi laski vuoristorataa - tiistaina se nousi lähes 13% torstaina, se laski 7% päivän sisällä.Jopa volatiliteettia tarkasteltaessa Nvidia on ohittanut Bitcoinin.Sen 30 päivän optio merkitsi äskettäin volatiliteetin nousua 48 prosentista 71 prosenttiin, kun taas Bitcoin DVOL -indeksi putosi 68 prosentista 49 prosenttiin.

Tunnettu hedge-rahasto Elliott kertoi sijoittajille: Nvidia on "kuplassa" ja tekoälyteknologiaa on kehuttu liikaa. Virasto sanoi, että Nvidian suurimmat asiakkaat kehittävät omia sirujaan ja epäilivätkö jättiläiset ostavat jatkossakin Nvidian GPU:ita suuria määriä. Milloin kupla puhkeaa? Elliott uskoo, että jos Nvidian taloudellinen tulos on huono, voi tapahtua repeämä.

On kiistatonta, että Nvidia on tulossa "levottomaan aikaan", mutta on vielä liian aikaista olla "taistelussa kaikilla puolilla".

Valvonta kohdistuu erityisesti NVIDIAn "seitsemään tuumaan", joka on vakaa, mutta ei armoton

Heinäkuun alussa Ranska ampui ensimmäisen kilpailunrajoituslaukauksen NVIDIAa vastaan. Seuraavina viikkoina Nvidia oli myös Yhdysvaltain oikeusministeriön kohteena.

Tiedot kertoivat, että Yhdysvaltain oikeusministeriön tutkijat vierailivat Nvidian "vastustajien" ja "asiakkaiden" kodeissa kerätäkseen kaikkien syytöksiä.

Väite 1: NVIDIA uhkaa asiakkaita.Kun ostat AMD-siruja, Nvidia voi nostaa hintaa puolestasi tai jopa vähentää alunperin luvattuja GPU-toimituksia.

Väite 2: Nvidia pakotti verkkokaapeleiden ja telineiden jakeluun.Suuria kärsijiä ovat: Microsoft, Google, Amazon...

Kerran saadakseen ensisijaisia ​​toimitusoikeuksia Microsoft puristi hampaitaan ja osti Nvidian verkkokaapelit Kun tilit selvitettiin vuoden 2023 alussa, havaittiin, että 1/3 Nvidialle maksetuista rahoista käytettiin näihin "reunatuotteisiin". . On raportoitu, että Nvidian verkkokaapelien myynti on yli kolminkertaistunut 3,2 miljardiin dollariin, mikä on 14 prosenttia sen datakeskusten kokonaistuloista.

Tänään myös Nvidian varapresidentti Andrew Bell sanoi: "Joka ostaa hyllyn, on etusijalla GB200:n hankkimisessa."
Microsoft pakeni katastrofilta viikkojen "kiistelyn" jälkeen, kun taas Amazon ja Google ovat molemmat sopineet pakotuksestaan.

Kolmas väite: Nvidia ostaa Run:ai:n.Kauppa julkistettiin virallisesti tämän vuoden huhtikuun lopussa, ja kauppahinta oli 700 miljoonaa dollaria.

Run:ai on israelilainen startup-yritys, joka on keskittynyt yksinkertaistamaan tekoälysovelluksia ja grafiikkasuorittimien työtaakkaa tehden AI-siruista tehokkaampia, mikä puolestaan ​​auttaa vähentämään tehtävien suorittamiseen tarvittavien Nvidian GPU:iden määrää.

Nvidian integrointi Run:ai:n toimivuuteen olemassa oleviin tuotteisiin ei ainoastaan ​​"tappaa" vastustajien mahdollisuutta käyttää sitä,Se on myös lisännyt DGX- ja DGX Cloud -kattavuuttaan.

Lao Huang Zaoyun on ""hyvä pakopaikka" NVIDIAlle välttääkseen muuttumasta Ciscoksi." Yksi on se, että pilvi- ja ohjelmistoyritykset tuottavat miljardeja dollareita vuosittain. Toinen on se, että Nvidialla on "kaikki keinot" kehittää palveluita, jotka täydentävät sen siruja.

Olipa kyse yllä mainituista "tiukasti allokoivista GPU:ista", "tavaroiden jakeluun osallistumisesta ja pakkoostosta ja -myynnistä" tai "pilven ja ekosysteemin rakentamisesta", nämä ovat kaikki Huang Renxunin "kovia liikkeitä" NVIDIA-imperiumin lujittamiseksi. pitkällä aikavälillä. Loppujen lopuksi hänen tavoitteensa on, että jokainen yritys maailmassa... käyttää Nvidia AI Enterprisea.

Siksi tätä Yhdysvaltain oikeusministeriön tutkimusta voidaan kuvata "vakaaksi ja tarkaksi" ja se osui Nvidian "seitsemään tuumaan".

Mutta se, onko armoton vai ei, on toinen asia. Kilpailunrajoitustutkimukset kestävät usein vuosia, eikä hallitus voi lopulta nostaa syytteitä kohdeyritystä vastaan. Vaikka oikeudenkäynti käynnistetään, tapaus saattaa venyä vuosia ennen kuin se saadaan päätökseen.

Esimerkiksi vuoden 2020 Google-haun kilpailuoikeusjuttu tuli oikeudenkäyntiin vasta tänä vuonna, eikä tapauksesta vastaava tuomari ole vielä antanut päätöstä.

Yhteenvetona voidaan todeta, että vaikka tämä kartellitutkimus tulee kiivaasti ja nopeasti, näyttää siltä, ​​​​että se ei voi vahingoittaa GPU-imperiumin perustaa.

Kahden suoran vaikutuksen odotetaan olevan Nvidiassa.

Ensinnäkin se vaikuttaa tuleviin hankintoihin. Esimerkiksi vuonna 2021 FTC nosti kilpailuoikeuteen perustuvan kanteen estääkseen Nvidiaa käyttämästä 40 miljardia dollaria Armin hankkimiseen SoftBankilta. Nyt katsottuna Masayoshi Son voi nousta henkiin FTC:n ansiosta.

Toinen on "yliherran sopimuksen" antaminen. Loppujen lopuksi se on kohdistettu, ja Nvidian "pienet liikkeet" voivat olla hillittyjä.

Nvidia vapisee ja globaali tekoälyn kehitys hidastuu

Puhutaanpa Nvidian tuotteiden "sisäisistä huolenaiheista".

Raporttien mukaanSuunnitteluvirheiden vuoksi NVIDIAn B100- ja B200-mallit peruttiin 20 % tilausmäärästä, ja ne päivitettiin myöhemmin B200A:ksi. Toimitusten odotetaan alkavan ensi vuoden puolivälissä.

GB200:n eteneminen ei kuitenkaan ole tällä hetkellä viivästynyt. "Vahvin kuningas" GB200 ei ole vain siru, vaan tehokas alusta, joka yhdistää kaksi B200-sirua. (1 GB200:ssa on 1 Grace CPU + 2 B200).

Kerrotaan, että B100:n kysyntä itsessään ei ole suuri, ja asiakkaat ovat siirtyneet B100:sta B200:aan (yli 450 000 kappaleen kysyntä).

Joiltakin toimielimiltä saadun palautteen perusteella nykyinen ratkaisu on käyttää H200:aa aukon täyttämiseen ensin.Nvidia lanseeraa H200:n pääosin kolmannella vuosineljänneksellä ja lisää H200:a asiakkaisiin loka-marraskuussa, ja kaikki on normaalisti viimeistään joulukuussa.

Tämä viive häiritsee suurten asiakkaiden, kuten Metan, Googlen ja Microsoftin, käyttöönottosuunnitelmia ja voi vaikuttaa Nvidian AI-siruihin perustuvien tuotteiden ja palveluiden kehitykseen, mukaan lukien generatiivinen tekoäly, videonkäsittely ja muut tekoälysovellukset.

Toisin sanoen, vaikka analyytikot huusivat "NVIDIA-kupla", kun NVIDIAlle tapahtuu jotain, globaali tekoälykehitysprosessi hidastuu.

Toisin sanoen, jos haluat todistaa, että NVIDIA-kupla on puhkeamassa, tai todistaa, että GPU:iden kysyntä markkinoilla on hidastunut tai että NVIDIA kilpailee tuotteet alkavat loistaa.

Mutta tällä hetkellä et voi antaa todisteita osumasta.

Miksi olet röyhkeä Nvidiassa

Ensinnäkin, onko AI-kupla puhkeamassa? Ei.

"Pessimistisimpänä" pomona "professori Dalong" Daron Acemoglu, kansainvälisten huippujulkaisujen jumala, uskoo, että tekoäly lisää seuraavan 10 vuoden aikana tuottavuutta noin 0,53–0,66 prosenttia ja lisää BKT:tä noin 0,9 prosenttia.

Jim Covello, Goldman Sachsin osaketutkimuksen globaali johtaja, on myös melko pessimistinen: tekoälyn on kyettävä ratkaisemaan monimutkaisia ​​ongelmia, ennen kuin sen tulot ylittävät menonsa, jotka ovat noin 1 biljoona dollaria.Mitä tulee tekoälykuplaan, Covellon näkemys on, että sen puhkeaminen voi kestää kauan.

Samaan aikaan Morgan Stanley ja Wall Streetin "TMT King" Coatue ovat erittäin optimistisia tekoälyn näkymien suhteen.

Morgan Stanley uskoo, että nykyinen AI-infrastruktuuriinvestointibuumi on alkuvaiheessa eikä ole vielä saavuttanut Internet-kuplan tasoa vuonna 1999. Erityisesti GPU-investointi on juuri alkanut.

Coatue uskoo, että tekoäly ei ole hype, ja kulta-aika ei ole vielä saapunut, vaan se on lähinnä jättiläisten peli.

Toiseksi, onko GPU jo täynnä? Ei.

Tässä on taistelu Sequoian ja a16z:n välillä.

Sequoia "huijasi" GPU:ita uskoen, että huipputarjontapula oli ohi, ja laski, että tekoälyteollisuuden tulovaje GPU-ostojen vuoksi nousi 500 miljardiin dollariin.

toisaalta a16z ei vain käyttänyt satoja miljoonia dollareita hankkiakseen tuhansia grafiikkasuoritteita, vaan myös käynnisti "Oxygen Project" -projektin korkean profiilin tavalla, aikoen lopulta laajentaa GPU-klusterin kokoa. yli 20 000 yksikköä.

Miten se on käytännöllistä? Mitä jos muuttaisimme ajatteluamme.

Perinteinen ajattelu - malli on tehokas ja tappavia sovelluksia ilmestyy - mitä suurempi laskentatehon kysyntä - sitä suurempi on GPU: n kysyntä.

Mutta toisaalta, jos teemme analogian AI-aikakauden ja Internet-aikakauden välillä. Voidaan päätellä, että Internet on tietokoneiden verkko, ja AI-malli on verkkoon kytketty tietokone. Aivan kuten jokaisella on tietokone ja älypuhelin, tekoälyn aikakaudella ilmestyy erilaisia ​​AI-malleja, ja ne kaikki muodostavat täydellisen ekosysteemin.

Siksi AI-aikakausi vaatii enemmän laskentatehoa. Mutta nyt laskentatehon hinta on liian korkea ja sitä on vähän, mikä vaikuttaa entisestään tekoälyn kehitykseen. Tämä näkyy NVIDIAn vapinasta ja maailmanlaajuisesta tekoälykehityksen hidastumisesta.

Lisäksi, vaikka emme katsoisikaan pitkällä aikavälillä, katsomme vain lyhyellä aikavälillä. Harjoittelusta päättelyyn laskentatehon kysyntä on valtava ja täyttämätön.

Lainaan Neocortex x CBN:n laskelmia. Omdian tilastojen mukaan Nvidia H100:n kokonaistoimitukset olivat vuoden 2023 lopussa 1,2 miljoonaa. Neljällä vuosineljänneksellä huhtikuun 2024 loppuun asti Nvidia ansaitsi 65,8 miljardia dollaria tekoälysirujen myynnistä. Kun kunkin H100:n hinta on 40 000 US$, NVIDIA on myynyt noin 1,645 miljoonaa H100:aa viimeisen neljän vuosineljänneksen aikana. Vastaa suunnilleen yleisiä mallikoulutusmarkkinoita (eli olettaen, että 100 GPT-3.5-tason, 50 GPT-4-tason, 10 GPT-5-tason suurkielimallia ja 10 Midjourney-tason kuvanmuodostusmallia on koulutettu maailmanlaajuisesti, ja 1/ 4/20 Sora-tason videosukupolvimallia).

Tämä on vain markkinoiden kysyntä mallikoulutukselle. Päätelmä on suuruusluokkaa suurempi markkina, joka ei ole vielä todella avautunut. Jos laskemme konservatiivisesti, että jokainen henkilö tuottaa vain yhden videon kuukaudessa, globaali laskentatehon tarve suuren mallipäätelmän tekemiseen vastaa 10,4 miljoonaa H100-sirua, mikä on kaksinkertainen mallikoulutukseen verrattuna. Ja jos videon tuotantoteknologia ja markkinat kypsyvät, päättelemiseen tarvittava laskentatehonkulutus nousee kymmeniä tai jopa satoja kertoja koulutusvaatimuksiin verrattuna.

Googlen toimitusjohtaja Pichai sanoi: "aliinvestoinnin riski on paljon suurempi kuin yliinvestoinnin riski."

Kuten Metan toimitusjohtaja Zuckerberg sanoi: "Investoin mieluummin yli kuin säästän rahaa hidastamalla kehitystä."

Microsoft väittää, että tekoälyn laskentatehon nykyinen kapasiteetti rajoittaa sen rahoitustuloja, ja tilanne jatkuu ainakin tilikauden 2025 ensimmäiseen neljännekseen asti. Musk jopa kehitti oman supertietokoneensa haastaakseen Nvidian.

Lopuksi, onko Nvidian vallihauta vahva? Joo.

Mitä tulee NVIDIAn tulevaisuuteen, Coatu ilmaisi näkemyksensä suoraan:Jos on kupla, se ei ole arvostuskupla, vaan kupla, jossa voittoja vedetään eteenpäin.

Joten, kuka voi haastaa Nvidian?

Toisaalta, verrattuna kolmeen edellä mainittuun suureen syytökseen, Nvidialla on suurempi syytös - ohjelmistojen ja laitteistojen yhdistäminen.

Nykyään yli 95 % datakeskusten prosessoreista käyttää NVIDIA-grafiikkasuorittimia. Koko pilviteälyn kysyntä perustuu edelleen CUDA-ekosysteemiin, ja CUDAa voidaan käyttää vain NVIDIA-sirujen kanssa. Ohjelmoijat eivät halua oppia toista kieltä, ja CUDAa pidetään jopa NVIDIAn vallihautana.

Kaataakseen Nvidian "tyrannian", Google, Meta ja Microsoft haluavat tällä hetkellä yhdistää voimansa osallistuakseen OpenAI:n Tritonin käynnistämään avoimen lähdekoodin kieliprojektiin, ja Intel, AMD ja Qualcomm haluavat myös käyttää Tritonia salametsästämään Nvidian asiakkaita.

Vaikka Triton saattaa heikentää Nvidian markkinaosuutta, Citi analyytikot arvioivat, että Nvidian osuus generatiivisten AI-sirujen markkinoista on edelleen jopa noin 63 % vuoteen 2030 mennessä, mikä tarkoittaa, että se säilyttää määräävän asemansa vielä monta vuotta.

Toisaalta jättiläiset ovat julkaisseet haasteita peräkkäin, ja myös Nvidia on jatkuvasti käynnissä. Loppujen lopuksi Huang Renxun pitää ehdottomasti mielessä edeltäjänsä Ciscon "ylimielisyyden aiheuttamat ongelmat".

Puolijohteen "Makimoto cycle" mukaan - sirutyypit vaihtelevat säännöllisesti yleiskäyttöisten ja räätälöityjen välillä - yleiskäyttöiset rakenteet ovat suosituimpia tietyn ajanjakson aikana, mutta tietyn vaiheen saavuttamisen jälkeen erityistarpeita vastaavat erikoisrakenteet nousevat suoraan .

Tällä hetkellä NVIDIA:n edustama universaalien rakenteiden aikakausi on kumouksellinen.

Lisäksi Nvidia perusti tämän vuoden alussa uuden liiketoimintayksikön rakentamaan räätälöityjä siruja pilvipalvelun, 5G-televiestinnän, pelien, autojen ja muiden alojen asiakkaille. On uutisia, että tänä vuonna lanseerattu uusi Nintendo Switch on todennäköisesti varustettu Nvidian mukautetuilla siruilla.

Mutta onko Nvidia ehdottoman vakaa? Ajattelin lausetta: "Prosessi on oikea, mutta tulos on väärä käyttääkseni sopimatonta analogiaa, jos Nvidian vahva neuvotteluvoima saa tekoälyn laskentatehon kustannukset pysymään korkeina pitkään, mikä estää suuren mittakaavan." innovaatioita, voi myös olla vastaiskua.