Sirujättiläinen on noussut jälleen, kuka on sen takana?

2024-08-06

Heinäkuun 30. päivänä Nvidian osakekurssi laski 7 %, mikä oli yhtiön suurin pudotus kolmeen kuukauteen.

Heinäkuun 10. ja 30. päivän välisenä aikana NVIDIAn osakekurssi romahti 23 % 134,91 dollarista 103,73 dollariin. Aiemmin yhtiön jatkuva nousuvauhti näytti saavan sijoittajat jättämään riskit huomiotta.

Viimeisten kahden viikon aikana sijoittajat ovat vetäneet rahaa suurilta teknologiaosakkeilta, kuten Nvidia, koska he ovat olleet huolissaan siitä, että suuret yritykset kamppailevat tuottaakseen tuottoa tekoälykuluilleen.

Tekniset analyytikot huomauttivat, että tällainen muutos jättää Nvidian osakekurssille tilaa laskea edelleen.

Applen vika?

Nvidian osakekurssin jyrkkä lasku saattaa liittyä Appleen.

Apple ilmoitti 29. heinäkuuta teknisessä asiakirjassa, että kaksi sen tekoälyjärjestelmän Apple Intelligence -mallia on koulutettu Applen suunnittelemilla pilvipiireillä. Lisäksi Apple julkaisi myös Apple Intelligencen esikatseluversion joillekin laitteille.

Apple ei mainitse Googlea tai Nvidiaa 47-sivuisessa paperissaan, mutta huomauttaa, että sen Apple Foundation Model (AFM)- ja AFM-palvelimet on koulutettu TPU-klustereihin pilvessä. Paperissa todetaan, että järjestelmän avulla Apple voi kouluttaa tehokkaasti ja skaalautuvasti AFM-malleja, mukaan lukien AFM-on-device, AFM-palvelin ja suurempia malleja.

Apple sanoo, että AFM-on-device on koulutettu yhdelle 2048 TPU v5p -sirun osalle, joka on edistynein TPU, joka on saatavilla joulukuussa 2023. AFM-palvelin on koulutettu 8192 TPU v4 -siruille, jotka on konfiguroitu toimimaan yhdessä 8 sliceinä datakeskusverkon yli.

Google on käyttänyt TPU:ta suuria määriä datakeskuksissa pitkään nopeuttaakseen tekoälymallin koulutusta ja päättämistä. Lisäksi Google pitää TPU:ta paitsi omaan käyttöönsäpilvilaskentaPalvelut tarjotaan kolmansien osapuolten käyttöön, jolloin ne muunnetaan myytäviksi tuotteiksi.

Googlen uusin TPU maksaa alle 2 dollaria tunnissa, ja siru vaatii ennakkotilauksen kolme vuotta etukäteen. Google julkaisi ensimmäisen kerran TPU:t sisäisiin työkuormiin vuonna 2015 ja julkisti ne vuonna 2017. Ne ovat nyt kehittyneimmät mukautetut sirut, jotka on suunniteltu tekoälylle.

Silti Google on edelleen yksi Nvidian suurimmista asiakkaista ja myy pääsyä Nvidia-teknologiaan pilvialustaan.

Apple on aiemmin sanonut, että päättely, joka käyttää esikoulutettua tekoälymallia ja käyttää sitä sisällön tuottamiseksi tai ennusteiden tekemiseksi, tehdään osittain Applen omien datakeskusten siruilla.

Apple julkaisi kesäkuussa WWDC 2024:n aikana asiaankuuluvat tekniset asiakirjat, jotka osoittavat, että Applen omien prosessorien ja oman ohjelmistokehyksen Apple Intelligencessä käyttämisen lisäksi insinöörit käyttivät myös omia GPU:itaan yhdistettynä Googlen TPU:ihin nopeuttaakseen tekoälymallin koulutusta.

Nvidia kohtaa kasvavaa kilpailupainetta Googlen esimerkkinä teknologiajätti kasvattaa edelleen markkinaosuuttaan itse kehitettyjen AI-sirujen avulla. TechInsightsin tiedot osoittavat, että vuonna 2023 Googlen TPU-toimitukset saavuttavat 2 miljoonaa yksikköä, vaikka NVIDIAn 3,8 miljoonaa yksikköä ovatkin sijoittuneet vakaasti kolmannelle sijalle, ja Nvidian kasvuvauhti on vahva . Samaan aikaan Microsoftin kaltaiset teknologiajätit vähentävät vähitellen riippuvuuttaan Nvidiasta ja siirtyvät käyttämään muiden kilpailevien merkkien siruja.

GPU:t ovat liian kalliita

Yksittäisriippuvuuden riskin lisäksi Nvidian GPU:iden korkea hinta pelottaa monia valmistajia.

Raportit osoittavat, että Nvidian seuraavan sukupolven Blackwell GPU:lla varustetut tekoälypalvelimet maksavat jopa 2-3 miljoonaa dollaria kukin.

Nvidia on julkaissut kaksi Blackwell-arkkitehtuuriin perustuvaa mallisarjaa, joista NVL36 on varustettu 36 B200-kiihdytinkortilla. Hinnan odotetaan olevan 2 miljoonaa dollaria, ja nyt hinta on noussut. NVL72 on kaksinkertaistunut ja siinä on 72 B200-kiihdytinkorttia. Lähtöhinnan odotetaan olevan 3 miljoonaa dollaria.

NVIDIA ennustaa, että vuonna 2025 B200-palvelintoimitusten odotetaan saavuttavan 60 000 - 70 000 yksikköä ja kokonaishinnan 120 - 210 miljardia dollaria.

Tällä hetkellä AWS, Dell, Google, Meta, Microsoft jne. ovat kiinnostuneita B200-palvelimien ostamisesta, ja mittakaava ylittää odotukset.

Tekoälypalvelimet koostuvat pääosin suorittimesta, grafiikkasuorittimesta, FPGA:sta ja muista prosessoreista, joita käytetään useiden laskentatehtävien hoitamiseen Perinteisiin palvelimiin verrattuna tekoälypalvelimet vaativat yleensä tehokkaamman laitteiston vastatakseen suuren mittakaavan tietojenkäsittelyn tarpeisiin. ja monimutkaiset laskelmat. Näiden laitteistojen korkeamman hinnan vuoksi ne muodostavat suurimman osan tekoälypalvelimien kustannuksista. Näistä GPU muodostaa suurimmat kustannukset eri prosessoreista.

Tekoälykoulutuksessa ja päättelyssä GPU on yleensä kallein laitteisto Tämä johtuu siitä, että GPU:lla on vahva laskentateho ja rinnakkaisprosessointiominaisuudet, jotka voivat nopeuttaa tekoälymallin koulutusta ja päättelyprosessia. Suurin osa tekoälypalvelimista on varustettu useilla grafiikkasuorituksilla, jotka vastaavat tehokkaan tietojenkäsittelyn tarpeita.

Koska GPU:lla on tehokas laskentateho, sen virrankulutus on myös korkea. Tekoälymallien laskentatarpeiden täyttämiseksi on yleensä määritettävä useita GPU:ita, mikä lisää palvelimen virrankulutusta entisestään. Suuri virrankulutus tarkoittaa, että palvelin vaatii suuremman virtalähteen ollessaan käynnissä ja siitä aiheutuu korkeampia sähkölaskuja.

Prosessoreihin verrattuna GPU:illa on monimutkaisempi arkkitehtuuri ja enemmän komponentteja, mikä tarkoittaa, että GPU-ylläpito on työläämpää ja monimutkaisempaa ja vaatii ammattitaitoisempia teknikoita ylläpitämään ja hallitsemaan. Lisäksi GPU:n suuren virrankulutuksen vuoksi sen jäähdytysvaatimukset ovat myös korkeammat, mikä vaatii lisäjäähdytyslaitteita ja ylläpitokustannuksia.

Tekoälytekniikan nopean kehityksen myötä myös GPU-suorituskyky paranee jatkuvasti. Pysyäkseen kilpailukykyisinä monien yritysten on ostettava usein uusia GPU-versioita, mikä lisää palvelimien kustannuksia.

Tekoälysovellusten edistämisen myötä yhä useammat yritykset alkavat käyttää tekoälypalvelimia, mikä on johtanut kasvavaan GPU:iden kysyntään Kun tarjonta ylittää kysynnän, myös GPU:iden hinnat nousevat.

Kilpailijoiden paineita

NVIDIAn kilpailijat ovat kaikki valmistautumassa, ja heidän joukossaan katseenvangitsija AMD on menestynyt hyvin viime aikoina.

AMD julkaisi 30. heinäkuuta toisen vuosineljänneksen 2024 taloudellisen raporttinsa Nettotulos kasvoi 881 % edellisvuodesta, datakeskusliiketoiminnan liikevaihto kaksinkertaistui ja se vei paljon liiketoimintaa Nvidialta.

AMD:n kokonaistulot tällä vuosineljänneksellä olivat 5,835 miljardia dollaria, mikä ei vain ylittänyt aiemmat 5,72 miljardin dollarin odotukset, vaan saavutti myös 9 prosentin vuosikasvun ja 7 prosentin kuukausikasvun. Nettotulos oli 265 miljoonaa dollaria, mikä on 881 % enemmän kuin vuotta aiemmin ja 115 % kuukausittaista kasvua.

Datakeskuksissa käytettävän GPU-sirun MI300:n myynti ylitti 1 miljardin dollarin yhdellä vuosineljänneksellä, mikä lisäsi merkittävästi datakeskusdivisioonan liikevaihtoa.

MI300-sarja on AMD:n vuoden 2023 lopussa julkaisema AI GPU, mukaan lukien MI300X, sekä integroitu CPU-ydin ja GPU-kiihdytin MI300A. AMD:n mukaan MI300X:n suorituskyky on NVIDIA H100:n tasolla, kun sitä käytetään tekoälyharjoitteluun. Sen suorituskyky ylittää kilpailevien tuotteiden suorituskyvyn. Esimerkkinä yhdestä 8 GPU:sta koostuvasta palvelimesta käytettäessä 176 miljardin parametrin BLOOM-mallia ja 70 miljardin parametrin Llama2-mallia MI300X-alustan suorituskyky on 1,4–1,6 kertaa H100-alustan suorituskyky.

AMD:n toimitusjohtaja Su Zifeng sanoi, että yhtiön AI-sirujen myynti on "odotettua korkeampi" ja että Microsoft lisää MI300-sirujen käyttöä GPT-4 Turbon laskentatehon tukena ja Microsoft Wordin, Teamsin jne. useiden Copilot-palvelujen tukena. Hugging Face on yksi ensimmäisistä asiakkaista, jotka ottavat käyttöön uuden Microsoft-pilvi Azuren, jonka avulla yritys- ja tekoälyasiakkaat voivat ottaa käyttöön satoja tuhansia malleja MI300:ssa yhdellä napsautuksella.

Tämän vuoden kesäkuussa AMD julkisti iteraatiosuunnitelman, joka aikoo julkaista MI325X:n tämän vuoden neljännellä vuosineljänneksellä ja MI350-sarjan ja MI400-sarjan seuraavan kahden vuoden aikana. Niistä M1300X ja MI325X ottavat käyttöön CDNA3:n M1350 ottaa käyttöön CDNA4-rakenteen, ja MI400 ottaa käyttöön seuraavan sukupolven CDNA-arkkitehtuurin. AMD tuo markkinoille uusia tuotesarjoja joka vuosi. Alan näkökulmasta tämä nopeus on Nvidian julkaiseman suunnitelman mukainen.

Lisäksi Su Zifeng sanoi, että tekoälyn perustelujen kysyntä on suurempi kuin koulutus. AI PC on erittäin tärkeä osa PC-kategoriaa, ja PC-markkinat tarjoavat AMD:n liiketoiminnalle hyvän liikevaihdon kasvumahdollisuuden.

Tänä vuonna AMD nopeuttaa tekoälyn käyttöönottoa investoinneilla. Heinäkuussa yhtiö käytti 665 miljoonaa dollaria hankkiakseen Silo AI:n, Euroopan suurimman tekoälylaboratorion, joka tarjoaa päästä päähän tekoälypohjaisia ratkaisuja. Tätä hankintaa pidetään tärkeänä askeleena AMD:lle saavuttaakseen Nvidian.

Su Zifeng sanoi, että Silo AI:n hankinnan lisäksi AMD on investoinut yli 125 miljoonaa dollaria yli kymmeneen tekoälyyritykseen viimeisen 12 kuukauden aikana laajentaakseen AMD:n ekosysteemiä ja säilyttääkseen johtavan aseman AMD:n laskentaalustoissa. AMD jatkaa investointeja ohjelmistoihin, hän sanoi, mikä oli yksi syistä investoida Silo AI:hen.

Laadukkaan GPU-laitteiston, ohjelmistokehityksen ja ekosysteemin perusteella AMD kilpailee samalla tavalla kuin Nvidia on menestynyt.

NVIDIAlla on myös heikkouksia

Kilpaillaksesi NVIDIAn kanssa paras strategia on hyödyntää vahvuuksiasi ja välttää heikkouksia, eli käyttää omia vahvuuksiasi NVIDIAn heikkouksien kimppuun.

Vaikka GPU:n rinnakkaiskäsittelyominaisuudet ovat erittäin vahvat, tämä on perussyy, miksi se on hyvä tekoälykoulutuksessa. Mutta kun tietoja siirretään edestakaisin, GPU ei käsittele sitä yhtä nopeasti. Kun ajetaan suuria tekoälymalleja, ne vaativat usein suuren määrän GPU:ita ja suuren määrän muistisiruja, jotka on kytketty toisiinsa Mitä nopeammin data liikkuu GPU:n ja muistin välillä, sitä parempi suorituskyky. Harjoitettaessa suuria tekoälymalleja, jotkut GPU-ytimet ovat käyttämättömänä ja odottavat dataa lähes puolet ajasta.

Jos suuri määrä prosessoriytimiä ja massiivinen muisti voidaan yhdistää muodostamaan muistin sisäinen laskenta, voidaan useiden sirujen välisten yhteyksien monimutkaisuutta vähentää huomattavasti ja tiedonsiirtonopeutta parantaa huomattavasti. Suuri määrä prosessoriytimiä on yhdistetty toisiinsa sirussa ja ne voivat toimia satoja kertoja nopeammin kuin itsenäisten GPU:iden yhdistelmä. Tällä hetkellä useat startupit tekevät tällaisia asioita, ja kehitys on huomion arvoista.

Lisäksi sinun on oltava valmis pitkittyneeseen sotaan ohjelmisto- ja laitteistoekosysteemissä voidaksesi käsitellä NVIDIAa. AMD ja Intel tekevät tämän.

Lisäksi itse sirun lisäksi voidaan tehdä enemmän työtä sirujen välisessä yhteenliittämisessä NVIDIA ei ole johtava tässä suhteessa, Broadcom on.

Broadcom ratkaisee sirujen välisen yhteenliittämisongelman eikä kilpaile suoraan Nvidian GPU:iden kanssa. Vaikka Nvidialla on myös oma sirujen välinen liitäntätekniikka, Broadcomin tekniikka ja tuotteet ovat ylivoimaisia maailman kahdeksasta suurimmasta tekoälypalvelinjärjestelmästä, joka tukee Broadcom-tekniikkaa odotetaan, että vuoteen 2025 mennessä kaikki erittäin suuret tekoälypalvelinjärjestelmät saavat virtansa Ethernetistä.

Broadcom ratkaisee parhaiten tietoliikenteen kaistanleveysongelmia Maailmanlaajuisilla 50 Gt/s SerDes-markkinoilla Broadcomilla on 76 % osuudestaan sen SerDes-liitäntä muuntaa hitaan rinnakkaistiedot nopeaksi sarjatiedoksi ja muuntaa sitten takaisin rinnakkaistiedoksi. vastaanottava pää. Tällaisten toimintojen avulla dataa voidaan siirtää TPU:sta toiseen suurella nopeudella, mikä parantaa huomattavasti lähetyksen tehokkuutta.

Tekoälyn kasvusta hyötyneen Broadcomin Netcom-tuotetulot kasvavat 40 % vuositasolla. Yhtiön taloudellinen raportti osoittaa, että toisella tilikaudella tämän vuoden toukokuussa tekoälyn liikevaihto kasvoi 280 prosenttia vuodentakaisesta 3,1 miljardiin dollariin, ja tämän luvun odotetaan ylittävän 11 miljardia dollaria ennen tämän tilikauden loppua. .

Iso pudotus ja taas iso nousu

Useat kilpailijat painostavat Nvidiaa, mikä on tärkeä syy yhtiön osakekurssin laskuun. Markkinat kuitenkin muuttuvat niin nopeasti, että ihmiset eivät pysty reagoimaan ajoissa.

Heinäkuun 31. päivän iltana Nvidian osakekurssi nousi yhtäkkiä jyrkästi yli 14 % kerrallaan, ja sen markkina-arvo kasvoi 326,9 miljardia dollaria yhdessä päivässä.

Nvidiasta tuli ensimmäinen osake, jonka markkina-arvo kasvoi yhden päivän aikana yli 300 miljardilla dollarilla. Tällä hetkellä NVIDIA on kolmen parhaan joukossa Yhdysvaltain osakkeiden yhden päivän markkina-arvon lisäysluettelossa. Tämän vuoden helmikuun 22. ja 23. toukokuuta NVIDIAn yhden päivän markkina-arvo kasvoi 276,6 miljardilla dollarilla ja 217,7 miljardilla dollarilla.

Morgan Stanley julkaisi tutkimusraportin, jossa todetaan, että koska Nvidia on myyty äskettäin markkinoiden toimesta, vaikka tarkat syyt eivät ole tiedossa, se uskoo, että se voi tarjota hyvät mahdollisuudet päästä markkinoille kiinnostuneille sijoittajille Osakeosakkeet ja tuotot Ennuste ja tavoitehinta eivät ole muuttuneet, ja luokitus on "ylipaino" ja tavoitehinta 144 dollaria.

Vain kahdessa päivässä Nvidian osakekurssi laski jyrkästi ja nousi sitten jyrkästi Tämä voi johtua Blackwellin tiukasta tarjonnasta ja vaikeuksista toimittaa kaikkia tuotteita ajoissa.

Morgan Stanley sanoi, että Blackwellin tuotteet ovat herättäneet vahvaa kiinnostusta markkinoilla, erityisesti niiden päättelykyvyn merkittävä parantuminen, mikä lisää asiakkaiden ostohalua entisestään.

Alalla on kuitenkin uutisia, että Blackwell GPU-siru saattaa viivästyä tai sirulla varustetut palvelintuotteet voivat viivästyä.

Vaikka monien kilpailijoiden teknologioiden ja tuotteiden suorituskyky paranee koko ajan ja painostaa Nvidiaa, tällä hetkellä ja lyhyellä tai keskipitkällä aikavälillä yhtiön GPU-tuotteet ovat edelleen päävoima tekoälypalvelinmarkkinoilla, ja kaiken kaikkiaan. tarjonta ylittää kysynnän. Koska useiden asiakkaiden odottamat Blackwell-grafiikkasuorittimet ovat pian toimitettavissa, uutiset toimituksen viivästymisestä herättävät varmasti markkinoiden ruokahalua ja auttavat osakekurssien nousussa.

uutiset

Sirujättiläinen on noussut jälleen, kuka on sen takana?

Johdanto

yhteystietoni