2024-10-03
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
nvidia erit finis "gpu festivitatis"?
cum emissio chatgpt ab open ai in civitatibus foederatis americae die 30 mensis novembris anno 2022, generativa ai (intellegentiae artificialis) maior insania facta est, et nvidia gpus popularis ai semiconductores facti sunt. tamen, in productione gpus, duae ampullae sunt: processus medius tsmc et memoria (hbm) reclinata cum dram, ducens ad global inopiam gpus tsmc?"
inter haec gpus, "h100" in primis alta postulatio, cum suo pretio ad $40.000 tendens, excitato nvidia "gpu festivitate" dicta est.
qua in re, tsmc medium processum suum interpositum facultatis productionis duplicavit, et dram artifices ut sk hynix productionem hbm multiplicaverunt, inde in "h100" tempus ab 52 septimanis ad 20 hebdomades diminutum ducunt.
so, nvidia erit finis "gpu festivitatis"?
ita in hoc articulo disputabimus num dies nvidia "gpu" ad finem perveniat. loquamur de conclusione prima. exspectatur etiam ab 2024, solum 3.9% summi finis ai servers (definitio postea explicabitur) requisiti pro chatgpt-gradu ai evolutionis et operationis amet. propterea videtur necessitates nubium provisoribus (csps) ut google, amazonibus, et microsoft occurrere omnino non posse. in summa, eatenus, nvidia scriptor "gpu festival" solum initium est, et generativus comprehensivus ai butio venit.
deinde breviter duas collas nvidia gpu maioris recensebimus.
duo nvidia gpu bottlenecks
in productione nvidia gpus, inventarius tsmc responsabilis est omnibus processibus ante, mediis et retro. hic, processus medius refertur ad processum producendi gpu, cpu, hbm et aliorum assulorum seorsim ponensque in substrato quadrato ex lagano pii duodecim inch. hoc subiectum interpositum pii (figura 1) appellatur.
figure 1 processus intermedii ab 2.5d ad 3d emergentes, ut nvidia gpu (source: tadashi kamewada)
praeterea involucrum nvidia gpu a tsmc evoluta vocatur cowos (chip on wafer on substratum), sed duo lagunculae siliconis interpositae capacitatis sunt et hbm (figura 2). res ita se habet.
figura 2 cowos structura et duae bottlenecks in nvidia gpu (source: wikichip)
cowos anno 2011 evoluta est, sed quia tunc, sicut perficientur gpu melius est, magnitudo xxxiii gpu crescere perstitit, et numerus hbms in gpu constitutorum etiam auctus est (figura 3).. quam ob rem, interpositores pii quotannis maiores fiunt, dum numerus interpositorum in uno lagano in inversa proportione decrescit.
figura 3 interposita area et hbm numerus cum singulis generationibus auctus (source: kc faciatis (tsmc))
praeterea numerus hbm in gpu inauguratus crescit, et numerus chippis dram intra hbm reclinatus etiam crescit. praeterea dram singulis duobus annis minuitur et vexillum hbm singulis duobus annis renovatur ad meliorationem faciendam. ideo acies hbm secans in brevi copia est.
sub hoc missione, tsmc duplicabit facultatem productionis siliconis interpositae ab 15000 laganae per mensem circa aestatem 2023 ad plus quam 30.000 laganum per mensem circa aestatem huius anni. praeterea, samsung electronics et micron technologia nvidia certificationem consecuti sunt et inceperunt supplere extremam partem hbm, quae antea ab sk hynix dominata est.
his supra affectis, tempus traditionis nvidia h100, quae summa postulatio est, signanter ab 52 septimanis ad 20 septimanas est abbreviata. ita, quantum habet ai servo portarentur ut effectus augeretur?
definitio duorum generum ai servers
secundum "global servo annuli shipments, 2023-2024" (servi renuntiatio database, 2024) per investigationem digitimes emissa, duo genera servientium ai;
systema instructum duobus vel pluribus ai acceleratoribus sed non hbm vocantur "servatores universales ai".
systema instructa cum acceleratoribus ai quattuor saltem hbm-powered vocantur "altus finis ai ministrantium".
accelerator ai hic de specialibus ferramentis designatis ad applicationes ai accelerandas, praesertim retiacula neuralis et discendi apparatus. praeterea evolutio et operatio chatgpt graduum generativarum ai requirit magnum numerum servientium ai summus finis magis quam servientium generalis propositi ai.
ita, quae sunt volumina amet ministri generalis ai et summus finis ai servientibus?
general ai servo ac summus finis ai servo portarentur
figura 4 monstrat portationes servientium generalium ai et summus finis ai ministrantium ab anno 2022 ad 2023 . communia ai ministrantium portarentur exspectantur 344,000 unitates in 2022, 470,000 unitates 2023, et 725,000 unitates in 2024 .
figura 4 generalis ai ministrator et summus finis ai servo portarentur (2022-2024) (source: digitimes research)
eodem tempore, summus finis ai servitores ad progressionem et operationem chatgpt-gradus generativae ai requiruntur, exspectantur ad navem 34000 unitates 2022, 200,000 unitates 2023, et 564,000 unitates in 2024 .
so, num portationes summi finis ai servientibus necessitatibus us csps occurrere possunt?
figura 5 docet amet numeros servientium, generalium ai ministrantium, et summus finis ai ministrantium. cum hoc schemate strinxi et in eo vidi, obstupui et mirabar "num hoc est, quot nobiles ai servitores portantur?" adhuc summus finis cultor intellegentiae artificialis et portationes valde parvae sunt.
figure 5 shipments ministrantium, generalis ai servientium, et summus terminus ai servientibus
source: auctor secundum mic et digitimes
ego magis destitutus sum cum inspexi quot summus finis ai servientibus opus esset ad explicandum et currendum chatgpt-gradum generativum ai.
summus finis ai servo requiritur ad generandum ai in chatgpt gradu
ferunt progressionem et operationem chatgpt postulare 30.000 nvidia dgx h100 summus finis ai servientibus (figura vi). hunc numerum triginta millium cum vidi, vertiginem sensi.
figura 6 quot summus finis ai servientibus opus est ad chatgpt currere? (source: hpc website)
obiter "nvidia dgx h100" cum octo "h100" assionibus instructa est, et pretium cuiuslibet assulae ad $40.000 volavit, totum systematis pretium ad $460,000 afferens. aliis verbis, chatgpt-gradu generans ai postulat obsidionem 30,000 unitatum x $460,000 = $13.8 sescenti (circiter 2 trillion yen secundum $1 = 145 yen).
puto mundum plenum systematis generativorum ai, sed quot chatgpt-similes generativae ais aedificatae sunt? (figura 7)
figure 7 servo portarentur, summus finis ai servo portarentur, numerusque chatgpt graduum systematum ai generatorum (source: mic et digitimes)
cum sit amet volumen summus finis ai ministrantium in anno mmxxii, unitates 34.000 erunt, una tantum systema chatgpt gradu ai aedificari potest (hoc est chatgpt). sequenti anno, anno 2023, summus finis ai servo portationes 200,000 unitates attinget, ergo 6 ad 7 chatgpt-gradus ai systemata aedificari possunt. cum 564,000 summus finis ai servitores exspectantur ut anno 2024 convehantur, poterit 18 ad 19 chatgpt-gradu ai systemata aedificare.
attamen haec aestimatio supponit chatgpt-campester ai cum 30.000 summo fine ai servientibus "nvidia dgx h100" aedificari posse.attamen, cum generatio ai intricatiorem fieri verisimile sit, plus quam 30.000 nvidia dgx h100s hoc casu opus erit. omnia perpensis, us communicationis servitium provisoribus abhorret esse contenti currentis nautis summus finis ai servientibus.
nunc inspiciamus quot summus terminus ai servientes quemque finem user (qualis csp in iunctus civitas) habeat.
numerus summus finem ai servers ad finem users
figura 8 numerus summus finem ostendit servientibus ai finem users. anno 2023, microsoft, quod openai possidet, maximum numerum summus finis ai ministrantium habet in unitatibus 63,000, sed per 2024 google microsoft vincet et plurimos habet ministros ai extremos.
figure 8 high-fin artificial intelligence servers by end user (2023-2024) (source: digitimes research)
top quinque in 2024 google sunt, prima cum 162,000 unitatibus (5 systematibus), microsoft ordo secundus cum 90.000 unitatibus (3 systematibus), super micro ordo tertius cum 68,000 unitates (2 systemata), et amazon (67,000 unitatum) quartus numero. 2 systemata), sequitur meta quinto loco cum 46,000 unitatibus (1 systematis) (numerus uncis est numerus systematum chatgpt generationis ai potest aedificare). perspici potest summum quinque societatum scelerisque solaris potentiae generationis in civitatibus foederatis americae circiter 80% communicationis monopolire.
deinde, inspiciamus summus finis ai ministrantium navium ai acceleratorum (figura 9). sed mirum, secunda societas popularis non amd, sed google.
figure ix high-finem ai servers ab ai accelerator (2023-2024) (source: digitimes research)
google suum tensorem processus unitas (tpu) ut ai accelerator evolvit. per 2024, numerus summus finis ai ministrantium hoc tpu instructus 138,000 perveniet. hic, ex figura viii scimus, google 162,000 summus finem habiturum ai a 2024 ministrantibus habebit. ideo 138,000 unitates exspectantur instructae propriis tpu google, reliquae 24000 unitates cum nvidia gpu instructae sunt. id est , nvidia , google et emptoris et formidabilis hostis est.
praeterea, si naves 2024, amd, quae tertia pars fert, 45, millia unitates spectemus, sequitur amazon, quae quarta cum 40.000 unitatibus distinguit. amazon est etiam aws trainium developing ut accelerator intelligentiae artificialis. si diutius manet, amd vincatur ab amazone.
ad summam, nvidia nunc maximas acceleratores ai portationes habet, sed google et amazon fortes competitores eius fiunt. competitor nvidia non est processus fabricator amd (certe intel non periclitatus), sed google csps us et amazon.
a plena eu generativa ai butio venit
summatim omnia hactenus. secundum relationem per digitimes investigationes, portationes summi finis ai servientibus aptae ad explicandum et currendum chatgpt-gradum generativum ai exspectantur ad rationem tantum 3.9% omnium ministrantium ab 2024 . creditur hoc amet volumen simpliciter non posse necessitatibus occurrere csps.
aliis verbis, nvidia "gpu festival" ab 2023 ad 2024 initium est. quam ob rem, plenus-inflatus generativus ai butio futurum est verisimile. basic infra ostendemus.
figura 10. forum semiconductorem ostendit per applicationem et futuram praenuntiationem a consociatione semiconductoris industrii edita (sia). secundum sia praedictiones, semiconductor globalis mercatus us$1 trillion in 2030 superabit.
figure 10 semiconductor sit amet praecognoscere per applicationem (source: sia blog)
per 2030, maxima mercatus computatio et notitia repono. hoc includit pcs et servientes (et sane summus finis ai ministrantium), sed cum pc portarentur inconveniens signanter augere, ministri verisimile maiorem constituunt.
wired communicationes significantes semiconductores in centris notitiis adhibitos. hoc significat quod per 2030, computando ac data repositione ($330 miliardis) + communicationis wired ($60 billion) = summa $390 sescenti fiet semiconductores pro centris (inclusis pcs), fient maximum mercatum mundi.
aliud spectare est centrum ma- nifestationis et spe- cialis;ut patet in figura xi. post chatgpt emissionem anno 2022, mercatus notitiarum centrum constanter crescere expectat. centra data in tribus elementis constant: infrastructura retis, servientes, et repositiones, ac ministri ac repositiones singulae expectandae sunt ut dure duplum ab 2023 ad 2029 .
figura 11 data centrum fori mentis (comprehensivus generativus ai boom nondum advenit) (source: author in statista market insights data)
hoc modo, server semiconductores (incluso summo fine ai servers) maximam partem mercati globalis occupabit, et mercatus notitia centrum etiam dilatabit.
repetere unum extremum tempus.hactenus, nvidia scriptor "gpu festivitatis" iustus est eventus prae-festus. plenus canite generativa ai boom venit.