quis nvidia repositum fieri potest?

2024-09-23

author丨barry

editor丨guan ju

picture source丨midjourney

quis nvidiam reponere possit?

in agro centri gpus, portarentur nvidia 3.76 decies centena millia unitates 2023 attingent, rationem fere 98% mercatus globalis participes, quod praepollens dici potest.

ai chippis, etiam ai acceleratores vel chartas computantes, moduli nominatim adhibiti sunt ut magnum numerum computandi operas in applicationibus artificialibus ad intellegentiam tractandum maxime includant processores graphicos (gpus), agri programmabiles portae vestit (fpgas), et applicationes speciales ambitus (asic) etc.

secundum gartner, ai mercatum chippis us$53.4 sescenti 2023 perveniet, augmentum 20,9% ab 2022, et augebit 25.6% ad us$67.1 miliarda in 2024. per mmxxvii, ai chip vectigal expectatur plusquam dupla molis mercatus anno 2023, $119.4 sescenti attingens.

numeri arma computandi genus a maioribus ingentes societatibus prolapsum proculdubio validam vim in foro ai chippis facti sunt.

incipiens ab anno 2024, omnia fere exempla magna amet plus quam centum miliarda parametri habebunt, llama3 400 miliarda parametri habet, gpt4 1.8 trillion parametros habet. magnum exemplar cum trillions parametris correspondet botri potentiae super-magnae computandi cum scala plusquam 10,000 chiliobytarum.

openai habet minimum 50,000 nvidia summus terminus gpus, meta botrum suum super-10,000-cardum ex 24576 h100s compositum aedificavit, et google supercomputatum a3 habet ex 26,000 h100s ... plus quam 40,000 societates nvidia gpus , societates emerunt. sicut meta, microsoft, amazon, et google summam 40% vectigalium contulerunt.

renuntiatio nummaria ostendit crassa lucrum margo nvidia 71% pervenisse, quarum crassa lucrum margo seriei a100 et h100 tam altus erat quam 90%. pro societate ferraria, nvidia maiorem crassam margo lucrum habet quam societates interretiales.

ferunt nvidia's ai chippis pro centra data centra us$25,000-40,000 per frustum pretium esse, quod est 7-8 temporibus productorum traditionalium. kazuhiro sugiyama, moderatorem investigationis omdia firma consultans, dixit pretia nvidia producta esse onera societatibus quae in ai obsidere volunt.

princeps venditionis pretium etiam multas magnas clientes incepit ut singulas quaereret. die 30 iulii, apple denuntiavit exemplar suum ai 8000 google tpus exercitatum esse. primum chip openai etiam hodie exposita est. utetur tsmc processus antecedens a16 angstrom-gradus et specialiter aedificatur pro applicationibus video sora.

per mundum, ai chips stellae satus et unicornes unum post alterum emerserunt, cibum ab nvidia surripere conantur. inter eos exstant unicornes sambanova et sinicae recentes emergentes etchedae ac cerebras systema unicornis ab openai ceo altman investita, quae scatebat pro ipo hoc anno mense iulio, societatem graphcore chip britanniae ai accepit in conatu proximo nvidia aedificandi.

sambanova, an ai chip unicornis aedificata a seres populo stanford

die xxvii mensis augusti us ai chip satus sambanova singillatim induxit primum ai chip systematis artis triillion parametri-scalarum pervestigationis artificialis (ai) exempla - in reconfigurabili data flow unit (rdu) ai dolo sn40l .

secundum relationes, ratio 8-chiporum in sambanova sn40l fundata subsidium praebere potest pro exemplaribus 5 trillion parametri, et series longitudinis in unico nodi systemate 256k+ pervenire potest. comparatus cum yingwei h100 chip, sn40l 3.1 consecutionem h100 temporum non solum consequitur, sed etiam disciplina perficiendi duplicat, et summa possessionis sumptus tantum 1/10 est.

sambanova ceo rodrigo liang

societates tres co-conditores omnes stanford subiectos habent. inter eos, ceo rodrigo liang est prior sol/oraculum machinationis praeses.

sambanova currently in us$5 miliardis aestimatur (circiter 36.5 sescenti yuan) et 6 circumscriptiones nummariae totali us$ 1.1 sescenti complevit.

non solum nvidia in xxxiii provocant, sed etiam longius progrediuntur quam nvidia secundum exemplar negotii negotii: protinus participes adiuvandi societates magna exempla privata instituunt. et astulae non solum venditae sunt, sed acervi technologiae eorum nativus, ab astularum ad systemata ministrantium, et etiam magna exempla instruere.

ambitiones ad scopum clientes etiam maiores sunt - targeting 2000 mundi maximae societates. in praesenti, sambanova astulas et systemata multas magnas clientes occupaverunt, in quibus summum mundi laboratorium supercomputans, iaponia fugaku, civitatum foederatarum, argonne national laboratorium, laurentius national laboratorium, et societas consulentium accentum.

rodrigo liang credit proximum campum mercaturam in magnarum exemplorum et generativorum ai datas esse privatas conatibus, praesertim magnis inceptis. ultimo, pro uno exemplo amplissimo sicut gpt-4 vel google gemini currens, societas 150 exempla unica creabit secundum diversa notitiarum copia, cum plusquam trillion parametri aggregata.

hoc consilium in acri discrepantia accedit ut gpt-4 et google gemini, ubi plurimi gigantes sperant exemplum gigantis creare qui ad decies centena milia munerum generare potest.

conclusio, societas ai chippis condita a duabus guttulis harvardianis in 2000s natus est

conditores etched sunt duae guttae harvardianae anno mm natae. gavin uberti maiores dignitates in octoml et xnor.ai tenuit, cum chris zhu sinica est. praeter in universitate harvardiana scientia eruditionis indagator inserviens, etiam experientiam in societatibus amazonicae habet.

optima de directione magnarum exemplorum antequam chatgpt dimissa sunt, e universitate harvardiana anno 2022 omissa sunt et simul cum robert wachen et cum robert wachen priore cypressus semiconductor dux technologiae praefectus mark ross creandi magna exemplaria ai xxxiii dicata sunt.

gavin uberti (reliquit) et chris zhu (right)

unam viam ceperunt: solum transformer's ai chip currunt et consilium asic ceperunt. nunc, fere omnes solutiones mercatus late exempla ai sustinent, et exemplar transformatoris totum mercatum ab fine anni 2022 dominatum esse decreverunt. credunt gpu effectus upgrades lentiores esse, et una via utendum est. specialioribus asic xxxiii. hoc tantum modo saltum in effectu consequi possumus.

post duos annos, die xxvii mensis iunii hoc anno, etched primum suum ai chip sohu egit, primum momentum mundi transformatori computanti dicatum est.

exemplaria magna 20 temporum velocius quam nvidia h100 decurrit, et plus quam 10 vicibus velocius quam top of-lineae chip b200, quod hoc anno mense martio emissum est. servitor cum octo sohu xxxiii instructus plenam 160 nvidia h100 gpus reponere potest. dum impensas deminutio, nullum detrimentum perficiendi erit.

cum sohu unum algorithmum tantum sustinet, plerique modulorum fluxus moderaminis tolli possunt. pro parva turma designatio, servato programmatis unius architecturae acervus manifesto minus stressful.

eodem tempore quo sohu chip dimissa est, etched quoque nuntiavit us$ 120 decies centena serie a nummaria complevisse, a primario venture sociis et summ venturibus positivis co-ductus.

maiores investitores in hoc rotundo imperdiet includunt notissimas silicon vallis investor petrum thiel, pristinum cto de cryptocurrency mercaturae tribunal coinbase et pristinum a16z socium generalem balaji srinivasan, github ceo thomas dohmke, cruise co-conditorem kyle vogt et quora simul conditorem charlie cheever et magis.

cerebras systema, ai chip unicornis ab ultraman investita, cogitat pro ipo . ruere

maxime unica res de systemate cerebras in anno 2015 fundata est, quod astulae eorum ab amet nvidia gpus multum differunt. praeteritis, chippis minora et minora facta sunt sub ductu legis moore. captus nvidia h100 exemplum habet 80 miliarda transistores in core area 814 millimetrorum quadratorum.

cerebras ai chip vult totum chip maior et maior facere dicens "creavit in area amplissima mundi". secundum tradit, wse 3 spumae a cerebras evolutae ab lagano integro abscinditur, quod maius est quam lammina et hominem requirit ut ambabus manibus illud teneat. a wse 3 chippis transistores 4,000 miliarda (50 temporibus h100) habet in core area plusquam 46,000 quadratorum milliumtrorum.

abutatur quam lammina utraque manus eget tenere. source: ars technica

cerebras affirmat magnitudinem ai magnae exemplaris, quod earum chippis instituere potest, x temporibus maius esse quam in magna exempla currentis industriae summum (sicut openai scriptor gpt-4 vel google gemini).

die xxvii mensis augusti hoc anno, cerebras systems emissionem ai illationis inserviendi consequentiae cerebras denuntiaverunt, quae tamquam "celeberrimus in mundo" est occisus. iuxta locum officialem, haec consequentia officium est viginti partibus velocius quam ministerium nvidia dum accurationem procurans; eius processus memoria latitudo nvidia septies 7000 est, pretium tantum 1/5 gpu, pretium/faciendi ratio habet. augetur c temporibus. cerebras consequens etiam plures gradus servitiorum praebet, etiam gratis, elit et inceptis gradibus, ad varias necessitates occurrendas a parva evolutione ad magnarum rerum inceptis instruere.

co-conditor et ceo andrew feldman mba ab universitate stanford tenent, et dux technologiae praefectus gary lauterbach agnoscitur unus e summis architectis computatrum industriae. anno 2007, duo co- fundaverunt societatem micro-servorum seamicro, quae ab intel pro us$334 decies centena millia in mmxii acquisita est, et duo postea amd coniuncti sunt.

iuxta instrumentorum exterorum relationes, cerebras systems clam pro ipo in civitatibus foederatis applicavit et quam primum octobris 2024 numerabuntur. nunc, societas us$720 decies centena milia erexit et circa us$4.2 sescenti ad us$5 miliarda aestimatur. altman in cerebras * $81 decies centena series d nummaria parem participavit.

tenstorrent, cum magistro chip fabuloso iunctus, fiet nvidiae "substitutio".

ante 2021, tenstorrent adhuc societas ignota erat. quamquam societas aliquandiu clarus facta est jim keller, magna figura in semiconductoris industriae quae "silicon immortal" appellata est, denuntiavit se societati technologiae praefecti et praesidis iungere.

curriculum jim keller dici potest historia industriae computatrum. ab 1998 ad 1999, jim keller in architectura k7/k8 operata est quae athlon ad amd sustentabatur; ab mmviii ad mmxii, plumbum in processuibus apple a4 et a5 explicandis accepit; project in amd, zen architecturae ab anno 2016 ad 2018, fsd autopilot xxxiii in tesla evolvit, et ab 2018 ad 2020 arcanis inceptis ad intel.

jim keller coniungit tenstorrentum sperans providere "substitutio" gpus carus nvidiae. credit nvidia certa mercatus non bene servire, et haec mercata prorsus sunt quae tenstorrent capere conatur.

tenstorrent suum galaxy systema dicit ter efficaciorem esse et 33% minus carus quam nvidia dgx, mundi cultor popularissimus ai.

secundum relationes, tenstorrent expectatur suam multi-rem secundum ai processum ante finem huius anni dimittere. secundum tenstorrent novissimum viae tabulae ultimae ruinam, societas intendit solum processorem ai processus et quasar ima vis, humilis sumptus pro solutionibus multi-chiporum ai.

societas suum processores praesentes affirmat praebentes efficientiam perficiendi comparabiles cum ai gpus nvidia. eodem tempore, tenstorrent dicit suam architecturae minus memoriae latitudinem consumere quam competitores eius, quae causa est clavis superioris efficientiae et gratuita inferiora.

praecipuum notae chip tentorrent est quod singulae eius plus quam 100 nuclei parvum cpu habent, "cerebrum intra cerebrum". cores "cogitare" sua possunt, decernendi quae data sunt primo procedendi, vel " an certa notitia deponere quae reprimenda censetur.

ut nunc, tentorrent saltem sex gyros imperdiet complevit. antea, investors in tentorrent capitalia maxime audebant, hoc est, postquam jim keller coniunxerunt, societas nova circumscriptionum us$c miliones mense augusto 2023 complevit, et capitale industriae inter collocatores - hyundai automotive group et samsung catalyst fund ausum capitis brachii samsung.

softbank acquirit graphcore ad discount creare competitor ad nvidia

graphcore anno 2016 condita est ab cto simon knowles et ceo nigel toon. societas committitur ad explicandum intelligentiam processing unitas (ipu), processus speciei ad intelligentiam et machinam eruditionem artificiosam designatam, cum unica architectura et commoda, ut architecturae mimd massive parallelae, altae memoriae band et arcte copulatae locali sram distributae, etc.

graphcore compluras productorum ipu fundatorum successive induxit, ut processus ipu gc200, subjice ipu, etc., et pergit technicas upgrades et emendationes exercere.

nihilominus, mense iulio hoc anno, societas chips britanniae ai certantium a softbank acquisita est.

sub conventione, graphcore subsidiaria softbank omnino possessa fiet et sub suo nomine operari perget. secundum relationes, summa transactionis valor circiter 400 decies centena milia librarum attingere potest (circiter 500 decies centena milia us, 3.56 miliardis yuan), quae est circiter 82% minor quam aestimatio graphcore ultimae rotunditatis nummorum 2.8 miliardorum dollariorum. softbank tantum emit eam ad 20% discount.

graphcore olim "versio britannica nvidia" considerabatur. tamen, cum 2020, societas novas obsidendi non accepit et ordines etiam magni ponderis microsoft amisit. hoc factum est ut financially ense et operatione difficilis esset, et non potuit servare cum fossa communi in agro ai chip. eodem tempore civitates americae unitae pergit ad semiconductores ai sinarum moderatores exportationis obstringere, quae etiam progressionem graphcore in sinis afficit.

haec comparatio graphcore non solum statum softbank in agro ai chippis consolidat, sed etiam magni momenti gradus in consilio ai soni est.

veteres google fabrum groq fundaverunt ut novam speciem lpu crearent

mense augusto hoc anno, groq complementum de us$640 decies centena milia serie d imperdiet includere.

societas, a priore google fabrum ionatha ross condita anno 2016, affirmat linguam suam processus unitatis ferrariae lpu currere posse exempla genai existentium, sicut gpt-4, decies velocius dum unam decimam energiae consumit. societas novum exemplar linguae magnae posuit (llm) recordum perficiendi utens meta's llama 2, ad 300 signa per alterum per usor.

comparatus cum versatilitate gpu, quamvis lpu processus linguae bene operetur, eius applicationis ambitus angustus est. hic limitat generalitatem suam ad opera ai latius patefacta. praeterea, ut technologiae emergens, lpu subsidium late a communitate nondum accepit, et usus etiam provocationes praebet.

groq consilia plus quam 108,000 lpus explicandi ab fine primae quartae partis 2025, maxima instruere intellegentiae artificialis coniecturam extra gigantes technologias maiores.

nuntium

quis nvidia repositum fieri potest?

introductio

meus contactus notitia