nuntium

NVIDIA dicta "abutaria calida" actu sunt "rostra calida"

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Nvidia cum perraro malo nuntiorum ante hoc mense percussus est, cum rumores exsurrexerunt societatem "Blackwell" GPU acceleratricem tantopere praeveniri posse, quantum tres menses ob vitia designandi. Sed Nvidia prolocutor dixit omnia ex sententia factura esse, cum praebitus quidam nihil mutavit dicens, cum alii moras solitos esse dicebant.

Industriae insidiatores exspectant utores plus de condicione Blackwell cognoscent cum Nvidia suam secundam quartam partem fiscalis 2025 oeconomico proximo Mercurii nuntiat.

Ferunt Blackwell chippis - B100, B200 et GB200 - focus in Colloquium Hot Chips in Universitate Stanfordiae in California proximo septimanae huius anni futurum esse, ubi Nvidia suam architecturam introducet, nonnullas novas innovationes explicabit et methodos excogitandi adhibitas adumbrabit. xxxiii. Secundum Dave Salvador, moderatrix Nvidia productorum computandi acceleratorum, societas etiam astularum Blackwell ostentabit quae iam in una e centris notitiarum currit.

Pleraque eorum quae de Nvidia de Blackwell loquitur iam nota est, ut Blackwell Ultra GPU anno proximo venientem, et posteros GPUs Rubin et Vera CPUs in anno 2026 evolvere incipiens. Salvator tamen inculcat;Cum de Blackwell loquitur, Gravis est ut suggestum cogitet, non unum assulam.Salvator nuntiavit notarios et analystas hac hebdomade in brevitate praeparationis ad Hot Chips.

"Cum de Nvidia et suggestis aedificamus, GPUs, networking et etiam CPUs nostri initium sunt," dixit et problemata realia solvenda. Systema et rostra pro lento generativo AI provocationes vidimus. magnitudines exemplorum in tempore crescere, et applicationes maxime generativas AI reali tempore currere necesse est, et requisita ad consequentiam in his paucis praeteritis temporibus aucta sunt. annis. .Real-time magnae linguae exemplar consequentia multiplex GPUs requirit et, in proximo futuro, plures nodos ministrant.

Hoc includit non solum Blackwell GPUs et Gratia CPUs, sed etiam NVLink chips switch, Bluefield-3 DPUs, ConnextX-7 et ConnectX-8 NICs, Spectrum-4 Ethernet virgas, et Quantum-3 InfiniBand virgas. Salvator etiam varias informationes ostendit pro NVLink SWITCH (infra), Compute, Spectrum-X800 et Quantum-X800.

Nvidia maxime anticipavit architecturam Blackwell in colloquio GTC 2024 mense Martio hoc anno, et artifices hyperscales et artifices originalis instrumenti celeriter signati sunt. Societas visum suum obnixe in campum generativae AI rapide dilatavit, ubi magna exempla linguae (LLMs) ampliora sunt, ut patet ex Meta's Llama 3.1, quae mense Iunio cum 4050 Exemplar cum billions parametris emissa est. Salvator dixit;Cum LLMs maiora accedunt et necessaria consequentiae real-time restant, maiorem supputationem et inferiorem latentiam requirent, quae suggestum accedunt.

Dixit: "Sicut pleraque alia LLMS, officia quae ab hoc exemplari desiderantur ut in reali tempore currendum sit. Facere quod debes multiplex GPUs. Provocatio est quomodo summa observantia GPU cum altissimis cohaerere GPU in observantia

01 Necessitas velocitatis

Cum Blackwell, Nvidia bandam latitudinem per transitum duplicavit ab 900 GB/sec ad 1.8 TB/sec. Congregatio Scalable hierarchicae societatis et reductionis Protocollum (SHARP) technologiam plus computando in systemate, quod actu in switch residet. Permittit nos facere aliquod offloading ex GPU ad adiuvandum celeritatem faciendi, et adiuvat etiam in NVLink fabricae retiaculas expolitas. Hae sunt innovationes quas in gradu tribunali pellere pergimus.

Nodus multiformis GB200 NVL72 est chassis liquida refrigeratus quae 72 Blackwell GPUs coniungit et 36 Gratia CPUs in eculeo consilio quem Nvidia dicit unum GPU esse pro trillion parametri LLMs, sicut GPT-MoE-1.8T altiorem praebet. Con- fectio. Effectus eius XXX temporibus systematis HGX H100 est, eiusque disciplina celeritas est 4 temporum H100.

Nvidia etiam vernaculum subsidium FP4 addidit, adhibito societatis Quatizationis Quasar System, quod eandem accurationem ac FP16 praebere potest dum band latitudo usus 75% minuitur. Systema Quasar Quantizationis programmatis est quod leverages Transformer Blackwell Engine curandi accurate, et Salvator demonstravit hoc comparando imagines generativos AI creatos utentes FP4 et FP16, quod vix quaslibet notabiles differentias ostendit.

Utens FP4, exemplar minus memoria uti potest et melius quam FP8 in Hopper GPU facere.

02 Systema liquidum refrigerandi

Secundum liquidam refrigerationem, Nvidia aquam calidam in modum chip-ad-chip directam introducet quae usui 28% instrumenti potentiae datae reducere potest.

"Quid interest de hac accessione aliqua beneficia eius, quae augentur refrigerationem efficientiam, inferiores pretia laboris, diutius vitam ministrantem, et possibilitatem reponendi caloris captos in alios usus", Salvator dixit "Certe auxilium emendare refrigerandi efficientiam" Uno modo est, ut nomen sonat, haec ratio non actu leo ​​utetur. Si cogitas quomodo armarium operatur, optime operatur quae nos aliqua industria salvat et pretia laboris minuit.

Alius locus est quam Nvidia intelligentiam artificialem leveraging, suamque intelligentiam artificialem Verilog utens, lingua ferramentaria quae circuitiones in codice describit quae quattuor decenniis adhibita est. NVIDIA adiuvat cum agente autonomo Verilog nomine VerilogCoder.

"Investigatores nostri magnum exemplar linguae elaboraverunt quod fieri potest ad accelerandam creationem codicis Verilogi qui systemata nostra describit", dixit Multum. Adiuvare potest consilium et processum verificationis accelerare, aspectus manuales consilii accelerat et per se multa opera automata.