समाचारं

NVIDIA इत्यस्य तथाकथिताः “hot chips” वस्तुतः “hot platforms” सन्ति ।

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

एनवीडिया अस्मिन् मासे प्रारम्भे दुर्लभेन दुर्वार्ताभिः आहतः यदा कम्पनीयाः बहुप्रतीक्षितः "ब्लैक्वेल्" जीपीयू त्वरकः डिजाइनदोषाणां कारणेन मासत्रयं यावत् विलम्बितुं शक्नोति इति समाचाराः प्रकाशिताः। परन्तु एनवीडिया-प्रवक्ता सर्वं यथानियोजितं गच्छति इति अवदत्, केचन आपूर्तिकर्ताः वदन्ति यत् किमपि परिवर्तनं न जातम्, अन्ये तु केचन सामान्यविलम्बाः अभवन् इति अवदन्।

उद्योगस्य अन्तःस्थजनाः अपेक्षां कुर्वन्ति यत् उपयोक्तारः ब्लैकवेल् इत्यस्य स्थितिविषये अधिकं ज्ञास्यन्ति यदा एनवीडिया आगामिबुधवासरे द्वितीयत्रिमासिकवित्तवर्षस्य २०२५ वित्तीयपरिणामानां घोषणां करिष्यति।

इदं ज्ञातं यत् ब्लैकवेल् चिप्स् - B100, B200 तथा GB200 - आगामिसप्ताहे कैलिफोर्निया-देशस्य स्टैन्फोर्ड-विश्वविद्यालये अस्मिन् वर्षे हॉट्-चिप्स्-सम्मेलनस्य केन्द्रबिन्दुः भविष्यति, यत्र एनवीडिया स्वस्य वास्तुकला-प्रवर्तनं करिष्यति, केषाञ्चन नूतनानां नवीनतानां विवरणं करिष्यति, डिजाइन-निर्माणे प्रयुक्तानां पद्धतीनां रूपरेखां च करिष्यति the chips case of AI तथा एतेषां वर्धमानानाम् AI कार्यभारानाम् संचालनार्थं दत्तांशकेन्द्रेषु द्रवशीतलनस्य विषये शोधस्य चर्चां करोति। एनवीडिया-संस्थायाः त्वरित-कम्प्यूटिङ्ग्-उत्पाद-निदेशकस्य डेव-साल्वाडोरस्य मते, कम्पनी स्वस्य एकस्मिन् डाटा-केन्द्रे पूर्वमेव प्रचलितानि ब्ल्याक्वेल्-चिप्स् अपि प्रदर्शयिष्यति

एनवीडिया ब्लैकवेल् इत्यस्य विषये यत् वदति तस्य अधिकांशं पूर्वमेव ज्ञातम् अस्ति, यथा आगामिवर्षे आगमिष्यमाणः ब्लैकवेल् अल्ट्रा जीपीयू, तथा च रुबिन् जीपीयू इत्यस्य अग्रिमपीढीयाः वेरा सीपीयू इत्यस्य च २०२६ तमे वर्षे प्रसारणं आरभ्यते तथापि साल्वाटरः बोधयति यत्,ब्लैकवेल् इत्यस्य विषये वदन्ते सति एतत् मञ्चरूपेण चिन्तयितुं महत्त्वपूर्णं, न तु व्यक्तिगतचिप् इति।अस्मिन् सप्ताहे हॉट् चिप्स् इत्यस्य सज्जतायै एकस्मिन् ब्रीफिंग् इत्यत्र साल्वाटरः पत्रकारैः विश्लेषकैः च अवदत्।

“यदा भवान् एनवीडिया इत्यस्य विषये चिन्तयति तथा च वयं निर्मीयमानानां मञ्चानां विषये चिन्तयन्ति तदा जीपीयू, नेटवर्किंग् अपि च अस्माकं सीपीयू अपि केवलं आरम्भः एव” इति सः अवदत् “वयं एतानि वस्तूनि निर्मातुं सिस्टम्-स्तरीयं, डाटा सेण्टर्-स्तरीयं च अभियांत्रिकीं कुर्मः ये वास्तवतः बहिः गन्तुं शक्नुवन्ति तथा ताः वास्तविकसमस्यानां समाधानं कुर्वन्ति कठिनजननात्मक-एआइ-चुनौत्यस्य कृते प्रणाल्याः मञ्चाः च वयं कालान्तरेण मॉडल्-आकारं वर्धमानं दृष्टवन्तः, अधिकांशजनन-एआइ-अनुप्रयोगानाम् अपि वास्तविकसमये चालनस्य आवश्यकता वर्तते, तथा च अनुमानस्य आवश्यकताः विगत-कतिपयेषु अत्यन्तं वर्धिताः सन्ति वर्षाणि।

अस्मिन् न केवलं Blackwell GPUs तथा Grace CPUs, अपितु NVLink Switch चिप्स्, Bluefield-3 DPUs, ConnextX-7 तथा ConnectX-8 NICs, Spectrum-4 Ethernet स्विचः, Quantum-3 InfiniBand स्विचः च सन्ति Salvator इत्यनेन NVLink Switch (अधः), Compute, Spectrum-X800 तथा Quantum-X800 इत्येतयोः कृते अपि भिन्नाः सूचनाः दर्शिताः ।

एनवीडिया इत्यनेन अस्मिन् वर्षे मार्चमासे GTC 2024 सम्मेलने बहुप्रतीक्षितं Blackwell आर्किटेक्चरं प्रारब्धम्, हाइपरस्केलनिर्मातारः मूलसाधननिर्मातारः च शीघ्रमेव तया सह पञ्जीकरणं कृतवन्तः कम्पनीयाः दृष्टिः जनरेटिव एआइ इत्यस्य द्रुतगत्या विस्तारमाणे क्षेत्रे वर्गरूपेण अस्ति, यत्र बृहत् भाषाप्रतिमानाः (LLMs) अपि बृहत्तराः भवितुम् अर्हन्ति, यस्य प्रमाणं मेटा इत्यस्य लामा ३.१ इत्यनेन प्राप्यते, यत् जूनमासे अरबौ मापदण्डैः सह ४०५० ए मॉडलेन सह प्रारब्धम् साल्वाटरः अवदत्, .यथा यथा एलएलएम बृहत्तराः भवन्ति तथा च वास्तविकसमयानुमानस्य आवश्यकता अवशिष्टा भवति तथा तथा तेषां कृते अधिकगणना न्यूनविलम्बता च आवश्यकी भविष्यति, यस्य कृते मञ्चदृष्टिकोणस्य आवश्यकता भवति ।

सः अवदत् यत् - "अन्यस्य अधिकांशस्य LLMS इव, ये सेवाः एतेन मॉडलेन चालिताः भविष्यन्ति, ते वास्तविकसमये चालयितुं अपेक्षिताः सन्ति। तदर्थं भवतः बहुविध-GPU-इत्यस्य आवश्यकता वर्तते। आव्हानं अस्ति यत् GPU इत्यस्य उच्च-प्रदर्शनं उच्चैः सह कथं संयोजयितुं शक्यते performance of the GPU इति एतासां AI-सञ्चालितसेवानां उपयोगेन अन्त्यप्रयोक्तृभ्यः महत् उपयोक्तृ-अनुभवं प्रदातुं उपयोगस्य च मध्ये विशालः सन्तुलनः अस्ति” इति ।

०१ वेगस्य आवश्यकता

ब्ल्याक्वेल् इत्यनेन सह एन्विडिया प्रतिस्विच् ९०० जीबी/सेकेण्ड् तः १.८ टीबी/सेकेण्ड् यावत् बैण्डविड्थ् दुगुणं कृतवान् । कम्पनीयाः Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) प्रौद्योगिकी अधिकं कम्प्यूटिंग् तस्मिन् प्रणाल्यां आनयति यत् वास्तवतः स्विचे निवसति एतत् अस्मान् GPU तः किञ्चित् आफ्लोडिंग् कर्तुं शक्नोति यत् कार्यक्षमतां त्वरितुं साहाय्यं करोति, अपि च एतत् NVLink-पटले संजाल-यातायातस्य सुचारु-करणाय अपि सहायकं भवति । एतानि नवीनतानि सन्ति येषां चालनं वयं मञ्चस्तरस्य निरन्तरं कुर्मः।

बहु-नोड् GB200 NVL72 एकं द्रव-शीतलं चेसिस् अस्ति यत् 72 Blackwell GPUs 36 Grace CPUs च रैक-स्केल-डिजाइन-मध्ये संयोजयति यत् Nvidia कथयति यत् GPT-MoE-1.8T इत्यादीनां खरब-पैरामीटर् LLMs कृते एकस्य GPU इत्यस्य रूपेण कार्यं करोति यथा GPT-MoE-1.8T उच्चतरं प्रदाति अनुमानं निष्पादनम् । अस्य कार्यक्षमता एच् जीएक्स एच्१०० प्रणाल्याः ३० गुणा अस्ति, अस्य प्रशिक्षणवेगः एच्१०० प्रणाल्याः ४ गुणा अस्ति ।

एनवीडिया इत्यनेन FP4 इत्यस्य कृते देशीसमर्थनम् अपि योजितम्, कम्पनीयाः Quasar Quantization System इत्यस्य उपयोगेन, यत् FP16 इत्यस्य समानं सटीकताम् प्रदातुं शक्नोति, तथा च बैण्डविड्थ् इत्यस्य उपयोगं ७५% न्यूनीकर्तुं शक्नोति क्वासर क्वाण्टाइजेशन सिस्टम् इति सॉफ्टवेयरं यत् सटीकताम् सुनिश्चित्य ब्लैकवेल् इत्यस्य ट्रांसफार्मर इञ्जिनस्य लाभं लभते, तथा च साल्वेटर इत्यनेन FP4 तथा FP16 इत्येतयोः उपयोगेन निर्मितानाम् जननात्मक एआइ चित्राणां तुलनां कृत्वा एतत् प्रदर्शितम्, येषु कष्टेन एव कोऽपि लक्ष्यमाणः अन्तरः दर्शितः

FP4 इत्यस्य उपयोगेन मॉडल् न्यूनस्मृतेः उपयोगं कर्तुं शक्नोति तथा च Hopper GPU इत्यस्मिन् FP8 इत्यस्मात् अपि उत्तमं कार्यं कर्तुं शक्नोति ।

०२ द्रवशीतलनप्रणाली

द्रवशीतलनस्य दृष्ट्या एनवीडिया उष्णजलस्य प्रत्यक्षचिप्-टू-चिप्-पद्धतिं प्रवर्तयिष्यति यत् आँकडा-केन्द्र-शक्ति-उपयोगं २८% न्यूनीकर्तुं शक्नोति ।

"अस्य दृष्टिकोणस्य विषये यत् रोचकं तत् अस्य केचन लाभाः सन्ति, येषु शीतलनदक्षता वर्धिता, न्यूनतया परिचालनव्ययः, दीर्घकालं यावत् सर्वरजीवनं, अन्येषां उपयोगानां कृते गृहीतस्य तापस्य पुनः उद्देश्यस्य सम्भावना च सन्ति," इति साल्वाटरः अवदत् "एतत् निश्चितरूपेण शीतलनदक्षतायां सुधारं कर्तुं साहाय्यं करिष्यति .एकः उपायः अस्ति यत्, यथा नाम सूचयति, एषा प्रणाली वास्तवतः शीतलकस्य उपयोगं न करोति यदि भवान् चिन्तयति यत् शीतलकस्य कार्यं कथं भवति तर्हि उष्णजलस्य समाधानेन सह अस्माभिः चिलरस्य उपयोगः न करणीयः , येन अस्माकं किञ्चित् ऊर्जायाः रक्षणं भवति, परिचालनव्ययस्य न्यूनीकरणं च भवति” इति ।

अन्यः विषयः अस्ति यत् एनवीडिया कथं कृत्रिमबुद्धेः लाभं लभते, Verilog इत्यस्य उपयोगेन स्वस्य कृत्रिमबुद्धिचिप्सस्य डिजाइनं करोति, एषा हार्डवेयरविवरणभाषा अस्ति, या चतुर्दशकेभ्यः प्रयुक्ता कोडमध्ये परिपथानाम् वर्णनं करोति NVIDIA VerilogCoder इति स्वायत्तेन Verilog एजेण्ट् इत्यनेन सह सहायतां कुर्वन् अस्ति ।

"अस्माकं शोधकर्तृभिः एकं विशालं भाषाप्रतिरूपं विकसितं यस्य उपयोगेन अस्माकं प्रणालीनां वर्णनं कृत्वा Verilog कोडस्य निर्माणं शीघ्रं कर्तुं शक्यते" इति सः अवदत् "वयं तान् कोडानाम् निर्माणे सहायतार्थं भविष्यत्पुस्तकेषु तस्य उपयोगं करिष्यामः। एतत् कर्तुं शक्नोति a lot of things.