समाचारं

Nvidia’s castrated version of B200A उजागरितम्!दृढतमं चिप् आर्किटेक्चरं कठिनं उत्पादयितुं शक्यते: उत्पादनक्षमता पर्याप्तं नास्ति, तथा च छूरी कौशलेन निर्मितुं शक्यते

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मेङ्गचेन् आओफेइ मन्दिरात् आगच्छति
Qubits |.सार्वजनिक खाता QbitAI

एनवीडिया इत्यस्य सर्वाधिकं शक्तिशाली चिप् B200 इति मासत्रयपर्यन्तं स्थगितुं बाध्यः अभवत्, अफवाः च प्रचुराः आसन् ।

अत्र लाओ हुआङ्गस्य प्रतिकारः आगच्छति : चिप् इत्यस्य क्षत्रियसंस्करणम्ख२०० कविवृति।

किम् एतत् ?“उत्पादनक्षमता पर्याप्तं नास्ति, अतः तस्य क्षतिपूर्तिं कर्तुं अस्माभिः छूरीकौशलस्य उपयोगः करणीयः” इति ।



तत्सत्यम्, SemiAnalysis विश्लेषणस्य अनुसारं B200 इत्यनेन सम्मुखीभूता मुख्या समस्या सम्यक् अस्तिअपर्याप्त उत्पादनक्षमता, अधिकविशेषतःTSMC इत्यस्य नूतनपैकेजिंग् प्रक्रिया CoWoS-L इत्यस्य उत्पादनक्षमता अपर्याप्तम् अस्ति

B200A इत्यस्य क्षत्रियसंस्करणस्य उपयोगः प्रथमं मध्यमतः निम्नपर्यन्तं AI प्रणालीनां आवश्यकतानां पूर्तये भविष्यति ।

B200A इत्यस्य क्षत्रियसंस्करणं, स्मृतिबैण्डविड्थः संकुचति

किमर्थं B200A इति क्षत्रियसंस्करणम् इति कथ्यते ?

सूचकः मुख्यतया स्मृतिपट्टिकाविस्तारे प्रतिबिम्बितः भवति ।४टीबी/से, वर्षस्य आरम्भे पत्रकारसम्मेलने B200 द्वारा प्रचारितस्य 8TB/s इत्यस्य प्रत्यक्षतया तुलने।अर्धेन संकुचितः



अस्य पृष्ठतः CoWoS-L द्वारा पैकेजिंग् प्रक्रिया अस्तिCoWoS-S प्रत्यागतवान्, B200A अपि अन्यैः गैर-TSMC 2.5D पैकेजिंग् प्रौद्योगिकीभिः सह यथा Samsung इत्यनेन सह सङ्गतम् इति कथ्यते ।

सामान्यतया CoWoS उन्नतपैकेजिंग् इत्यस्य सम्प्रति त्रीणि रूपाणि सन्ति, CoWoS-、कोवोस्- ९.आरतथा CoWoS- ., मुख्यः भेदः अन्तर्क्षेपकसमाधानं भवति ।

मध्यस्थःचिप् वेफरस्य मुद्रितसर्किटबोर्डस्य च मध्ये चिप् तथा पैकेजिंग् सबस्ट्रेट् इत्येतयोः मध्ये सूचनायाः आदानप्रदानं साक्षात्करोति, तथा च यांत्रिकसमर्थनं तापविसर्जनक्षमता च प्रदाति

CoWoS-S इत्यस्य संरचना सरलतमं भवति, तथा च अन्तर्पोजरः सिलिकॉन् प्लेट् इत्यस्य समकक्षः भवति ।



CoWoS-R प्रयुक्तआरडीएल प्रौद्योगिकी(पुनर्वितरणस्तरः, पुनर्वितरणस्तरः), अन्तरक्षेपकः बहुस्तरीयसंरचनायुक्तः पतलीधातुसामग्री अस्ति ।



CoWoS-L सर्वाधिकं जटिलं भवति, यत्र कLSI चिप्(Local Silicon Interconnect, local silicon interconnection), यत् अधिकं तारघनत्वं प्राप्तुं शक्नोति तथा च बृहत्तरेषु आकारेषु अपि निर्मातुं शक्यते ।



TSMC इत्यनेन CoWoS-L इत्यस्य आरम्भः कृतः यतः प्राचीनप्रौद्योगिक्याः आकारे, कार्यक्षमतायाः च निरन्तरं वृद्धिः कर्तुं कष्टानि अभवन् ।

उदाहरणार्थं, AMD इत्यस्य AI त्वरणचिप् MI300 इत्यस्मिन् CoWoS-S interposer लेयर इत्यस्य विस्तारः मूलमानकस्य 3.5 गुणाधिकं कृतम् अस्ति, परन्तु भविष्यस्य AI चिप् प्रदर्शनवृद्धेः आवश्यकतां पूरयितुं अद्यापि कठिनम् अस्ति

परन्तु अधुना, अत्र वार्ता अस्ति यत् CoWoS-L इत्यनेन उत्पादनक्षमतायाः वृद्धेः समये काश्चन समस्याः अभवन्, तथा च सिलिकॉन्, इन्टरपोजर, सबस्ट्रेट् च मध्ये समस्याः भवितुम् अर्हन्तितापविस्तारस्य गुणांकः असङ्गतिः, यस्य परिणामेण मोचनं भवति, इत्यस्य पुनर्निर्माणस्य आवश्यकता वर्तते।

पूर्वं TSMC इत्यनेन CoWoS-S इत्यस्य उत्पादनक्षमतायाः बृहत् परिमाणं निर्मितम्, यत्र Nvidia इत्यस्य बृहत्तमः भागः अस्ति । इदानीं Nvidia इत्यस्य मागः शीघ्रमेव CoWoS-L इत्यत्र स्थानान्तरितुं शक्नोति, परन्तु TSMC इत्यस्य उत्पादनक्षमतां नूतनप्रक्रियायां परिवर्तयितुं समयः स्यात् ।

तदतिरिक्तं B200A (internal model B102) इत्यस्य कोरस्य उपयोगः अपि भविष्ये B20 इत्यस्य विशेषसंस्करणस्य निर्माणार्थं भविष्यति इति वार्ता अस्ति ।

B200 प्रशिक्षणं बृहत् मॉडल् अन्येषां आव्हानानां अपि सम्मुखीभवति

ब्ल्याक्वेल् इत्यनेन प्रवर्धितं मुख्यं विनिर्देशं "गणना-एककानां नूतना पीढी" इति ।जीबी२०० एनवीएल७२, एकस्मिन् मन्त्रिमण्डले ३६ CPUs + ७२ GPUs सन्ति ।

कम्प्यूटिंगशक्तिः अतीव उत्तमः अस्ति FP8 परिशुद्धतायां एकस्य कैबिनेटस्य प्रशिक्षणगणनाशक्तिः 720PFlops इत्येव अधिका अस्ति, यत् H100 युगे DGX SuperPod सुपरकम्प्यूटरक्लस्टरस्य (1000PFlops) समीपे अस्ति

परन्तु विद्युत् उपभोगः अपि अतीव उत्तमः अस्ति अर्धविश्लेषणस्य अनुमानस्य अनुसारम्।शक्ति घनत्वप्रायः प्रतिमन्त्रिमण्डलम्१२५किलोवाट् , अपूर्वम् । विद्युत् आपूर्तिः, तापविसर्जनः, जालविन्यासः, समानान्तरता, विश्वसनीयता इत्यादीनां दृष्ट्या आव्हानानि आनयति ।

वस्तुतः उद्योगेन अद्यापि एच्१ मिलियन कार्ड् क्लस्टरं पूर्णतया न वशीकृतम् यस्य उपयोगः बृहत् मॉडल् प्रशिक्षणार्थं कृतः अस्ति ।

यथा, लामा ३.१ श्रृङ्खलायाः तकनीकीप्रतिवेदने दर्शितं यत् प्रशिक्षणकाले प्रत्येकं त्रयः घण्टेषु एकवारं औसतविफलता भवति, येषु ५८.७% जीपीयू-कारणम् आसीत्

कुल ४१९ विफलतासु १४८ विभिन्नैः GPU विफलताभिः (NVLink विफलताभिः सह) उत्पन्नाः, ७२ च विशेषतया HBM3 स्मृतिविफलतायाः कारणेन अभवन्



अतः सामान्यतया, यदि लाओ हुआङ्गः अन्ततः B200 निर्यातयति चेदपि, AI दिग्गजस्य कृते B200 समूहस्य वास्तविकनिर्माणं कर्तुं बृहत् मॉडलप्रशिक्षणे निवेशं कर्तुं च अधिकं समयं गृह्णीयात्।

जीपीटी-५, क्लाउड् ३.५ ओपस्, लामा ४ इत्यादीनि, येषां प्रशिक्षणं पूर्वमेव आरब्धम् अथवा समाप्तिः समीपे अस्ति, तेषां उपयोगः ब्लैकवेल् इत्यस्य शक्तिः यावत् अग्रिमपीढीयाः मॉडल् न भविष्यति।

एकं अधिकं वस्तु

B200 स्थगनस्य अफवाः प्रतिक्रियारूपेण NVIDIA इत्यनेन आधिकारिकप्रतिक्रिया दत्ता यत् -

हॉपरस्य आग्रहः प्रबलः अस्ति तथा च ब्लैकवेल् इत्यस्य नमूनापरीक्षाः व्यापकरूपेण आरब्धाः सन्ति,वर्षस्य उत्तरार्धे उत्पादनस्य वृद्धिः भविष्यति इति अपेक्षा अस्ति

मासत्रयं यावत् विलम्बः भविष्यति वा इति विशिष्टम् उत्तरं न दीयते।

परन्तु मोर्गन स्टैन्ले इत्यस्य नवीनतमप्रतिवेदने अधिकं आशावादी आसीत्, यतः तस्य विश्वासः आसीत् यत् उत्पादनं केवलं प्रायः सप्ताहद्वयं यावत् स्थगितम् भविष्यति इति ।

सन्दर्भलिङ्कानि : १.
[1]https://x.com/dylan522p/status/1820200553512841239
[2]https://www.semianalysis.com/p/nvidias-blackwell-पुनर्निर्मित-शिपमेंट
[3]https://3dfabric.tsmc.com/अंग्रेजी/समर्पितफाउंड्री/प्रौद्योगिकी/cowos.htm
[4]https://www.trendforce.com/news/2024/03/21/news-blackwell-प्रवेश-प्रवेश-प्रवेशः-tsmcs-cowos-शाखायां-समीपतः/
[5]https://ieeexplore.ieee.org/दस्तावेज/9501649