nvidia gpus इत्यस्य उत्तमदिनानि समाप्ताः वा?

2024-10-03

किं nvidia इत्यस्य “gpu festival” समाप्तं भविष्यति ?

२०२२ तमस्य वर्षस्य नवम्बर्-मासस्य ३० दिनाङ्के संयुक्तराज्ये open ai द्वारा chatgpt इत्यस्य विमोचनात् आरभ्य जननात्मक-ai (कृत्रिम-बुद्धिः) एकः प्रमुखः उन्मादः अभवत्, nvidia इत्यस्य gpus ai अर्धचालकरूपेण लोकप्रियाः अभवन् परन्तु जीपीयू-निर्माणे द्वौ अटङ्कौ स्तः : tsmc इत्यस्य मध्य-परिधि-प्रक्रिया तथा उच्च-बैण्डविड्थ-स्मृतिः (hbm) च dram-सहितं स्तम्भितवती, येन gpu-इत्यस्य वैश्विक-अभावः भवति “किं अटङ्कः hbm-इत्येतयोः मध्ये मध्य-परिधि-प्रक्रिया अस्ति वा टीएसएमसी?”

एतेषु gpu मध्ये "h100" इत्यस्य विशेषतया अधिका माङ्गलिका आसीत्, तस्य मूल्यं $40,000 यावत् उच्छ्रितं, तथाकथितं nvidia "gpu festival" इत्यस्य आरम्भं कृतवान्

अस्मिन् परिस्थितौ tsmc इत्यनेन स्वस्य मध्यप्रक्रिया-अन्तर्पोजर-उत्पादनक्षमता दुगुणा कृता, तथा च sk hynix इत्यादिभिः dram-निर्मातृभिः hbm-उत्पादनं वर्धितम्, यस्य परिणामेण "h100" इत्यस्य लीड्-समयः ५२ सप्ताहात् २० सप्ताहपर्यन्तं लघुः अभवत्

अतः, nvidia इत्यस्य “gpu festival” समाप्तः भविष्यति वा?

अतः, अस्मिन् लेखे वयं चर्चां कुर्मः यत् nvidia इत्यस्य "gpu day" इत्यस्य समाप्तिः भवति वा इति । प्रथमं निष्कर्षस्य विषये वदामः यत् २०२४ तमे वर्षे अपि chatgpt-स्तरीय-ai-विकासाय, संचालनाय च आवश्यकानां उच्चस्तरीय-ai-सर्वर्-मध्ये केवलं ३.९% एव निर्यातः भविष्यति अतः गूगल, अमेजन, माइक्रोसॉफ्ट इत्यादीनां मेघसेवाप्रदातृणां (csp) आवश्यकताः सर्वथा पूरयितुं न शक्यन्ते इति भाति । संक्षेपेण, एतावता nvidia इत्यस्य "gpu festival" इत्यस्य आरम्भः एव अस्ति, तथा च एकः व्यापकः जननात्मकः ai-उत्साहः आगच्छति ।

तदनन्तरं nvidia gpu इत्यस्य प्रमुखयोः अटङ्कयोः संक्षेपेण समीक्षां कुर्मः ।

द्वौ nvidia gpu अटङ्कौ

nvidia gpus इत्यस्य निर्माणे foundry tsmc इत्यस्य उत्तरदायित्वं सर्वासु अग्रे, मध्यमे, पृष्ठे च प्रक्रियासु भवति । अत्र मध्यवर्ती प्रक्रिया gpu, cpu, hbm इत्यादीन् चिप्स् पृथक् पृथक् उत्पादयित्वा १२ इञ्च् सिलिकॉन् वेफरतः कटितस्य वर्गाकारस्य उपधातुस्य उपरि स्थापयितुं प्रक्रियां निर्दिशति अयं उपधातुः सिलिकॉन्-अन्तर्पोजरः इति कथ्यते (चित्रम् १) ।

चित्र 1 2.5d तः 3d पर्यन्तं उद्भूताः मध्यवर्ती प्रक्रियाः, यथा nvidia gpu (स्रोतः: tadashi kamewada)

तदतिरिक्तं tsmc द्वारा विकसितं nvidia gpu संकुलं cowos (chip on wafer on substrate) इति कथ्यते, परन्तु द्वौ अटङ्कौ सिलिकॉन् इन्टरपोजर क्षमता तथा hbm (चित्रम् २) इति स्थितिः यथा ।

चित्रम् २ cowos संरचना तथा nvidia gpu इत्यत्र द्वौ अटङ्कौ (स्रोतः: wikichip)

cowos इत्यस्य विकासः २०११ तमे वर्षे अभवत्, परन्तु ततः परं यथा यथा gpu कार्यक्षमता सुधरति तथा तथा gpu चिप्स् इत्यस्य आकारः निरन्तरं वर्धमानः अस्ति, gpu इत्यस्मिन् संस्थापितानां hbms इत्यस्य संख्या अपि वर्धिता (चित्रम् ३). फलतः सिलिकॉन्-इण्टरपोजर-इत्येतत् प्रतिवर्षं बृहत्तरं भवति, यदा तु एकस्मिन् वेफर-इत्यत्र उपलभ्यमानानां इंटरपोजर-सङ्ख्या विपरीत-अनुपातेन न्यूनीभवति

चित्रम् ३ प्रत्येकं पीढीयाः सह अन्तर्पोजरक्षेत्रं एचबीएम संख्या च वर्धते (स्रोतः: kc yee (tsmc))

तदतिरिक्तं gpu मध्ये संस्थापितानां hbm इत्यस्य संख्या वर्धते, hbm इत्यस्य अन्तः स्तम्भितानां dram चिप्स् इत्यस्य संख्या अपि वर्धते । तदतिरिक्तं dram इत्यस्य लघुकरणं प्रत्येकं वर्षद्वये भवति, तथा च hbm मानकं प्रत्येकं वर्षद्वये अद्यतनं भवति यत् कार्यक्षमतायाः उन्नयनं भवति । अतः अत्याधुनिक एच् बी एम इत्यस्य अभावः अस्ति ।

अस्मिन् परिदृश्ये टीएसएमसी २०२३ तमस्य वर्षस्य ग्रीष्मकालस्य परितः प्रतिमासं १५,००० वेफर्स् इत्यस्मात् आरभ्य अस्मिन् वर्षे ग्रीष्मकालस्य परितः प्रतिमासं ३०,००० तः अधिकानि वेफर्स् यावत् सिलिकॉन् इन्टरपोजर उत्पादनक्षमता दुगुणा करिष्यति तदतिरिक्तं सैमसंग इलेक्ट्रॉनिक्स तथा माइक्रोन् टेक्नोलॉजी इत्यनेन एनवीडिया प्रमाणीकरणं प्राप्य अत्याधुनिक एच् बी एम आपूर्तिः आरब्धा, यस्मिन् पूर्वं एसके हाइनिक्स इत्यस्य वर्चस्वम् आसीत्

उपर्युक्तैः प्रभावितः एनवीडिया एच्१०० इत्यस्य वितरणसमयः यस्य सर्वाधिकमागधा अस्ति, तस्य वितरणसमयः ५२ सप्ताहात् २० सप्ताहपर्यन्तं महत्त्वपूर्णतया न्यूनीकृतः अस्ति । अतः, तस्य परिणामेण ai सर्वरस्य प्रेषणं कियत् वर्धितम्?

द्वयोः प्रकारयोः ai सर्वरस्य परिभाषा

digitimes research द्वारा विमोचितस्य "global annual server shipments, 2023-2024" (servers report database, 2024) इत्यस्य अनुसारं ai सर्वरस्य द्वौ प्रकारौ स्तः :

द्वे वा अधिकेन ai त्वरकेन सुसज्जिताः प्रणाल्याः परन्तु hbm न, "सार्वभौमिक ai सर्वर" इति उच्यन्ते ।

न्यूनातिन्यूनं चतुर्भिः एच् बी एम-सञ्चालितैः एआइ-त्वरकैः सुसज्जिताः प्रणाल्याः "उच्च-अन्त-एआइ-सर्वर्" इति उच्यन्ते ।

अत्र ai त्वरकः ai अनुप्रयोगानाम् त्वरणार्थं डिजाइनं कृतं विशेषं हार्डवेयरं निर्दिशति, विशेषतः तंत्रिकासंजालं यन्त्रशिक्षणं च एकं विशिष्टं उदाहरणं nvidia इत्यस्य gpu अस्ति । तदतिरिक्तं, chatgpt-स्तरीयजननात्मक-ai-विकासाय, संचालनाय च सामान्य-उद्देश्य-ai-सर्वरस्य अपेक्षया उच्च-स्तरीय-ai-सर्वरस्य बहूनां संख्यायाः आवश्यकता भवति

अतः, सामान्य-एआइ-सर्वरस्य उच्च-स्तरीय-एआइ-सर्वर्-इत्यस्य च प्रेषण-आयतनं किम् अस्ति ?

सामान्यः ai सर्वरः उच्चस्तरीयः ai सर्वरः च प्रेषणम्

चित्रे ४ २०२२ तः २०२३ पर्यन्तं सामान्य-एआइ-सर्वरस्य उच्चस्तरीय-एआइ-सर्वरस्य च प्रेषणं दर्शितम् अस्ति । सामान्य एआइ सर्वरस्य प्रेषणं २०२२ तमे वर्षे ३४४,००० यूनिट्, २०२३ तमे वर्षे ४७०,००० यूनिट्, २०२४ तमे वर्षे ७२५,००० यूनिट् च भविष्यति इति अपेक्षा अस्ति ।

चित्र 4 सामान्यः ai सर्वरः उच्चस्तरीयः ai सर्वरः च प्रेषणम् (2022-2024) (स्रोतः: digitimes research)

तस्मिन् एव काले chatgpt-स्तरीयजनरेटिव एआइ इत्यस्य विकासाय संचालनाय च आवश्यकाः उच्चस्तरीयाः ai सर्वराः २०२२ तमे वर्षे ३४,००० यूनिट्, २०२३ तमे वर्षे २००,००० यूनिट्, २०२४ तमे वर्षे ५६४,००० यूनिट् च निर्यातयिष्यन्ति इति अपेक्षा अस्ति

अतः, उच्चस्तरीय-ai-सर्वरस्य प्रेषणं अमेरिकी-सीएसपी-आवश्यकतानां पूर्तिं कर्तुं शक्नोति वा?

चित्रे ५ सर्वरस्य, सामान्यस्य ai सर्वरस्य, उच्चस्तरीयस्य ai सर्वरस्य च प्रेषणसङ्ख्याः दर्शिताः सन्ति । यदा अहम् एतत् चित्रं आकृष्य तत् अवलोकितवान् तदा अहं स्तब्धः अभवम् "किं एतत् कियन्तः उच्चस्तरीयाः ai सर्वराः निर्यातिताः सन्ति?" अद्यापि उच्चस्तरीयः कृत्रिमबुद्धिसर्वरः अस्ति, प्रेषणं च अत्यल्पम् अस्ति ।

चित्रम् ५ सर्वरस्य, सामान्यस्य ai सर्वरस्य, उच्चस्तरीयस्य ai सर्वरस्य च प्रेषणम्

स्रोतः : mic तथा digitimes इत्येतयोः आधारेण लेखकः

अहं तदा अधिकं निराशः अभवम् यदा अहं पश्यन् आसीत् यत् chatgpt-स्तरीयजननात्मक-ai विकसितुं चालयितुं च कति उच्चस्तरीय-ai-सर्वर्-आवश्यकता भविष्यति।

chatgpt स्तरस्य ai जनयितुं उच्चस्तरीयः ai सर्वरः आवश्यकः

इदं ज्ञायते यत् chatgpt इत्यस्य विकासाय संचालनाय च ३०,००० nvidia dgx h100 उच्चस्तरीयाः ai सर्वराः आवश्यकाः सन्ति (चित्रम् ६) । एतां त्रिंशत्सहस्राणां संख्यां दृष्ट्वा मम चक्करः अभवत् ।

चित्र 6 chatgpt चालयितुं कति उच्चस्तरीयाः ai सर्वराः आवश्यकाः सन्ति? (स्रोतः : एच् पी सी जालस्थलम्)

वैसे, "nvidia dgx h100" अष्टभिः "h100" चिपैः सुसज्जितम् अस्ति, प्रत्येकस्य चिप् इत्यस्य मूल्यं च $40,000 यावत् उच्छ्रितम् अस्ति, येन कुल सिस्टम् मूल्यं $460,000 यावत् अभवत् अन्येषु शब्देषु, chatgpt-स्तरीयं ai जनयितुं 30,000 यूनिट् x $460,000 = $13.8 अरब ($1 = 145 येन आधारितं प्रायः 2 खरब येन!) निवेशस्य आवश्यकता भवति

अहं मन्ये विश्वं जननात्मक-ai-प्रणालीभिः परिपूर्णम् अस्ति, परन्तु वास्तवतः कति chatgpt-सदृशाः जननात्मक-ai निर्मिताः (अथवा निर्मिताः भविष्यन्ति)? (चित्रम् ७) २.

चित्र 7 सर्वर-शिपमेण्ट्, उच्च-अन्त-ai-सर्वर्-शिपमेण्ट्, तथा च chatgpt-स्तरीयजननित-ai-प्रणालीनां संख्या (स्रोतः: mic तथा digitimes)

यतः २०२२ तमे वर्षे उच्चस्तरीय-एआइ-सर्वर्-इत्यस्य प्रेषणस्य मात्रा ३४,००० यूनिट् भविष्यति, अतः केवलमेकं chatgpt-स्तरीयं ai-प्रणालीं निर्मातुं शक्यते (इदं chatgpt अस्ति) । तदनन्तरवर्षे २०२३ तमे वर्षे उच्चस्तरीय-एआइ-सर्वर-शिपमेण्ट् २,००,००० यूनिट् यावत् भविष्यति, अतः ६ तः ७ पर्यन्तं chatgpt-स्तरीयाः एआइ-प्रणाल्याः निर्माणं कर्तुं शक्यते । यतः २०२४ तमे वर्षे ५६४,००० उच्चस्तरीय-ai-सर्वर्-इत्यस्य निर्यातस्य अपेक्षा अस्ति, अतः १८ तः १९ पर्यन्तं chatgpt-स्तरीय-ai-प्रणालीनां निर्माणं सम्भवं भविष्यति ।

तथापि उपर्युक्तः अनुमानः कल्पयति यत् chatgpt-स्तरीय ai 30,000 उच्चस्तरीय ai सर्वर "nvidia dgx h100" इत्यनेन सह निर्मातुं शक्यते ।परन्तु यथा यथा एआइ-पीढी अधिका जटिला भवितुम् अर्हति तथा तथा अस्मिन् सन्दर्भे ३०,००० तः अधिकानां एनवीडिया डीजीएक्स एच्१०० इत्यस्य आवश्यकता भवितुम् अर्हति । सर्वाणि वस्तूनि विचार्य, अमेरिकीसञ्चारसेवाप्रदातारः उच्चस्तरीय-एआइ-सर्वरस्य वर्तमान-शिपमेण्ट्-विषये सन्तुष्टाः भवितुम् असम्भाव्यम् ।

अधुना, प्रत्येकस्य अन्त्यप्रयोक्तृणां (यथा संयुक्तराज्ये csp) कति उच्चस्तरीयाः ai सर्वराः सन्ति इति पश्यामः ।

अन्त्यप्रयोक्तृणां कृते उच्चस्तरीय-ai-सर्वरस्य संख्या

चित्रे ८ अन्त्यप्रयोक्तृभिः उच्चस्तरीय-ai-सर्वर्-सङ्ख्या दर्शिता अस्ति । २०२३ तमे वर्षे ओपनएआइ-स्वामित्वस्य माइक्रोसॉफ्ट्-संस्थायाः उच्चस्तरीय-एआइ-सर्वर्-सङ्ख्या सर्वाधिकं ६३,००० यूनिट्-रूपेण अस्ति, परन्तु २०२४ तमे वर्षे गूगल-कम्पनी माइक्रोसॉफ्ट-नगरं अतिक्रम्य उच्चस्तरीय-एआइ-सर्वर्-सङ्ख्या सर्वाधिकं भविष्यति

चित्र 8 अन्त्यप्रयोक्तृ (2023-2024) द्वारा उच्चस्तरीयकृत्रिमबुद्धिसर्वर (स्रोतः: digitimes research)

२०२४ तमे वर्षे शीर्षपञ्चसु स्थानेषु गूगलः अस्ति, यः १६२,००० यूनिट् (५ सिस्टम्) इत्यनेन प्रथमस्थानं प्राप्तवान्, माइक्रोसॉफ्ट ९०,००० यूनिट् (३ सिस्टम्) इत्यनेन द्वितीयस्थानं प्राप्तवान्, सुपर माइक्रो ६८,००० यूनिट् (२ सिस्टम्) इत्यनेन तृतीयस्थानं प्राप्तवान्, अमेजन (६७,००० यूनिट्) चतुर्थस्थानं प्राप्तवान् २ प्रणाल्याः), तदनन्तरं मेटा पञ्चमस्थाने ४६,००० यूनिट् (१ प्रणाली) (कोष्ठकेषु संख्या chatgpt वर्गजनरेशन ai निर्मातुं शक्नोति इति प्रणालीसङ्ख्या अस्ति) अत्र द्रष्टुं शक्यते यत् अमेरिकादेशस्य शीर्षपञ्च सौरतापीविद्युत्निर्माणकम्पनयः प्रायः ८०% भागं एकाधिकारं धारयन्ति ।

तदनन्तरं ai त्वरकानाम् उच्चस्तरीयं ai सर्वरं प्रेषणं पश्यामः (चित्रम् 9 यथा अपेक्षितं, nvidia इत्यस्य gpus ai त्वरकाणां कृते सर्वाधिकं प्रयुक्ताः सन्ति, 2024 तमे वर्षे 336,000 यूनिट् यावत् भवन्ति परन्तु आश्चर्यवत् द्वितीयं लोकप्रियं कम्पनी एएमडी न, अपितु गूगलः अस्ति ।

चित्रम् ९ एआइ त्वरकेन उच्चस्तरीयाः एआइ सर्वराः (२०२३-२०२४) (स्रोतः: digitimes research)

गूगलेन एआइ-त्वरकरूपेण स्वस्य tensor processing unit (tpu) विकसितम् । २०२४ तमे वर्षे अस्मिन् tpu इत्यनेन सुसज्जितानां उच्चस्तरीयानाम् ai सर्वराणां संख्या १३८,००० यावत् भविष्यति । अत्र चित्र ८ तः वयं जानीमः यत् २०२४ तमवर्षपर्यन्तं गूगलस्य १६२,००० उच्चस्तरीयाः ai सर्वराः भविष्यन्ति । अतः १३८,००० यूनिट् गूगलस्य स्वस्य tpu इत्यनेन सुसज्जिताः भविष्यन्ति, शेषाः २४,००० यूनिट् nvidia इत्यस्य gpu इत्यनेन सुसज्जिताः भविष्यन्ति । अन्येषु शब्देषु एनवीडिया कृते गूगलः ग्राहकः अपि च भयंकरः शत्रुः अपि अस्ति ।

तदतिरिक्तं यदि २०२४ तमे वर्षे प्रेषणं पश्यामः तर्हि तृतीयस्थाने स्थितस्य एएमडी इत्यस्य ४५,००० यूनिट् सन्ति, तदनन्तरं चतुर्थस्थाने अमेजन इत्यस्य ४०,००० यूनिट् सन्ति । अमेजनः aws trainium इत्येतत् अपि कृत्रिमबुद्धित्वरकरूपेण विकसितं कुर्वन् अस्ति । यदि अधिकं प्रतीक्षते तर्हि एएमडी अमेजन इत्यनेन अतिक्रान्तं भवितुम् अर्हति।

सारांशतः एनवीडिया इत्यस्य सम्प्रति एआइ त्वरकाणां बृहत्तमं प्रेषणं भवति, परन्तु गूगलः अमेजन च तस्य प्रबलप्रतियोगिनः भवन्ति । एनवीडिया इत्यस्य प्रतियोगी प्रोसेसरनिर्माता एएमडी (निश्चयेन विलुप्तप्रायः इन्टेल् न) नास्ति, अपितु अमेरिकी-सीएसपी गूगलः अमेजन च अस्ति ।

पूर्णपरिमाणेन जननात्मकः एआइ-उत्साहः आगच्छति

एतावता सर्वं सारांशं दद्मः। digitimes research इत्यस्य प्रतिवेदनानुसारं chatgpt-स्तरीयजननात्मक-ai-विकासाय, चालयितुं च समर्थानाम् उच्चस्तरीय-ai-सर्वरस्य प्रेषणं २०२४ तमे वर्षे सर्वेषां सर्वरेषु केवलं ३.९% भागं भवितुं शक्नोति इति अपेक्षा अस्ति एतत् मालवाहनमात्रा केवलं सीएसपी-आवश्यकतानां पूर्तिं कर्तुं न शक्नोति इति विश्वासः अस्ति ।

अन्येषु शब्देषु २०२३ तः २०२४ पर्यन्तं nvidia इत्यस्य “gpu festival” इत्यस्य आरम्भः एव । फलतः पूर्णरूपेण जननात्मकः एआइ-उत्साहः आगमिष्यति इति संभावना वर्तते । अधः मूलभूतं दर्शयामः ।

चित्रे १० अनुप्रयोगेन अर्धचालकविपणनं अर्धचालकउद्योगसङ्घेन (sia) प्रकाशितं तस्य भविष्यस्य पूर्वानुमानं च दर्शितम् अस्ति । एसआईए-अनुमानानाम् अनुसारं २०३० तमे वर्षे वैश्विक-अर्धचालक-विपण्यं १ खरब-अमेरिकीय-डॉलर्-अधिकं भविष्यति ।

चित्रम् १० अनुप्रयोगेन अर्धचालकस्य प्रेषणस्य पूर्वानुमानम् (स्रोतः: sia blog)

२०३० तमे वर्षे बृहत्तमानि विपणयः कम्प्यूटिङ्ग्, डाटा भण्डारणं च भविष्यन्ति । अस्मिन् पीसी-सर्वर् (अवश्यं च उच्चस्तरीय-एआइ-सर्वर्) अन्तर्भवति, परन्तु यतः पीसी-शिपमेण्ट्-मध्ये महती वृद्धिः असम्भवः अस्ति, तस्मात् सर्वर्-इत्यनेन बहुमतं भवितुं शक्यते

तारयुक्तसञ्चारः दत्तांशकेन्द्रेषु प्रयुक्तान् अर्धचालकान् निर्दिशति । अस्य अर्थः अस्ति यत् २०३० तमे वर्षे कम्प्यूटिङ्ग् तथा डाटा स्टोरेज ($३३० बिलियन) + तारयुक्तसञ्चारः ($६० बिलियन) = कुलम् $३९० बिलियनं डाटा सेण्टर् (पीसी सहितम्) कृते अर्धचालकाः भविष्यन्ति, विश्वस्य बृहत्तमं विपण्यं भविष्यति

अन्यत् द्रष्टव्यं वस्तु अस्ति दत्तांशकेन्द्रविपण्यं तस्य सम्भावना च,यथा चित्रे ११ दर्शितम् । २०२२ तमे वर्षे chatgpt इत्यस्य विमोचनानन्तरं डाटा सेण्टर मार्केट् इत्यस्य निरन्तरं वृद्धिः भविष्यति इति अपेक्षा अस्ति । आँकडाकेन्द्रेषु त्रयः तत्त्वानि सन्ति: संजालसंरचना, सर्वरः, भण्डारणं च, सर्वरः भण्डारणं च २०२३ तः २०२९ पर्यन्तं प्रत्येकं मोटेन दुगुणं भविष्यति इति अपेक्षा अस्ति ।

चित्र 11 आँकडा-केन्द्र-बाजार-दृष्टिकोणः (व्यापकः जननात्मकः एआइ-उत्साहः अद्यापि न आगतः) (स्रोतः : statista market insights-आँकडानां आधारेण लेखकः)

एवं प्रकारेण सर्वर-अर्धचालकाः (उच्च-स्तरीय-ai-सर्वर्-सहिताः) वैश्विक-विपण्यस्य बृहत्तमं भागं गृह्णन्ति, तथा च, आँकडा-केन्द्र-विपण्यस्य अपि विस्तारः भविष्यति

अन्तिमवारं पुनः पुनः कुर्वन्तु।एतावता nvidia इत्यस्य "gpu festival" केवलं अवकाशपूर्वस्य कार्यक्रमः एव अस्ति । पूर्णतया जननात्मकः एआइ-उत्साहः आगच्छति।

समाचारं

nvidia gpus इत्यस्य उत्तमदिनानि समाप्ताः वा?

आमुख

मम सम्पर्कसूचना