समाचारं

पत्रं शीर्षसङ्गणकवास्तुसम्मेलने प्रस्तुतम्, एज एआइ कृते चिप् आर्किटेक्चरः सर्वोत्तमः समानान्तरगणनाविकल्पः अभवत्

2024-08-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

यन्त्रस्य हृदयं मुक्तम्

मशीन हृदय सम्पादकीय विभाग

बृहत् एआइ मॉडल् इत्यस्य विस्फोटेन जीपीयू इत्यस्य प्रबलमागधा कृता, मेघात् धारं यावत् प्रविशन्तः एआइ अनुप्रयोगाः एज एआइ सर्वरस्य त्वरणप्रोसेसरस्य च माङ्गं अपि चालयिष्यन्ति GPGPU, FPGA, NPU तथा ASIC इत्येतयोः तुलनां कृत्वा पुनः विन्यस्तं कम्प्यूटिंग् आर्किटेक्चर CGRA एज एआइ कृते सर्वाधिकं उपयुक्तं समानान्तरगणना आर्किटेक्चरं भवति कोर डायनामिक्स इत्यनेन प्रस्तावितः पुनर्विन्यासयोग्यः समानान्तरप्रोसेसरः (RPP) पारम्परिक-सीजीआरए-अपेक्षया बृहत्-परिमाणेन समानान्तर-प्रक्रियाकरणाय अधिकं उपयुक्तः कम्प्यूटिंग-आर्किटेक्चरः अस्ति परिषद। आरपीपी आर्किटेक्चर इत्यस्य आधारेण R8 चिप् तदनन्तरं उच्च-प्रदर्शन-पुनरावृत्ति-चिप्स् च एज ए.आइ.सर्वर्-ए.आइ.पी.सी.

सामग्रीसूची

1. एज एआइ इति किम् ?

2. एज ए आई सर्वर मार्केट ट्रेण्ड्स्

3. एज एआइ कृते उपयुक्तं आदर्श कम्प्यूटिंग आर्किटेक्चर

4. आरपीपी आर्किटेक्चरस्य विस्तृतव्याख्या

5. आरपीपी प्रोसेसर R8 इत्यस्य ऊर्जादक्षतायाः तुलना

6. आरपीपी प्रोसेसरः अन्तर्राष्ट्रीयशैक्षणिकप्रधिकारिभिः मान्यताप्राप्तः अस्ति

7. उपसंहारः

1. एज एआइ इति किम् ?

एज एआइ (AI Edge) कृत्रिमबुद्धि (AI) तथा एज कम्प्यूटिंग् इत्येतयोः सङ्गमे उन्नतप्रौद्योगिकी अस्ति एषा अवधारणा वितरितगणनाप्रतिमानपरिवर्तनात् उत्पद्यते यस्मिन् एआइ मेघात् धारं प्रति गच्छति एज एआइ इत्यस्य मूलं भवति यत् एआइ एल्गोरिदम् प्रत्यक्षतया स्थानीयवातावरणे एम्बेड् करणीयः यत् बृहत् परिमाणेन आँकडानां जनयति, यथा स्मार्टफोन्, IoT उपकरणानि, अथवा स्थानीयसर्वरः, तथा च "एज" इत्यत्र स्थितानां उपकरणानां प्रणालीनां च माध्यमेन वास्तविकसमयस्य आँकडासंसाधनं चालयति । जालस्य (अर्थात् दत्तांशस्रोतस्य समीपे) संसाधनस्य विश्लेषणस्य च ।

पारम्परिकदत्तांशकेन्द्रेषु अथवा क्लाउड् कम्प्यूटिङ्ग् मञ्चेषु एआइ प्रशिक्षणस्य अथवा अनुमानस्य तुलने एज एआइ इत्यस्य मुख्यलाभः "स्थले एव प्रसंस्करणम्" अस्ति, यत् आँकडासंचरणस्य प्रसंस्करणस्य च विलम्बं बहु न्यूनीकरोति एतत् बुद्धिमान्निरीक्षणे, स्वायत्तवाहनचालने, स्वायत्तवाहनचालने, उपयोगी भवति real-time medical diagnosis or औद्योगिकस्वचालननियन्त्रणादिषु अनुप्रयोगपरिदृश्येषु विशेषतया महत्त्वपूर्णम् अस्ति ।

एज एआइ कम्प्यूटिंग् कार्यान्विताः उपकरणाः प्रणाल्याः च मुख्यतया अन्तर्भवन्ति :

  1. स्मार्ट टर्मिनल् : मुख्यतया आँकडानां जननार्थं वा संग्रहणार्थं वा उपयुज्यमानं यन्त्रं, यथा स्मार्ट-संवेदकाः, स्मार्टफोनाः, एआइ-पीसी अथवा IoT-यन्त्राणि;
  2. एज एआइ सर्वर: एज उपकरणानि तथा सॉफ्टवेयर-हार्डवेयर-प्रणाल्यानि ये प्रत्यक्षतया एकत्रित-आँकडानां संसाधनं विश्लेषयन्ति च, यथा समर्पितानि बृहत्-भाषा-प्रतिरूपं (LLM) एआइ-अनुमान-सर्वर्, बुद्धिमान् चालन-क्षेत्र-गणना-केन्द्र-सर्वर् इत्यादयः
  3. संचारजालसाधनम् : यद्यपि संचारजालस्य कृते एज एआइ अनुप्रयोगानाम् बैण्डविड्थस्य गतिस्य च आवश्यकता मेघस्य इव अधिका नास्ति तथापि एज एआइ द्वारा आवश्यकं न्यूनविलम्बतां वास्तविकसमयस्य च आवश्यकतां प्राप्तुं विश्वसनीयाः उच्चगतिसंयोजनानि प्रदत्तानि भवेयुः

अस्मिन् लेखे मुख्यतया एज एआइ सर्वरस्य तेषां विपण्यविकासप्रवृत्तीनां, एआइ त्वरणप्रोसेसरस्य आवश्यकताः, एज एआइ अनुप्रयोगानाम् उपयुक्तस्य समानान्तरगणना आर्किटेक्चरस्य प्रोसेसरस्य कार्यान्वयनस्य च चर्चा कृता अस्ति

2. एज ए आई सर्वर मार्केट ट्रेण्ड्स्

एआइ सर्वरः कृत्रिमबुद्धि-अनुप्रयोगानाम् कृते विशेषतया विनिर्मितं उच्च-प्रदर्शन-सङ्गणक-उपकरणं निर्दिशति तथा च बृहत्-परिमाणे आँकडा-संसाधनम्, आदर्श-प्रशिक्षणं, अनुमान-गणना च इत्यादीनां जटिल-कार्यस्य समर्थनं कर्तुं शक्नोति एआइ-सर्वर्-इत्येतत् प्रायः उच्च-प्रदर्शन-प्रोसेसरैः, उच्च-गति-स्मृतिभिः, बृहत्-क्षमता-युक्तैः उच्च-गति-भण्डारण-प्रणालीभिः, ए.आइ.-एल्गोरिदम्-द्वारा गणना-संसाधनानाम् अत्यन्तं उच्च-माङ्गं पूर्तयितुं च कुशल-शीतलन-प्रणालीभिः सुसज्जिताः भवन्ति विभिन्नवर्गीकरणमानकानां अनुसारं एआइ सर्वरं प्रशिक्षणसर्वर, अनुमानसर्वर, GPU सर्वर, FPGA सर्वर, CPU सर्वर, क्लाउड् एआइ सर्वर, एज एआइ सर्वर च इति मोटेन विभक्तुं शक्यते

गार्टनरस्य पूर्वानुमानस्य अनुसारं अधुना २०२७ पर्यन्तं एआइ सर्वर्-विपण्यं तीव्रवृद्धिं निर्वाहयिष्यति, यत्र ३०% पर्यन्तं चक्रवृद्धिवार्षिकवृद्धिः भविष्यति । एजन्सीद्वारा प्रकाशितेन "२०२४ तमस्य वर्षस्य प्रथमत्रिमासिकस्य वैश्विकसर्वरबाजारप्रतिवेदने दर्शितं यत् अस्मिन् वर्षे प्रथमत्रिमासे वैश्विकसर्वरबाजारविक्रयः ४०.७५ अरब अमेरिकीडॉलर् आसीत्, यत् वर्षे वर्षे ५९.९% वृद्धिः अभवत्, प्रेषणं २.८२ मिलियनं यूनिट् आसीत्; वर्षे वर्षे ५.९% वृद्धिः अभवत् । अनेकानाम् एआइ सर्वर-आपूर्तिकर्तानां मध्ये इन्स्पर् इन्फॉर्मेशन-संस्था विश्वे द्वितीयस्थानं प्राप्नोति, चीनदेशे च प्रथमस्थानं प्राप्नोति, अस्य सर्वर-शिपमेण्ट् वैश्विकविपण्यस्य ११.३% भागं भवति, वर्षे वर्षे ५०.४% वृद्धिः, तथा च TOP5 निर्माताओं।

चीनव्यापार-उद्योग-अनुसन्धान-संस्थायाः प्रकाशितस्य "२०२४-२०२९ चीन-सर्वर-उद्योगस्य माङ्ग-पूर्वसूचना-विकास-प्रवृत्ति-अग्रे-दृष्टि-रिपोर्ट्" इत्यस्य अनुसारं २०२२ तमस्य वर्षस्य अन्ते कुल-घरेलु-बाजारस्य आकारः ४२ अरब-युआन्-अधिकः भविष्यति, एकवर्षे -वर्षस्य वृद्धिः प्रायः २०%, इदं प्रायः ४९ अरब युआन भविष्यति, बाजारस्य विकासस्य दरः क्रमेण मन्दः भवति, २०२४ तमे वर्षे बाजारस्य आकारः ५६ अरब युआन् यावत् भवितुं शक्नोति; मालवाहनस्य दृष्ट्या चीनस्य एआइ सर्वर-बाजारस्य प्रेषणं २०२२ तमे वर्षे प्रायः २८४,००० यूनिट् भविष्यति, यत् वर्षे वर्षे प्रायः २५.६६% वृद्धिः भविष्यति;

बृहत् एआइ-माडल-विकासस्य आरम्भिकेषु दिनेषु एआइ-सर्वर्-मागधा मुख्यतया मॉडल्-प्रशिक्षणम् आसीत्, अतः प्रशिक्षण-सर्वर्-इत्यस्य विपण्यां वर्चस्वम् आसीत् । सम्प्रति एआइ-सर्वर-विपण्यस्य ५७.३३% भागः सर्वर्-प्रशिक्षणं करोति, अनुमानसर्वर्-इत्यस्य च ४२.६७% भागः अस्ति । परन्तु यथा यथा जननात्मकाः एआइ-अनुप्रयोगाः धारायां प्रविशन्ति तथा तथा भविष्ये अनुमानसर्वरः क्रमेण विपण्यस्य मुख्यधारा भविष्यति, तथा च एज-एआइ-सर्वरः प्रेषणस्य दृष्ट्या मेघप्रशिक्षणं अनुमानसर्वरं च अतिक्रमयिष्यति इति अपेक्षा अस्ति

IDC इत्यस्य नवीनतमः "चीन-अर्धवार्षिक-एज-कम्प्यूटिङ्ग्-बाजारः (पूर्णवर्षः २०२३)-निरीक्षणम्" इति प्रतिवेदनस्य आँकडानां ज्ञायते यत् चीनस्य एज-कम्प्यूटिङ्ग्-सर्वर-बाजारः २०२३ तमे वर्षे निरन्तरं वर्धमानः भविष्यति, यत्र वर्षे वर्षे २९.१% वृद्धिः भविष्यति आईडीसी इत्यस्य भविष्यवाणी अस्ति यत् २०२८ तमे वर्षे चीनस्य एज कम्प्यूटिङ्ग् सर्वर मार्केट् १३.२ बिलियन अमेरिकी डॉलरं यावत् भविष्यति ।



एज कम्प्यूटिङ्ग् इत्यस्य महत्त्वपूर्णभागत्वेन २०२३ तमे वर्षे अनुकूलित एज सर्वरस्य परिमाणं २४० मिलियन अमेरिकीडॉलर् यावत् अभवत्, यत् २०२२ तमस्य वर्षस्य तुलने १६.८% वृद्धिः अभवत् निर्माताविक्रयस्य दृष्ट्या एज कस्टम् सर्वर मार्केट् इत्यस्मिन् बृहत्तमाः निर्मातारः इन्स्पर् इन्फॉर्मेशन, लेनोवो, हुवावे, एच् 3 सी च सन्ति । एज कम्प्यूटिंग अनुप्रयोगानाम् विविधविकासेन सह उदयमानसर्वरनिर्मातृणां व्यावसायिकपरिदृश्येषु अनुप्रयोगबाजारेषु च प्रमुखाः सफलताः भविष्यन्ति यथा वाहन-मार्गसहकार्यं, एज-एआइ, स्मार्ट-टर्मिनल् च, येन एज-सर्वर-बाजारः विविध-परिदृश्यं प्रस्तुतं करिष्यति

3. एज एआइ कृते उपयुक्तं आदर्श कम्प्यूटिंग आर्किटेक्चर

PC युगस्य नेतृत्वं WINTEL (Microsoft Windows + Intel CPU) इति गठबन्धनेन क्रियते, स्मार्टफोनयुगस्य नेतृत्वं च Android+Arm गठबन्धनेन क्रियते । एकः नूतनः गठबन्धनः उद्भवति अर्थात् एनवीडिया तथा टीएसएमसी द्वारा निर्मितः एनटी गठबन्धनः (Nvidia+TSMC) । वालस्ट्रीट् निवेशविशेषज्ञानाम् भविष्यवाणीनुसारं एनटी एलायन्स् इत्यस्य कुलराजस्वं २०२४ तमे वर्षे २०० अरब अमेरिकीडॉलर् यावत् भविष्यति, कुलशुद्धलाभः १०० अरब अमेरिकीडॉलर् यावत् भविष्यति, कुलविपण्यमूल्यं च ५ खरब अमेरिकीडॉलर् अधिकं भविष्यति इति अपेक्षा अस्ति क्लाउड् एआइ प्रशिक्षणेन एआइ बृहत् मॉडल् अनुप्रयोगैः च चालितः एनवीडिया इत्यस्य जीपीयू तथा टीएसएमसी इत्यस्य एआइ चिप् निर्माणव्यापारः अस्मिन् वर्षे सर्वाधिकं विजेता भविष्यति।

यद्यपि NVIDIA क्लाउड् AI प्रशिक्षणं अनुमानं च विपण्यां निरपेक्षं प्रबलं स्थानं धारयति, तथापि NVIDIA इत्यस्य GPGPU एज AI अनुप्रयोगपरिदृश्येषु सर्वोत्तमः विकल्पः नास्ति यतोहि तस्य कम्प्यूटिंग आर्किटेक्चरस्य निहितः उच्चः शक्तिः उपभोगः उच्चव्ययः च अधिकेषु अनुप्रयोगेषु तस्य उपयोगं सीमितं करोति व्यापकं विकीर्णं च धार एआइ अनुप्रयोगाः। सङ्गणक-वास्तुकला-क्षेत्रे विद्वांसः विशेषज्ञाः च ऊर्जा-कुशल-समानान्तर-प्रौद्योगिकी-वास्तुकलाम् अन्विषन्ति यत् डोमेन-विशिष्ट-वास्तुकला (DSA) इत्यस्य आधारेण GPGPU इत्यस्य स्थाने ASIC-निर्माणं सम्भवः प्रमुखः विचारः अस्ति, यथा गूगलस्य टेन्सर-प्रक्रियाकरण-एककम् (TPU), । यत् यन्त्रशिक्षणकार्यभारस्य त्वरिततायै डिजाइनं कृतम्, अयं प्रोसेसरः सिस्टोलिक-सरणिका-आर्किटेक्चरस्य उपयोगं करोति यत् गुणन-सञ्चय-कार्यक्रमं कुशलतया करोति तथा च आँकडा-केन्द्र-अनुप्रयोगेषु लक्षितम् अस्ति अन्यः विचारः अस्ति यत् सैमसंग-द्वारा प्रतिनिधित्वं कृतं तंत्रिका-प्रक्रियाकरण-एककं (NPU) अस्ति, यत् विशेषतया चल-दृश्यानां कृते डिजाइनं कृतम् अस्ति तथा च ऊर्जा-बचत-आन्तरिक-उत्पाद-इञ्जिन् अस्ति यत् गहन-शिक्षण-अनुमानस्य कार्यक्षमतां अनुकूलितुं निवेश-विशेषता-नक्शस्य विरलतायाः उपयोगं कर्तुं शक्नोति

यद्यपि TPUs तथा NPUs इत्येतयोः द्वयोः अपि उच्च-प्रदर्शन-शक्ति-बचत-समाधानं प्रदातुं शक्यते ये GPGPU-इत्यस्य आंशिकरूपेण स्थानं गृह्णन्ति, तथापि तेषां विशेष-डिजाइन-गुणाः तेषां बहुमुख्यतां व्यापक-प्रयोज्यतां च सीमितयन्ति ताइवान-चीन-देशयोः अनुसंधान-विकास-केन्द्रैः सह कैलिफोर्निया-देशे स्थितः एज एआइ-चिप्-स्टार्टअप-संस्थायाः क्नेरोन्-इत्यनेन पुनः विन्यस्तं एनपीयू-समाधानं प्रस्तावितं यत् एनपीयू-चिप्स्-इत्यनेन आँकडा-गहन-प्रोग्रामेबिलिटी-विश्वसनीयतायाः बलिदानं विना ASIC-इत्यस्य उच्च-प्रदर्शनं भवति अद्वितीयं नवीनं च वास्तुकला उत्तमप्रदर्शनं च कृत्वा क्नेरोन्-दलेन IEEE CAS 2021 Darlington Best Paper Award इति पुरस्कारः प्राप्तः । Kneron इत्यस्य चतुर्थपीढीयाः पुनर्विन्यासयोग्यः NPU एकस्मिन् समये CNN तथा Transformer संजालस्य चालनस्य समर्थनं कर्तुं शक्नोति, तथा च यन्त्रदृष्टिः शब्दार्थविश्लेषणं च कर्तुं शक्नोति साधारण-एआइ-माडलस्य विपरीतम् यत् केवलं विशिष्ट-अनुप्रयोगानाम् लक्ष्यं भवति, क्नेरोन्-इत्यस्य पुनर्विन्यासयोग्य-कृत्रिम-न्यूरल-जालम् (RANN) प्रौद्योगिकी अधिका लचीली अस्ति तथा च भिन्न-भिन्न-अनुप्रयोग-आवश्यकतानां पूर्तये विविध-कम्प्यूटिंग-आर्किटेक्चर-सम्बद्धानां अनुकूलतां च कर्तुं शक्नोति कम्पनीयाः अनुसारं तस्य एज जीपीटी एआइ चिप् केएल८३० एआइ पीसी, यूएसबी एक्सेलरेटर् स्टिक्स्, एज सर्वर्स् च इत्यत्र प्रयोक्तुं शक्यते यदा जीपीयू इत्यनेन सह उपयोगः भवति तदा एनपीयू इत्यनेन उपकरणस्य ऊर्जायाः उपभोगः ३०% न्यूनीकर्तुं शक्यते

पुनर्विन्यासयोग्यः हार्डवेयरः अन्यत् समाधानं यत् उच्च-प्रदर्शनं ऊर्जा-बचत-गणना च प्रदातुं शक्नोति FPGAs कस्टम् कम्प्यूटिंग् कोर्स् कार्यान्वितुं प्रोग्रामेबल इन्टरकनेक्ट्स् इत्यनेन सह विन्यासयोग्यतर्कखण्डानां उपयोगं कुर्वन्ति । इयं अनुकूलितगणनाशक्तिः FPGA-आधारितत्वरकान् वित्तीयगणना, गहनशिक्षणं, वैज्ञानिकसिमुलेशनं च इत्यादिषु बृहत्-परिमाणेषु कम्प्यूटिंग-अनुप्रयोगेषु विस्तृत-श्रेण्यां परिनियोजितुं समर्थयति तथापि, FPGAs द्वारा प्रदत्ता बिट-स्तरीयपुनर्विन्यासक्षमता स्केलस्य व्यय-प्रभावशीलतां विना महत्त्वपूर्णक्षेत्रं तथा शक्ति-उपरिभारं च सह आगच्छति, यत् अनुप्रयोग-परिदृश्येषु तस्य प्रयोज्यतां बहुधा सीमितं करोति यत्र न्यून-विद्युत्-उपभोगस्य लघु-आकारस्य च आवश्यकता भवति

मोटे-दानेदार-पुनर्विन्यासयोग्य-वास्तुकला (CGRA) पुनः विन्यस्त-हार्डवेयरस्य अन्यस्य वर्गस्य प्रतिनिधित्वं करोति । FPGAs इत्यस्य तुलने CGRAs मोटे-दानेदार-पुनर्विन्यासक्षमताम् प्रदाति, यथा शब्द-स्तरीय-पुनर्विन्यासयोग्यकार्यात्मक-एककाः । यतो हि CGRA इत्यस्य अन्तः ALU मॉड्यूल् निर्मितम् अस्ति, तथा च तस्य परस्परसंयोजनं FPGA इत्यस्मात् सरलतरं लघु च अस्ति, तस्य विलम्बः कार्यक्षमता च FPGA इत्यस्मात् महत्त्वपूर्णतया उत्तमः अस्ति, यत् गेटस्तरस्य परस्परं सम्बद्धं भवति यत् संयोजनात्मकं कम्प्यूटिंग् तर्कं निर्माति CGRA शब्द-वार-प्रकारस्य (32bit इकाई) पुनः विन्यस्त-गणनायाः कृते अधिकं उपयुक्तः अस्ति, तथा च FPGA इत्यस्य समय-क्षेत्रं, शक्ति-ओवरहेड्-समस्यां च न्यूनीकर्तुं शक्नोति

CGRA इत्यस्य विकास-इतिहासस्य संक्षेपेण समीक्षां कुर्मः :

  1. १९९१ तमे वर्षे एव अन्तर्राष्ट्रीयशैक्षणिकवृत्तैः पुनर्विन्यासयोग्यचिप्सविषये शोधं आरब्धम्;
  2. २००३ तमे वर्षे यूरोपीय-वायु-अन्तरिक्ष-रक्षा-समूहः (EADS) उपग्रहेषु पुनः विन्यस्त-गणना-चिप्स-इत्यस्य उपयोगे अग्रणीः अभवत्;
  3. २००४ तमे वर्षे यूरोपस्य IMEC इत्यनेन गतिशीलरूपेण पुनः विन्यस्तं संरचना ADRES इति प्रस्तावितं, यत् सैमसंगस्य जैवचिकित्सा, उच्चपरिभाषाटीवी इत्यादिषु उत्पादानाम् अन्यश्रृङ्खलासु प्रयुक्ता अस्ति जापानस्य रेनेसास् प्रौद्योगिकी अपि एतत् वास्तुकलाम् अङ्गीकुर्वति
  4. २००६ तमे वर्षे सिङ्घुआ विश्वविद्यालयस्य सूक्ष्मविद्युत्संस्थानस्य प्रोफेसरः वी शाओजुन् इत्यस्य नेतृत्वे पुनर्विन्यासयोग्यगणनादलेन पुनर्विन्यासयोग्यगणनासिद्धान्तस्य वास्तुकलानां च विषये शोधं कर्तुं आरब्धम्
  5. २०१७ तमे वर्षे अमेरिकी रक्षा उन्नतसंशोधनपरियोजना एजेन्सी (DARPA) इत्यनेन इलेक्ट्रॉनिक्स पुनरुत्थानपरिकल्पना (ERI) इत्यस्य प्रारम्भस्य घोषणा कृता, यत्र "पुनर्विन्यासयोग्यगणना" प्रौद्योगिकी आगामिषु ३० वर्षेषु संयुक्तराज्यसंस्थायाः सामरिकप्रौद्योगिकीषु अन्यतमा इति सूचीकृता
  6. २०१८ तमे वर्षे सिन्हुआ विश्वविद्यालयस्य पुनर्विन्यासयोग्यकम्प्यूटिङ्ग् प्रौद्योगिक्याः आधारेण किङ्ग्वेई इन्टेलिजेन्स् इति संस्था स्थापिता, आधिकारिकतया व्यावसायिकीकरणप्रक्रियायाः आरम्भं च कृतवती । २०१९ तमे वर्षे किङ्ग्वेइ इंटेलिजेण्ट् इत्यनेन विश्वस्य प्रथमं पुनर्विन्यासयोग्यं बुद्धिमान् स्वरचिप् TX210 इति सामूहिकरूपेण निर्मितम्, येन पुनर्विन्यासयोग्यस्य कम्प्यूटिङ्ग् इत्यस्य व्यावसायिकमूल्यं सिद्धम् अभवत् । २०२० तमे वर्षे किङ्ग्वेई इंटेलिजेण्ट् इत्यनेन चीन इलेक्ट्रॉनिक्स सोसाइटी इत्यस्मात् प्रौद्योगिकी-आविष्कारस्य प्रथमं पुरस्कारं प्राप्तम्, राष्ट्रिय-कोषस्य द्वितीयः चरणः किङ्ग्वेइ इंटेलिजेण्ट् इत्यत्र निवेशं कृतवान् वर्तमान समये Qingwei Intelligent इत्यस्य त्रयः प्रमुखाः चिप् उत्पादाः सन्ति : एज एण्ड् कृते TX2 तथा TX5 श्रृङ्खला चिप्स्, तथैव सर्वर क्षेत्रस्य कृते TX8 श्रृङ्खला च । तेषु TX2 तथा TX5 श्रृङ्खला चिप्स् स्मार्टसुरक्षा, वित्तीयभुगतानम्, स्मार्टवेयरेबल्स्, स्मार्टरोबोट् इत्यादिषु अनेकक्षेत्रेषु उपयुज्यन्ते; बृहत् एआइ मॉडल् इत्यस्य।
  7. पुनर्विन्यासयोग्यगणनाप्रौद्योगिक्याः आधारेण अन्यः घरेलुः एआइ चिप् स्टार्टअपः ज़ुहाई कोर पावरः २०१७ तमे वर्षे स्थापितः ।अस्य पुनर्विन्यासयोग्यः समानान्तरप्रोसेसर (RPP) आर्किटेक्चरः CGRA इत्यस्य उन्नतसंस्करणम् अस्ति २०२१ तमे वर्षे प्रथमं चिप् आरपीपी-आर८ सफलतया टेप आउट् अभवत् २०२३ तमे वर्षे वित्तीयगणना, औद्योगिकचित्रकला, रोबोट् इत्यादिषु एज एआइ एप्लिकेशन मार्केट् इत्यत्र प्रवेशं कृत्वा एज एआइ सर्वर मार्केट् इत्यत्र प्रवेशार्थं इन्स्पर् इन्फॉर्मेशन इत्यनेन सह सामरिकसहकार्यं प्राप्तवान्

अन्तर्राष्ट्रीयसङ्गणकशैक्षणिकसमुदायः उच्चप्रौद्योगिकी-उद्योगश्च एकं सहमतिम् अवाप्तवान् यत् CGRA आर्किटेक्चर-आधारित-पुनर्विन्यासयोग्य-कम्प्यूटिंग-चिप्स्-इत्यस्य सामान्य-गणना-क्षमतायाः विस्तृत-श्रेणी अस्ति, ते च विविध-धार-AI-गणना-परिदृश्येषु प्रयोक्तुं शक्यन्ते उच्चगणनाशक्तिः न्यूनशक्ति-उपभोगः च एकमात्रः उपायः ।

4. RPP प्रोसेसर आर्किटेक्चरस्य विस्तृतव्याख्या

आरपीपी तथा सीजीआरए इत्येतौ द्वौ अपि मोटे-दानेदार-पुनर्विन्यासयोग्य-सरणौ स्तः, उभयत्र ASIC-सदृशं क्षेत्रघनत्वं शक्ति-दक्षतां च प्राप्तुं शक्यते, तथा च द्वयोः सॉफ्टवेयर-सहितं प्रोग्रामं कर्तुं शक्यते परन्तु पुनः विन्यासयोग्यप्रकारस्य प्रोग्रामिंगप्रतिरूपस्य च दृष्ट्या आरपीपी अद्यापि सीजीआरएतः भिन्नः अस्ति, विशेषतः निम्नलिखितरूपेण ।

1. RPP एकः अर्ध-स्थिरः पुनर्विन्यासयोग्यः सरणी अस्ति, यदा तु पारम्परिकः CGRA सामान्यतया गतिशीलपुनर्विन्यासयोग्यसरणीनां कृते उपयुज्यते । स्थिरपुनर्विन्यासयोग्यसरण्याः अर्थः अस्ति यत् प्रसंस्करण-एकके (PE) प्रत्येकस्य निर्देशस्य निष्पादनं कालान्तरेण न परिवर्तते, तथा च दत्तांशप्रवाहः अपि अपरिवर्तितः भवति । संकलकस्य कृते स्थिरपुनर्विन्यासयोग्यसरणीनां समये निर्देशानां व्यवस्थापनस्य आवश्यकता नास्ति, येन RPP निर्माणं सरलं भवति तथा च निर्देशविनियोगवेगः अतीव न्यूनः भवति अतः RPP सहजतया विशालं सरणीं, यथा 32x32 सरणीं कार्यान्वितुं शक्नोति । पारम्परिक-सीजीआरए-अपेक्षया आरपीपी बृहत्-परिमाणेन समानान्तर-गणनायाः कृते अधिकं उपयुक्तम् अस्ति ।

2. RPP बहु-धागायुक्तस्य SIMT प्रोग्रामिंग-प्रतिरूपस्य उपयोगं करोति, यदा तु CGRA प्रायः एक-धागायुक्त-भाषा-प्रोग्रामिंगस्य उपयोगं करोति । आरपीपी CUDA भाषायाः सह सङ्गतम् अस्ति तथा च समानान्तरगणनायाः कृते अधिकं उपयुक्तम् अस्ति । CUDA भाषायां प्रोग्रामर-जनाः आरम्भादेव दत्तांश-समानान्तरतायाः प्रमाणं विचारयितुं प्रवृत्ताः सन्ति तथा च CUDA-भाषायां समानान्तर-अल्गोरिदम्-इत्यस्य अभिव्यक्तिं कर्तुं प्रवृत्ताः सन्ति, तथा च CUDA-भाषा अतीव सरलः अस्ति type and is only used for data समानान्तरगणना, तथा च समानान्तरतायाः डिग्री प्रोग्रामस्य अन्तः नित्यं तिष्ठति । CGRA प्रायः C language + independent compiler इत्यस्य उपयोगं करोति यद्यपि सैद्धान्तिकरूपेण एतत् किमपि गणनाप्रकारं आच्छादयितुं शक्नोति तथापि संकलकः अतीव जटिलः अस्ति तथा च उच्चसंकलनदक्षतां प्राप्तुं कठिनम् अस्ति ।

अधोलिखितं चार्टं आरपीपी इत्यस्य तुलनां अनेकैः मुख्यधारापुनर्विन्यासयोग्यत्वरणवास्तुकलाभिः सह करोति ।



आरपीपी आर्किटेक्चरस्य लाभाः निम्नलिखितचत्वारि बिन्दवः इति सारांशतः वक्तुं शक्यन्ते ।

  1. गैसकेटस्मृत्या सह रिंग-आकारस्य पुनः विन्यासयोग्यः समानान्तर-प्रक्रिया-वास्तुकला भिन्न-भिन्न-दत्तांश-प्रवाहयोः मध्ये आँकडानां कुशल-पुनः-उपयोगस्य अनुमतिं ददाति;
  2. श्रेणीबद्धस्मृतिनिर्माणे कुशलं लचीलं च स्मृतिप्रवेशं प्राप्तुं बहुविधदत्तांशप्रवेशविधाः, पतामानचित्रणरणनीतयः, साझास्मृतिविधाः च सन्ति;
  3. विविधाः हार्डवेयर-अनुकूलन-तन्त्राणि यथा समवर्ती कर्नेल्-निष्पादनं, रजिस्टर-विभाजनं पुनः पूरणं च, तथा च विषम-स्केलर-सदिश-गणनाः समग्र-हार्डवेयर-उपयोगं कार्यक्षमतां च सुधारयन्ति
  4. संकलक, रनटाइम् वातावरणं, अत्यन्तं अनुकूलितं RPP पुस्तकालयं च सह CUDA-सङ्गतः अन्त्यतः अन्ते यावत् सम्पूर्णः सॉफ्टवेयर-स्टैक्, एज एआइ अनुप्रयोगानाम् द्रुतं कुशलं च परिनियोजनं सक्षमं करोति

कोर डायनामिक्स इत्यनेन आरपीपी आर्किटेक्चर इत्यस्य आधारेण आरपीपी हार्डवेयर डिजाइन ब्लॉक आरेखं प्रस्तावितं, तथा च R8 चिप् इत्यस्य माध्यमेन अस्य समानान्तरगणना आर्किटेक्चरस्य लाभाः यथार्थतया प्रदर्शिताः अस्मिन् हार्डवेयर डिजाइन कार्यान्वयनम् मुख्यतया Circular Reconfigurable Processor, memory unit, sequencer च भवति, यथा अधोलिखिते चित्रे दर्शितम् अस्ति ।

  1. लूप् पुनर्विन्यासयोग्यप्रोसेसराः विशालरूपेण समानान्तरगणनायाः मूलगणनाघटकाः सन्ति ।
  2. स्मृति-एककं बहुषु स्मृति-बैङ्केषु विभक्तं भवति, येषु प्रत्येकं कार्यक्रमस्य काल-स्थानिक-स्थानीयतायाः शोषणं कृत्वा कुशल-दत्तांश-पुनर्प्रयोगं सक्षमं कर्तुं संग्रहणेन सह युग्मितं भवति मध्यवर्तीदत्तांशः तदा एव स्थानान्तरितः स्मृति-एकके संगृहीतः च भवति यदा रिंग-पुनर्विन्यस्त-प्रोसेसरस्य अन्तः रजिस्टर्-बफर्स् च पूर्णाः भवन्ति ।
  3. अनुक्रमकस्य उपयोगः रिंग पुनः विन्यस्तप्रोसेसरं प्रति निर्देशान् विकोडयितुं वितरितुं च भवति तथा च DDR तः प्राप्तान् निर्देशान् संग्रहीतुं कैशस्य उपयोगं करोति ।



रिंग पुनः विन्यासयोग्यसंसाधके NPU प्रसंस्करण-एककं (PE) तथा च शिम्-स्मृतिः अन्तर्भवति । प्रत्येकं पीई स्मृति-एकके आँकडा-प्रवेशस्य सुविधायै स्मृति-पोर्ट्-सहितं भवति । स्मृति-द्वारं भिन्न-दत्तांश-प्रवेश-विधानानां, साझा-स्मृति-विधानानां च समर्थनाय मोड-नियन्त्रकेन, पता-गणना-एककेन, बहु-मल्टिप्लेक्सर्-इत्यनेन च सह डिजाइनं कृतम् अस्ति लचीला अन्तर्-प्रोसेसर-सञ्चारं सक्षमं कर्तुं प्रत्येकं पीई कुशल-आँकडा-अग्रेषणाय स्विच-बॉक्स् (SB) तथा च इन्टरकनेक्ट् स्विच-बॉक्स (ICSB) एकीकृत्य स्थापयति एते पीई रेखीयक्रमेण सम्बद्धाः भवन्ति, यत्र शिमस्मृतिः प्रथमस्य अन्तिमस्य च PU मध्ये सेतुरूपेण कार्यं करोति, अतः रिंग टोपोलॉजी निर्माति

रिंग पुनर्विन्यासयोग्यप्रोसेसरस्य अन्तः आँकडासंसाधनं प्रथमपीईतः आरभ्यते तथा च पीई-प्रकारेण पीई-प्रसारणं करोति, यत्र क्रमेण अनन्तरं पीई-भ्यः मध्यवर्तीगणनापरिणामानां उत्पादनं भवति शिम स्मृतिः अन्तिमस्य PE इत्यस्य आउटपुट् कैश कृत्वा प्रथमे PE मध्ये पुनः परिसञ्चारयति, तस्मात् आँकडा स्थानीयतां अधिकतमं करोति तथा च स्मृति-एककं प्रति स्मृति-यातायातम् समाप्तं करोति पीई इत्यस्मिन् मुख्यः कम्प्यूटिङ्ग् घटकः प्रोसेसिंग् इञ्जिन् अस्ति । प्रत्येकस्मिन् पीई मध्ये बहुविधाः गणितीयतर्क-एककाः (ALUs) सन्ति, येषु प्रत्येकं आँकडा-पञ्जिकायाः, पता-पञ्जिकायाः ​​च सह युग्मितं भवति । एते आँकडा-पञ्जिकाः एकत्रिताः भवन्ति यत् प्रत्येकस्य पीई-अन्तर्गतं आँकडानां शीघ्रं प्रवेशं सुलभं कर्तुं आँकडा-बफरं निर्मायते ।

तदतिरिक्तं रेखीयस्विचिंगजालस्य शिमस्मृतेः च संयोजनेन पारम्परिकजाल-आधारित-सीजीआरए-डिजाइनेषु जटिलजालमार्गनिर्धारणं समाप्तं कुर्वन् लचीलदत्तांशप्रवाहनियन्त्रणं कुशलदत्तांशपुनर्प्रयोगं च सक्षमं करोति स्मृति-एककानां कृते लचीलेन कुशलतया च आँकडा-प्रवेशेन सह मिलित्वा आरपीपी आँकडा-प्रवाह-प्रक्रियाकरणस्य अनुकूलनं कर्तुं शक्नोति तथा च स्मृति-यातायातस्य न्यूनीकरणं कर्तुं शक्नोति, तस्मात् संसाधन-उपयोग-दक्षतां अधिकतमं कर्तुं शक्नोति

आरपीपी प्रोसेसरः लचीलबहु-थ्रेडेड्-पाइपलाइन्-कृते स्ट्रीमिंग्-दत्तांश-प्रवाह-प्रक्रियाकरणं सक्षमं कर्तुं SIMT-प्रोग्रामिंग-प्रतिरूपं स्वीकरोति ।



विद्यमानस्य GPGPU सॉफ्टवेयर इकोसिस्टम् इत्यनेन सह संगततां सुनिश्चित्य कोर पावर इत्यस्य RPP प्रोसेसरः CUDA इत्येतत् स्वीकरोति, यस्य विस्तृतः उपयोक्तृमूलः अस्ति । CUDA कोडः LLVM-आधारित-अग्रभागेन RPP पृष्ठभागस्य कृते PTX-सङ्केतः जनयितुं विश्लेषितः भवति । RPP संकलकः CUDA कर्नेल् इत्यस्य व्याख्यां आँकडाप्रवाहग्राफरूपेण करोति तथा च तान् वर्चुअल् डाटा मार्गेषु (VDPs) मैप् करोति । ततः VDP हार्डवेयर-प्रतिबन्धाधारितं बहुभौतिकदत्तांशमार्गेषु (PDPs) विघटितं भवति, तथा च प्रत्येकस्य PDP-विन्यासः क्रमाङ्ककर्त्रेण रनटाइम्-समये उत्पद्यते

आरपीपी इत्यस्य सॉफ्टवेयर-ढेरः यन्त्र-शिक्षणं, विडियो/प्रतिबिम्ब-प्रक्रियाकरणं, संकेत-संसाधनं च समाविष्टं विशालरूपेण समानान्तर-अनुप्रयोगानाम् एकां विस्तृत-श्रेणीं समर्थयितुं शक्नोति । यन्त्रशिक्षण-अनुप्रयोगानाम् कृते, स्टैक् PyTorch, ONNX, Caffe, TensorFlow इत्यादिभिः भिन्न-भिन्न-मुख्यधारा-रूपरेखाभिः सह सङ्गतम् अस्ति । तदतिरिक्तं उपयोक्तृभ्यः CUDA इत्यस्य उपयोगेन स्वस्य कस्टम् प्रोग्राम् परिभाषितुं लचीलापनं भवति । एते उच्चस्तरीयाः अनुप्रयोगाः RPP-रूपरेखाद्वारा नियन्त्रिताः भवन्ति, यस्मिन् संकलकः भिन्नाः डोमेन-विशिष्टपुस्तकालयाः च सन्ति । सॉफ्टवेयर-स्टैक् इत्यस्य अधः RPP रनटाइम् वातावरणस्य RPP चालकानां च उपयोगः भवति यत् एतत् सुनिश्चितं भवति यत् टूल्-शृङ्खलायाः उपयोगेन संकलिताः कार्यक्रमाः अन्तर्निहित-हार्डवेयर्-उपरि निर्विघ्नतया निष्पादयितुं शक्नुवन्ति

5. आरपीपी प्रोसेसर R8 इत्यस्य ऊर्जादक्षतायाः तुलना

उपर्युक्त RPP प्रोसेसर हार्डवेयर डिजाइन तथा सम्पूर्ण सॉफ्टवेयर स्टैक् आधारित RPP-R8 चिप् कम्प्यूटिंग् प्रदर्शनस्य ऊर्जा दक्षतायाः च दृष्ट्या कथं कार्यं करोति?

R8 चिप् इत्यस्य कार्यक्षमतायाः मापदण्डाः निम्नलिखितसारणीयां दर्शिताः सन्ति ।



एज कम्प्यूटिंग् परिदृश्यानां कृते कोर पावर इत्यनेन RPP-R8 चिप् इत्यस्य तुलना द्वयोः NVIDIA एज जीपीयू इत्यनेन सह कृता: जेट्सन् नैनो तथा जेट्सन् जेवियर एजीएक्स इति । जेटसन नैनो इत्यस्य चिप् आकारः आरपीपी इत्यस्य सदृशः अस्ति, यः भौतिकक्षेत्रस्य बाधायाः अन्तः प्रासंगिकं तुलनां प्रदाति, जेटसन जेवियर एजीएक्स इत्यस्य चयनं आरपीपी-आर८ इत्यस्य समतुल्यस्य सैद्धान्तिकस्य थ्रूपुट् इत्यस्य आधारेण कृतम् आसीत् कोर डायनामिक्स इत्यनेन एतेषां त्रयाणां AI त्वरणमञ्चानां मूल्याङ्कनं ResNet-50 अनुमानं कृतम् जेट्सन नैनो इत्यस्य थ्रूपुट् बेन्चमार्कपत्रात् आगच्छति, यदा तु जेवियर एजीएक्स इत्यस्य प्रदर्शनस्य आँकडा आधिकारिक एनवीडिया वेबसाइटतः आगच्छति ।



यथा उपरि सारणीयां दर्शितं, आरपीपी-आर८ इत्यस्य मापितं परिचालनप्रवाहं क्रमशः जेटसन नैनो तथा जेट्सन जेवियर एजीएक्स इत्येतयोः ४१.३ गुणान् २.३ गुणान् च भवति भवन्तः जानन्ति, Jetson Xavier AGX इत्यस्य चिप् आकारः R8 इत्यस्य प्रायः त्रिगुणः अस्ति, प्रक्रिया च अधिका उन्नता (12 nm vs. 14 nm), परन्तु तस्य कार्यक्षमता R8 इत्यस्मात् न्यूनम् अस्ति ऊर्जादक्षतायाः दृष्ट्या R8 इत्यस्य ऊर्जादक्षता क्रमशः जेट्सन् नैनो तथा जेट्सन् जेवियर एजीएक्स इत्येतयोः ऊर्जादक्षता क्रमशः २७.५ गुणा ४.६ गुणा च अस्ति । एते परिणामाः दर्शयन्ति यत् आरपीपी-आर८ सीमितक्षेत्रस्य विद्युत्बजटस्य च एज एआइ परिदृश्येषु जेटसन नैनो तथा जेटसन जेवियर एजीएक्स इत्येतयोः महत्त्वपूर्णतया अधिकं प्रदर्शनं करोति ।



गहनशिक्षणअनुमानं व्यापकरूपेण मान्यताप्राप्तः विशालरूपेण समानान्तरकार्यभारः अस्ति तथा च RPP-R8 हार्डवेयरस्य प्रमुखः अनुप्रयोगः अस्ति । ResNet-50 इत्यादिवर्गीकरणमाडलस्य तुलने योलो श्रृङ्खलामाडलस्य उच्चतरगणनाजटिलतां दृष्ट्वा कोर पावर इत्यनेन NVIDIA Jeston Nano Orin इत्यस्य GPU मञ्चरूपेण चयनं कृतम्, यस्य शिखरं थ्रूपुटं Jetson AGX Xavier इत्यस्मात् अधिकं भवति, 40 TOPS इत्यत्र यतः CPUs सामान्यतया उच्च-प्रदर्शन-गहन-शिक्षण-अनुमानार्थं न निर्मिताः सन्ति, Jetson Xavier Nx 21 TOPS इत्यस्य शिखर-थ्रूपुट्-युक्तस्य तुल्यकालिक-निम्न-अन्त-GPU-मञ्चरूपेण चयनितम् 1, 2, 4 इत्येतयोः बैच-आकारस्य कार्यभारस्य मूल्याङ्कनं भवति, यत् वास्तविक-धार-परिदृश्यानि प्रतिबिम्बयति । उपरिष्टाद् चित्रे त्रयाणां मञ्चानां थ्रूपुट्-प्रदर्शन-तुलना दर्शिता अस्ति, यत्र RPP-R8 इत्यनेन Yolo-v5m तथा Yolo-v7 tiny इत्यत्र अधिकं थ्रूपुट् दर्शितम् अस्ति । 1 इत्यस्य बैच आकारे RPP-R8 इत्यस्य थ्रूपुट् जेस्टन् नैनो ओरिन् इत्यस्मात् प्रायः 1.5× ∼2.5 गुणाधिकं भवति तथा च जेस्टन् जेवियर एनएक्स इत्यस्मात् 2.6× ∼4.3 गुणाधिकं भवति

मूल्याङ्कनस्य परीक्षणस्य च परिणामाः दर्शयन्ति यत् आरपीपी विलम्बता, थ्रूपुट्, ऊर्जादक्षतायाः च दृष्ट्या पारम्परिकजीपीयू, सीपीयू, डीएसपी आर्किटेक्चरभ्यः अधिकं प्रदर्शनं करोति । आरपीपी प्रोसेसरस्य कार्यक्षमतासुधारस्य कारणं तस्य अद्वितीयहार्डवेयरविशेषताः सन्ति, येषु मुख्यतया अन्तर्भवति: 1) परिपत्रदत्तांशप्रवाहप्रक्रियाकरणम्: पीई-मध्ये पाइपलाइन-रजिस्टर-द्वारा तथा FIFO-द्वारा मध्यवर्ती-परिणामानां प्रवाहः, दूरस्थ-स्मृति-भण्डारण-पर्यन्तं आँकडा-गति-स्मृति-यातायातस्य महतीं न्यूनीकरणं करोति GPU तथा CPU इत्यत्र data processing इत्यस्य तुलने mode अधिकं कार्यक्षमः अस्ति । २) श्रेणीबद्धस्मृतिप्रणाली : आरपीपी स्वस्य पदानुक्रमितस्मृतिप्रणालीद्वारा आँकडास्थानीयतां अधिकतमं करोति । RPP-R8 चिप् क्षेत्रस्य बृहत् भागः (प्रायः ३९.९%) ऑन-चिप् स्मृत्यर्थं समर्पितः अस्ति । एषः डिजाइन-विकल्पः स्मृतिक्षमतायाः विस्तृतपरिधिं प्रदाति, दत्तांशपुनरुपयोगं वर्धयति, बाह्यस्मृतौ नित्यं प्रवेशस्य आवश्यकतां न्यूनीकरोति च । ३) सदिशीकरणं बहु-धागायुक्तं पाइपलाइनं च : RPP इत्यस्य हार्डवेयर आर्किटेक्चर तथा प्रोग्रामिंग मॉडल कुशलं सदिशीकरणं बहु-धागायुक्तं पाइपलाइनं च सक्षमं करोति । इदं डिजाइनं समानान्तरप्रक्रियाकरणार्थं आरपीपी इत्यस्य पूर्णगणनाक्षमतायाः पूर्णं लाभं लभते, येन सुनिश्चितं भवति यत् तस्य संसाधनानाम् अधिकतमं उपयोगः भवति, तस्मात् कार्यप्रदर्शने सुधारः भवति

ऊर्जा-उपभोगे, विलम्बे, थ्रूपुटे च लाभस्य अतिरिक्तं आरपीपी स्वस्य लघुक्षेत्रस्य कृते अपि विशिष्टः अस्ति । केवलं ११९ वर्गमिलिमीटर् चिप् क्षेत्रस्य उपभोगः आरपीपी-आर८ क्षेत्र-प्रतिबन्धित-धार-गणनायाः आदर्शं मञ्चं करोति । आरपीपी इत्यस्य अन्यत् विशेषता अस्य उच्चप्रोग्रामेबिलिटी अस्ति, यस्य समर्थनं व्यापकेन अन्तः अन्तः सॉफ्टवेयर-स्टैक् इत्यनेन भवति यत् परिनियोजनदक्षतां महत्त्वपूर्णतया वर्धयति CUDA इत्यनेन सह संगतता उपयोक्तृभ्यः परिचितस्य CUDA पारिस्थितिकीतन्त्रस्य लाभं ग्रहीतुं समर्थयति, शिक्षणवक्रं लघु करोति तथा च सुलभतया स्वीकरणं प्रवर्धयति। जस्ट-इन्-टाइम प्रोग्रामिंग् तथा ग्राफिकल प्रोग्रामिंग मोड्स् समर्थयति, उपयोक्तृभ्यः विविधगणनाआवश्यकतानां पूर्तये उच्चस्तरीयं लचीलतां प्रदाति OpenRT तथा RPP-BLAS सहितं भिन्नं पुस्तकालयसमर्थनं विविधपरिदृश्येषु उच्चप्रदर्शनस्य कुशलनियोजनस्य च सुविधां करोति । हार्डवेयर आर्किटेक्चर तथा सॉफ्टवेयर समर्थन सहितं पूर्ण-स्टैक् समाधानं आरपीपी विभिन्नेषु एज कम्प्यूटिंग हार्डवेयरमध्ये विशिष्टं करोति ।

6. आरपीपी वास्तुकला अन्तर्राष्ट्रीयशैक्षणिकप्रधिकारिभिः मान्यतां प्राप्नोति

इम्पेरियल् कॉलेज् लण्डन्, कैम्ब्रिज विश्वविद्यालयः, सिंघुआ विश्वविद्यालयः, सन याट्-सेन् विश्वविद्यालयः इत्यादीनां शीर्षविश्वविद्यालयानाम् कोर डायनामिक्स तथा कम्प्यूटर आर्किटेक्चर दलानाम् सह-लिखितं "Circular Reconfigurable Parallel Processor for Edge Computing" (RPP chip architecture) इति पत्रं सफलतया स्वीकृतम् अस्ति अन्तर्राष्ट्रीयसंगोष्ठी (ISCA 2024) इत्यस्य उद्योगपट्टिकायां समाविष्टस्य 51 तमे कम्प्यूटरवास्तुकलासम्मेलनेन। कोर डायनामिक्सस्य संस्थापकः मुख्यकार्यकारी च डॉ. ली युआन् तथा इम्पेरियल् कॉलेजस्य पीएचडी स्नातकः होङ्गक्सियाङ्ग फैन् (अधुना यूके-देशस्य केम्ब्रिज्-नगरस्य सैमसंग-ए.आइ.-केन्द्रे शोध-वैज्ञानिकः) च अर्जेन्टिना-देशस्य ब्यूनस-आयरेस्-नगरे ISCA 2024-सम्मेलने भाषणं दातुं आमन्त्रितः, तथा च Experts from इन्टेल्, एएमडी इत्यादयः अन्तर्राष्ट्रीयप्रसिद्धाः कम्पनयः मञ्चं साझां कृतवन्तः ।



अस्मिन् ISCA इत्यनेन विश्वस्य सर्वेभ्यः देशेभ्यः कुलम् ४२३ उच्चगुणवत्तायुक्तानि पत्रप्रस्तुतयः प्राप्ताः । तेषु Industry Track इति प्रवेशः विशेषतया कठिनः अस्ति, यत्र केवलं १५.३% इति स्वीकारस्य दरः अस्ति ।

सङ्गणकवास्तुकलाक्षेत्रे शीर्षशैक्षणिककार्यक्रमत्वेन ISCA इत्यस्य आयोजनं ACM SIGARCH तथा IEEE TCCA इत्यनेन संयुक्तरूपेण क्रियते । १९७३ तमे वर्षे स्थापनायाः अनन्तरं सङ्गणकप्रणालीवास्तुकलाक्षेत्रे प्रगतेः प्रवर्धने अग्रणीशक्तिः अस्ति अत्याधुनिकसंशोधनपरिणामान् प्रदर्शयितुं। ISCA, MICRO, HPCA, ASPLOS च चत्वारि शीर्षसम्मेलनानि इति प्रसिद्धाः सन्ति, तेषु ISCA अग्रणी अस्ति पेपरस्वीकारस्य दरः वर्षभरि प्रायः १८% एव तिष्ठति । वर्षेषु ISCA इत्यत्र प्रकाशिताः अनेकाः शोधपरिणामाः अर्धचालक-सङ्गणक-उद्योगानाम् विकासे प्रमुखं चालकशक्तिं जातम्

अस्मिन् समये चयनितानां पुनर्विन्यासयोग्यसमान्तरप्रोसेसर (RPP) कागदानां एज कम्प्यूटिङ्ग् क्षेत्रे प्रबलं गतिः प्रविष्टा अस्ति । प्रयोगात्मकपरिणामाः पूर्णतया पुष्टयन्ति यत् समानान्तरगणनाहार्डवेयरमञ्चरूपेण आरपीपी-प्रदर्शनं वर्तमानकाले विपण्यां GPU-इत्यस्य कार्यक्षमतायाः व्यापकरूपेण अतिक्रमयति, विशेषतः अनुप्रयोगपरिदृश्येषु येषु विलम्बता, विद्युत्-उपभोगः, मात्रा च अत्यन्तं उच्चा आवश्यकता भवति

6. उपसंहारः

ChatGPT इत्यनेन बृहत् AI मॉडल् विस्फोटितम्, अतः GPUs तथा AI accelerators इत्येतयोः महती माङ्गलिका उत्पन्ना । एआइ-अनुप्रयोगानाम् विकास-प्रवृत्तिः क्रमेण क्लाउड्-ए.आइ.-प्रशिक्षणात् तर्क-करणात् च एज-डिवाइस्-साइड्-ए.आइ. पारम्परिक जीपीजीपीयू इत्यनेन एज एआई अनुप्रयोगपरिदृश्येषु स्पष्टानि वास्तुशिल्पदोषाणि उजागरयितुं आरब्धानि अस्य उच्चलाभः, उच्चविद्युत्-उपभोगः, उच्चविलम्बः च उद्योगविशेषज्ञाः अधिक ऊर्जा-कुशल-समानान्तर-गणना-आर्किटेक्चरं अन्वेष्टुं बाध्यं कृतवन्तः

CPU, GPU, ASIC, FPGA तथा NPU इत्यादीनां भिन्न-गणना-आर्किटेक्चरानाम् तुलनां कृत्वा अस्माभिः ज्ञातं यत् पुनः विन्यस्तं कम्प्यूटिंग्-आर्किटेक्चरं CGRA एज एआइ-अनुप्रयोगानाम् कृते अधिकं उपयुक्तम् अस्ति, विशेषतः कोर-डायनामिक्स-द्वारा प्रस्तावितं पुनर्विन्यासयोग्यं समानान्तर-प्रोसेसरं (RPP) NVIDIA इत्यस्मात् समान GPU इत्यनेन सह तुलनात्मकविश्लेषणस्य माध्यमेन RPP आर्किटेक्चर इत्यस्य आधारेण R8 चिप् विलम्बता, विद्युत् उपभोगः, क्षेत्रव्ययः, बहुमुखी प्रतिभा, द्रुतनियोजनं च इति दृष्ट्या उत्तमं प्रदर्शनं करोति।

अस्मिन् वर्षे जुलैमासे अर्जेन्टिनादेशे आयोजिते ISCA2024 शैक्षणिकसम्मेलने आरपीपी प्रोसेसर आर्किटेक्चरविषये पत्रं अन्तर्राष्ट्रीयशैक्षणिकप्रधिकारिभिः मान्यतां प्राप्तम्। एज एआइ इत्यस्य विकासेन एआइ सर्वरः एआइ पीसी च द्रुतवृद्धेः सुवर्णकालस्य आरम्भं करिष्यन्ति, तथा च एतादृशानां एज एआइ उपकरणानां समर्थनं कुर्वन्तः एआइ त्वरकाः अपि युगपत् वर्धयिष्यन्ति झुहाई कोर पावर टेक्नोलॉजी द्वारा प्रस्तावितं आरपीपी प्रोसेसर चिप् उद्योगेन अपि मान्यतां प्राप्स्यति तथा च एज एआई अनुप्रयोग परिदृश्येषु सर्वाधिकं आदर्श एआई त्वरण प्रोसेसर भविष्यति।