समाचारं

एएमडी प्रथमं एआइ लघुभाषाप्रतिरूपं विमोचयति: ६९० अरब टोकन, अनुमानात्मकविकोडिंग् गतिः ३.८८ गुणा

2024-10-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

कुआइ प्रौद्योगिकी समाचार on october 1, 2019एम् डी इत्यनेन प्रथमं लघुभाषाप्रतिरूपं (slm) प्रकाशितम्, यस्य नाम "amd-135m" इति ।

अधिकाधिकविशालबृहभाषाप्रतिरूपस्य (llm) तुलने इदं लघुतरं, अधिकं लचीलं, अधिकं लक्षितं च भवति, निजीव्यावसायिकउद्यमेषु परिनियोजनाय च अतीव उपयुक्तम् अस्ति

एएमडी-१३५ लघुप्रतिरूपं ल्लामा-परिवारस्य अस्ति, तस्य द्वौ संस्करणौ स्तः ।

एकः मूलप्रकारः " ।एएमडी-ल्लामा-१३५एम”, यावन्तः सहअष्टसु instinct mim250 64gb त्वरकेषु 670 अरब टोकन्स् षड्दिनानि यावत् प्रशिक्षिताः आसन् ।

द्वितीयः विस्तारितः " ।एएमडी-ल्लामा-१३५एम-कोड”, विशेषतया प्रोग्रामिंग् विषये केन्द्रीकृताः अतिरिक्ताः अध्यायाः सन्ति२० अरब टोकन, चतुर्दिनानि यावत् एकस्मिन् एव हार्डवेयर् इत्यत्र प्रशिक्षिताः ।

निर्माणं परिनियोजनं च प्रक्रिया

इति नामकं विधिं प्रयुङ्क्ते"अनुमानात्मकविकोडनम्" ।एषा पद्धतिः लघुतरस्य मसौदाप्रतिरूपस्य माध्यमेन एकस्मिन् अग्रे पासे बहुविधं अभ्यर्थीटोकनं जनयति, ततः सत्यापनार्थं वा सुधारार्थं वा बृहत्तरं अधिकसटीकं च लक्ष्यप्रतिरूपं प्रति प्रेषयति

एषा पद्धतिः कार्यप्रदर्शनं न प्रभावितं विना एकस्मिन् समये बहुविधं टोकनं जनयितुं शक्नोति तथापि स्मृतेः उपयोगं न्यूनीकर्तुं शक्नोति तथापि अधिकानि दत्तांशव्यवहाराः भवन्ति इति कारणतः विद्युत्-उपभोगः अपि वर्धते

एएमडी इत्यनेन अपि अनुमानात्मकविकोडिंग् इत्यनेन सह वा विना वा कार्यप्रदर्शनस्य परीक्षणार्थं codellama-7b इत्यस्य मसौदे मॉडलरूपेण amd-llama-135m-code इत्यस्य उपयोगः कृतः ।

यथा, mi250 त्वरकेन प्रायः २.८ गुणान् यावत् कार्यक्षमतायाः उन्नतिः कर्तुं शक्यते, ryzen ai cpu इत्यत्र प्रायः ३.८८ गुणापर्यन्तं सुधारः कर्तुं शक्यते, ryzen ai npu इत्यत्र च, तस्य उन्नतिः अपि कर्तुं शक्यते प्रायः २.९८ गुणान् यावत् ।

अनुमानात्मकं विकोडनम्

एएमडी-१३५एम लघुप्रतिरूपस्य प्रशिक्षणसङ्केतः, आँकडासमूहाः अन्ये च संसाधनाः मुक्तस्रोतः एव सन्ति तथा च अपाचे २.० अनुसरणं कुर्वन्ति ।

ए.एम.डी.अस्य कार्यक्षमता मूलतः अन्येषां मुक्तस्रोतलघुमाडलानाम् समतुल्यम् अथवा किञ्चित् अग्रे अस्ति, उदाहरणार्थं, hellaswag, sciq, arc-easy इत्यादीनि कार्याणि llama-68m तथा llama-160m ​​इत्यस्मात् अधिकं भवन्ति, यदा तु hellaswag, winogrande, sciq, mmlu, arc-easy इत्यादीनि कार्याणि मूलतः gtp2-124mn तथा opt-125m इत्येतयोः सदृशानि सन्ति