मुक्तस्रोतप्रतिरूपं सशक्ततमं बन्दस्रोतप्रतिरूपं अतिक्रमयति किं ल्लामा ३.१ एआइ पारिस्थितिकीतन्त्रं विध्वंसयितुं शक्नोति? ・जिआजी गुआंगनिया

मुक्तस्रोतप्रतिरूपं सशक्ततमं बन्दस्रोतप्रतिरूपं अतिक्रमयति किं ल्लामा ३.१ एआइ पारिस्थितिकीतन्त्रं विध्वंसयितुं शक्नोति? ・जिआजी गुआंगनियान

2024-07-24

जुकरबर्ग् अन्त्यपर्यन्तं मुक्तस्रोतस्य अनुसरणं कर्तुं प्रतिज्ञां करोति ।

लेखकसुखोइ

सम्पादक|झाओ जियान

ल्लामा ३.१ अन्ततः अत्र अस्ति ।

अमेरिकादेशस्य स्थानीयसमये जुलैमासस्य २३ दिनाङ्के मेटा इत्यनेन आधिकारिकतया लामा ३.१ इति चलच्चित्रं प्रदर्शितम् । अस्मिन् त्रयः आकाराः सन्ति : 8B, 70B तथा 405B, अधिकतमः सन्दर्भः 128k यावत् वर्धितः अस्ति । ल्लामा सम्प्रति सर्वाधिकं उपयोक्तारः, मुक्तस्रोतक्षेत्रे सर्वाधिकं शक्तिशालीं च प्रदर्शनं युक्तेषु बृहत् मॉडल् श्रृङ्खलासु अन्यतमम् अस्ति ।

अस्य लामा ३.१ इत्यस्य मुख्यबिन्दवः सन्ति- १.

1. त्रयः संस्करणाः सन्ति: 8B, 70B तथा 405B, येषु संस्करणं 405B वर्तमानकाले बृहत्तमेषु मुक्तस्रोतमाडलेषु अन्यतमम् अस्ति एकं दीर्घतरं सन्दर्भविण्डो (128K टोकनपर्यन्तं), अधिकजटिलकार्यं वार्तालापं च सम्भालितुं समर्थः 4. बहुभाषिकं निवेशं निर्गमं च समर्थयति, मॉडलस्य बहुमुखी प्रतिभां प्रयोज्यतां च वर्धयति 5. तर्कक्षमतासु सुधारं करोति, विशेषतः समाधानं कर्तुं उत्कृष्टम् अस्ति; जटिलगणितीयसमस्याः तथा मक्षिकायां सामग्रीजननम्।

मेटा स्वस्य आधिकारिकब्लॉग् मध्ये लिखितवान् यत् "अद्यत्वे अपि, मुक्तस्रोतस्य बृहत्भाषाप्रतिरूपस्य कार्यक्षमतायाः कृते बन्दस्रोतप्रतिरूपेभ्यः पृष्ठतः भवितुं सामान्यम् अस्ति। परन्तु अधुना, वयं मुक्तस्रोतस्य नेतृत्वे नूतनयुगस्य आरम्भं कुर्मः। मेटा इत्यस्य अस्माकं सार्वजनिकविमोचनम् Llama 3.1 405B विश्वस्य प्रथमः अस्ति जालपुटे बृहत्तमः शक्तिशाली च मुक्तस्रोतमूलप्रतिरूपः, अद्यपर्यन्तं सर्वेषां Llama संस्करणानाम् 300 मिलियनतः अधिकं सञ्चित-अवलोकनानि सन्ति, एतत् केवलं आरम्भः एव।”.

मुक्तस्रोतस्य बन्दस्रोतस्य च मध्ये वादविवादः प्रौद्योगिकीक्षेत्रे सर्वदा एव उष्णविषयः आसीत् ।

मुक्तस्रोतसॉफ्टवेयरं अधिकं पारदर्शकं लचीलं च भवति, येन विश्वस्य विकासकाः संयुक्तरूपेण कोडस्य समीक्षां, परिवर्तनं, सुधारं च कर्तुं शक्नुवन्ति, येन प्रौद्योगिक्यां द्रुतगतिना नवीनतां प्रगतिः च प्रवर्तते बन्दस्रोतप्रतिमानं प्रायः एकेन कम्पनीद्वारा वा संस्थायाः वा विकसितं परिपालितं च भवति, यत् सॉफ्टवेयरस्य सुरक्षां स्थिरतां च सुनिश्चित्य व्यावसायिकसमर्थनं सेवां च प्रदातुं शक्नोति परन्तु एतत् प्रतिरूपं उपयोक्तृनियन्त्रणं अनुकूलनक्षमतां च सीमितं करोति ।

अधुना यावत् बन्द-स्रोत-प्रतिरूपं सर्वदा किञ्चित् श्रेष्ठम् आसीत् । लामा ३.१ इत्यस्य विमोचनपर्यन्तं प्रचलति भयंकरः मुक्त-स्रोत-बन्द-स्रोत-विमर्शः चिह्नितः अस्ति: मुक्त-स्रोत-प्रतिरूपः अन्ततः बन्द-स्रोत-प्रतिरूपेण सह स्पर्धां कर्तुं शक्नोति

मेटा द्वारा प्रदत्तस्य बेन्चमार्क-दत्तांशस्य अनुसारं सर्वाधिकं लोकप्रियं संस्करणं 405B पूर्वमेव कार्यक्षमतायाः दृष्ट्या GPT-4 तथा Claude 3 इत्येतयोः तुलनीयम् अस्ति । तेषु मानवमूल्यांकनस्य उपयोगः मुख्यतया आदर्शस्य कोडं अवगन्तुं जनयितुं च अमूर्ततर्कसमस्यानां समाधानार्थं च क्षमतायाः मूल्याङ्कनार्थं भवति । अन्यैः बृहत् मॉडलैः सह स्पर्धायां ल्लामा ३.१ ४०५बी किञ्चित् उत्तमं दृश्यते ।

लामा ३.१ जीपीटी-४ तथा क्लाउड् ३.५ इत्येतयोः सममूल्यम् अस्ति स्रोतः : मेटा

कम्प्यूटरविज्ञानस्य विद्युत्-इञ्जिनीयरिङ्गस्य च सहायक-प्रोफेसरः, स्टैन्फोर्ड-विश्वविद्यालयस्य कृत्रिम-बुद्धि-प्रयोगशालायाः निदेशकः च एण्ड्रयू एङ्ग् इत्यनेन सामाजिकमाध्यमेषु "मेटा-लामा-दलयोः मुक्तस्रोते प्रचण्डं योगदानं" इति प्रशंसितम् “सन्दर्भदीर्घतायाः वर्धनेन, कार्यक्षमतायाः उन्नत्या च सह, लामा ३.१ सर्वेषां कृते विलक्षणं उपहारम् अस्ति” इति सः अवदत्, आशां च कृतवान् यत् “कैलिफोर्निया-प्रस्तावितः SB1047 इत्यादयः मूर्खतापूर्णाः नियमाः एतादृशं नवीनतां न निवारयिष्यन्ति” इति

Ng Enda’s social media, स्रोतः : X

मेटा इत्यस्य ट्युरिंग् पुरस्कारविजेता मुख्यकृत्रिमबुद्धिवैज्ञानिकः च यान लेकुन् इत्यनेन द वर्ज इत्यस्य ल्लामा ३.१ इत्यस्य प्रदर्शनविवरणस्य उद्धृतं कृतम्—मेटा इत्यनेन अद्यपर्यन्तं बृहत्तमं सर्वोत्तमं च मुक्तस्रोतस्य कृत्रिमबुद्धिप्रतिरूपं प्रकाशितम्: लामा ३.१ कतिपयेषु मापदण्डेषु उत्तमं प्रदर्शनं करोति परीक्षणे, एतत् अतिक्रान्तवान् OpenAI इत्यादयः प्रतियोगिनः।

याङ्ग लिकुन् इत्यस्य सामाजिकमाध्यमम्, स्रोतः : X

रोचकं तत् अस्ति यत्, Llama 3.1 इत्यस्य 405B संस्करणं कालमेव HugginFace तथा GitHub इत्यत्र "चोरी" इति शङ्का आसीत्

मेटा इत्यस्य संस्थापकः मुख्यकार्यकारी च मार्क जुकरबर्ग् इत्यनेन व्यक्तिगतरूपेण "Open Source AI Is the Path Forward" इति दीर्घः लेखः लिखितः, यस्मिन् विकासकानां कृते मेटा इत्यस्य कृते च मुक्तस्रोतस्य लाभस्य विवरणं दत्तम् अस्ति तथा च वैश्विकरूपेण तस्य महत्त्वं किमर्थम् इति च

सः भविष्यवाणीं करोति यत् अस्य वर्षस्य अन्ते यावत् मेटा एआइ सर्वाधिकं प्रयुक्तः सहायकः इति रूपेण चैट्जीपीटी इत्येतत् अतिक्रमयिष्यति।

स च आह-अन्त्यपर्यन्तं मुक्तस्रोतस्य निर्वहणं कर्तुं प्रतिज्ञां कुर्वन्तु।

"Open Source AI Is the Path Forward" इत्यस्य लेखस्य स्लाइस्, स्रोतः मेटा

1.ल्लमस्य निर्माणम् ३.१

मॉडल आर्किटेक्चरस्य दृष्ट्या मेटा इत्यस्य अद्यपर्यन्तं बृहत्तमः मॉडल् इति रूपेण लामा ३.१ १५ खरब टोकनात् अधिकस्य आँकडानां विषये प्रशिक्षितः अस्ति, प्रशिक्षणपूर्वदत्तांशः २०२३ तमस्य वर्षस्य डिसेम्बरमासपर्यन्तं उपलब्धः अस्ति

एतावता बृहत्परिमाणे प्रशिक्षणं यथोचितसमये कार्यान्वितुं वांछितपरिणामान् प्राप्तुं च मेटा सम्पूर्णं प्रशिक्षण ढेरं अनुकूलितवान्, एच्१०० इत्यस्य १६,००० तः अधिकानां खण्डानां उपयोगेन ४०५बी अस्मिन् स्तरे प्रशिक्षितं प्रथमं ल्लामा मॉडलम् अस्ति

लामा ३.१ पाठजननप्रक्रियायां परिवर्तकप्रतिरूपवास्तुकला, स्रोतः : मेटा

प्रशिक्षणस्य स्थिरतां सुविधां च अधिकतमं कर्तुं मेटा इत्यनेन वर्तमानकाले लोकप्रियस्य मिश्रितविशेषज्ञप्रतिरूपस्य (MoE) आर्किटेक्चरस्य स्थाने, सूक्ष्म-समायोजनाय मानक-डिकोडर-मात्रं ट्रान्सफॉर्मर-माडल-आर्किटेक्चरं चयनितम्

एषः निर्णयः Llama 3.1 इत्यस्य अनुमतिं ददाति यत् सः अद्यापि 128K पर्यन्तं सन्दर्भदीर्घतायाः समर्थनं कुर्वन् लघुपाठस्य उच्चगुणवत्तायुक्तं उत्पादनं सुनिश्चितं करोति, दीर्घपाठस्य लचीलप्रक्रियाकरणं सक्षमं करोति, न तु केवलं दीर्घपाठे ध्यानं न ददाति

तस्मिन् एव काले शोधदलेन उच्चगुणवत्तायुक्तं सिंथेटिकदत्तांशं जनयितुं तथा च पर्यवेक्षितस्य सूक्ष्म-समायोजनस्य प्रत्यक्ष-प्राथमिकता-अनुकूलनस्य च प्रत्येकं दौरस्य माध्यमेन मॉडलस्य विभिन्नकार्यं सुधारयितुम् एकां पुनरावर्तनीयं प्रशिक्षणोत्तर-पद्धतिं कार्यान्वितम् पूर्वसंस्करणैः सह तुलने लामा ३.१ प्रशिक्षणपूर्वस्य प्रशिक्षणोत्तरस्य च आँकडानां परिमाणं गुणवत्तां च वर्धयति, अधिकविस्तृतपूर्वप्रक्रियाकरणप्रबन्धनप्रक्रियाः, अधिककठोरगुणवत्तानिश्चयः, छाननप्रौद्योगिकी च परिचययति

भाषाप्रतिमानानाम् विस्तारनियमानुसारं लामा ३.१ प्रदर्शने समानप्रशिक्षणप्रक्रियायाः उपयोगेन पूर्वलघुप्रतिमानानाम् अतिक्रमणं करोति ।

बृहत्-परिमाणस्य ४०५बी-माडलस्य चालन-आवश्यकतानां सामना कर्तुं मेटा-कम्पनी १६-बिट् (BF16) तः ८-बिट् (FP8) पर्यन्तं मॉडल्-आँकडानां परिमाणं कृतवान्, येन कम्प्यूटिङ्ग्-संसाधनानाम् आग्रहः बहुधा न्यूनीकृतः, मॉडल् चालयितुं च सक्षमः अभवत् एकः सर्वर नोड् ।

Llama 3.1 405B मॉडलस्य आदेशस्य तथा च गपशपस्य सूक्ष्म-समायोजनस्य दृष्ट्या विकासदलः उच्चस्तरीयसुरक्षां सुनिश्चित्य उपयोक्तृ-आदेशानां प्रति मॉडलस्य प्रतिक्रियाशीलतां, व्यावहारिकतां, गुणवत्तां च सुधारयितुम् प्रतिबद्धः अस्ति

प्रशिक्षणोत्तरपदे दलेन पूर्वप्रशिक्षणस्य आधारेण समायोजनस्य अनेकाः चक्राः कृताः । प्रत्येकं दौरं पर्यवेक्षितं सूक्ष्म-ट्यूनिङ्गं (SFT), अस्वीकार-नमूनाकरणं (RS), प्रत्यक्ष-प्राथमिकता-अनुकूलनं (DPO) च समाविष्टं भवति ।तदतिरिक्तं, दलेन एसएफटी-उदाहरणानां विशालबहुमतं जनयितुं सिंथेटिक-दत्तांश-जननस्य उपयोगः कृतः, अर्थात् ते केवलं वास्तविक-जगतः आँकडानां उपरि न अपितु प्रतिरूपस्य प्रशिक्षणार्थं एल्गोरिदमिक-रूपेण उत्पन्न-आँकडानां उपरि अवलम्बन्ते स्म

तस्मिन् एव काले, दलं उच्चतमगुणवत्तां सुनिश्चित्य सूक्ष्म-समायोजन-दत्तांशस्य अनुप्रयोग-परिधिं विस्तारयितुं च एतत् दत्तांशं छानयितुं विविध-दत्तांश-संसाधन-विधिनाम् अपि उपयोगं करोति

मेटा एकां नूतनां रणनीतिं अपि अन्वेषयति, यत् 70B तथा 8B मॉडल् कृते 405B मॉडलस्य उपयोगः "शिक्षकप्रतिरूपस्य" रूपेण करणीयः, तस्मात् विविध-उद्योगानाम् आवश्यकतानुसारं बृहत्-माडलात् लघु-अनुकूलित-माडल-निष्कासनं करणीयम् एषः उपायः GPT-4o mini इत्यस्य रणनीत्या सह सङ्गच्छते ।"प्रथमं बृहत् कुरु, ततः लघु कुरु" इत्यर्थः ।。

पूर्व OpenAI संस्थापकसदस्यानां मध्ये एकः Andrej Karpathy एकदा GPT-4o Mini इत्यस्य विषये टिप्पणीं कृतवान् यत् "माडलं प्रथमं बृहत्तरं भवितुमर्हति, ततः पूर्वं यत् इदं लघुतरं भवितुम् अर्हति। यतः अस्माकं आवश्यकता अस्ति यत् ते (स्वयमेव) प्रशिक्षणदत्तांशस्य पुनर्निर्माणे सहायतां कुर्वन्तु येन तत् आदर्शं भवति, synthetic format." सः दर्शितवान् यत् एषा पद्धतिः बृहत्प्रतिमानानाम् ज्ञानस्य गभीरताम् विस्तारं च प्रभावीरूपेण लघुप्रतिरूपेषु स्थानान्तरयितुं शक्नोति ये अधिकव्यावहारिकाः न्यूनमहत्त्वपूर्णाः च सन्ति।

मुक्तस्रोतप्रतिरूपमार्गे अग्रणीरूपेण मेटा इत्यनेन ल्लामाप्रतिरूपस्य सुविधानां समर्थने अपि निष्कपटता दर्शिता अस्ति ।

लामा-प्रणाली एकस्य व्यापकरूपरेखायाः रूपेण परिकल्पिता अस्ति यत् बाह्यसाधनानाम् आह्वानं सहितं बहुघटकानाम् एकीकरणं कर्तुं शक्नोति । मेटा इत्यस्य लक्ष्यं व्यापकं प्रणालीं प्रदातुं वर्तते यत् विकासकाः लचीलतया तेषां आवश्यकतां पूरयन्तः अनुकूलिताः उत्पादाः डिजाइनं कर्तुं निर्मातुं च शक्नुवन्ति ।

मॉडलस्तरात् परं एआइ उत्तरदायित्वपूर्वकं विकसितुं शोधदलेन बहुभाषिकसुरक्षामाडलं ल्लामा गार्ड् ३ तथा प्रॉम्प्ट् इन्जेक्शन् फ़िल्टर प्रॉम्प्ट् गार्ड इत्यादीन् बहुभिः उदाहरणानुप्रयोगैः सह सम्पूर्णं सन्दर्भप्रणालीं विमोचितवती एते अनुप्रयोगाः मुक्तस्रोतः सन्ति, समुदायेन अग्रे विकासाय उपलभ्यन्ते च ।

घटक-अन्तरफलकान् उत्तमरीत्या परिभाषितुं उद्योगे तेषां मानकीकरणं च प्रवर्धयितुं शोधकर्तारः उद्योगेन, स्टार्टअपैः, व्यापकसमुदायेन च सहकार्यं कृत्वा "Llama Stack" प्रस्तावं GitHub इत्यत्र प्रकाशितवन्तः इदं मानकीकृत-अन्तरफलकानां समुच्चयः अस्ति यत् उपकरणशृङ्खलाघटकानाम् (यथा सूक्ष्म-समायोजनं, कृत्रिम-दत्तांश-जननं) एजेण्ट्-अनुप्रयोगानाम् निर्माणं सरलीकरोति

मेटा द्वारा प्रदत्तस्य बेन्चमार्कपरीक्षादत्तांशस्य अनुसारं एनआईएच/मल्टी-नीडल बेन्चमार्कपरीक्षायां लामा ३.१ ४०५बी ९८.१ स्कोरं प्राप्तवान्, यत् प्रदर्शनाङ्कस्य दृष्ट्या जीपीटी-४ तथा क्लाउड् ३.५ इत्येतयोः तुलनीयम् अस्ति 405B संस्करणस्य विशालपाठसूचनाः एकीकृत्य उत्तमक्षमता अस्ति तथा च ZeroSCROLLS/QuALITY बेन्चमार्कपरीक्षायां 95.2 अंकं प्राप्तवान् AI अनुप्रयोगविकासकानाम् कृते अतीव मैत्रीपूर्णः अस्ति ये RAG प्रदर्शनस्य विषये चिन्तिताः सन्ति।

Llama 3.1 GPT4 इत्यादिभिः बन्दस्रोतप्रतिरूपैः सह तुलने, स्रोतः: मेटा

Llama 3.1 इत्यस्य तुलने Mistral 7B Instruct इत्यादिभिः मुक्तस्रोतमाडलैः सह, स्रोतः: मेटा

Llama 3.1 8B संस्करणं Gemma 2 9B 1T तथा Mistral 7B Instruct इत्येतयोः अपेक्षया महत्त्वपूर्णतया उत्तमम् अस्ति, तथा च पूर्वपीढीयाः Llama 3 8B इत्यस्य तुलने अस्य कार्यक्षमतायाः महत्त्वपूर्णं सुधारः अभवत् तस्मिन् एव काले ल्लामा ३.१ ७०बी संस्करणं जीपीटी-३.५ टर्बो इत्यपि अतिक्रान्तवान् ।

लामा-दलस्य आधिकारिक-रिपोर्ट्-अनुसारं तेषां कृते १५० तः अधिकेषु बहुभाषिक-बेन्चमार्क-आँकडा-समूहेषु एतेषां प्रतिरूपानाम् गहन-प्रदर्शन-मूल्यांकनं, व्यापकं मैनुअल्-परीक्षणं च कृतम् परिणामानि दर्शयन्ति यत् लामा इत्यस्य शीर्षप्रतिरूपं विविधकार्य्येषु GPT-4, GPT-4o, Claude 3.5 Sonnet इत्यादिषु विपण्यां शीर्षमूलभूतमाडलेन सह तुलनीयम् अस्ति तस्मिन् एव काले समानपैरामीटर्-मापदण्डैः सह बन्द-मुक्त-स्रोत-प्रतिरूपैः सह तुलने ल्लामा-इत्यस्य लघुसंस्करणेन अपि प्रबलप्रतिस्पर्धा दर्शिता

2.मुक्तस्रोतस्य बन्दस्रोतस्य च प्रतिरूपयोः मध्ये वादविवादः

किं मुक्तस्रोतप्रतिरूपं बन्दस्रोतप्रतिरूपं अतिक्रमितुं शक्नोति?

अयं विषयः गतवर्षात् विवादास्पदः अस्ति । द्वयोः आदर्शयोः विकासमार्गाः भिन्न-भिन्न-तकनीकी-दर्शनानां प्रतिनिधित्वं कुर्वन्ति, तथा च तेषां प्रत्येकस्य प्रौद्योगिकी-प्रगतेः प्रवर्धने व्यावसायिक-आवश्यकतानां पूर्तये च स्वकीयाः गुणाः सन्ति

यथा, Llama 3.1 इति एकं विशालं मुक्तस्रोतप्रतिरूपं यत् शोधकर्तारः विकासकाः च तस्य स्रोतसङ्केतं प्राप्तुं शक्नुवन्ति, जनाः च स्वतन्त्रतया प्रतिरूपस्य अध्ययनं, परिवर्तनं, सुधारं च कर्तुं शक्नुवन्ति एषा मुक्तता व्यापकसहकार्यं नवीनतां च प्रोत्साहयति, येन विविधपृष्ठभूमिकानां विकासकाः समस्यानां समाधानार्थं मिलित्वा कार्यं कर्तुं शक्नुवन्ति ।

तस्य विपरीतम्, ChatGPT OpenAI द्वारा विकसितं बन्द-स्रोत-प्रतिरूपम् अस्ति यद्यपि एतत् API-प्रवेशं प्रदाति तथापि तस्य मूल-एल्गोरिदम्, प्रशिक्षण-दत्तांशः च पूर्णतया प्रकटितः नास्ति । GPT-3 इत्यस्य बन्द-स्रोत-प्रकृतिः व्यावसायिकीकरणमार्गे अधिकं दृढं करोति तस्मिन् एव काले तस्य नियन्त्रणक्षमता उत्पादस्य स्थिरतां सुरक्षां च सुनिश्चितं करोति, येन संवेदनशीलसूचनाः नियन्त्रयन्ते सति उद्यमानाम् कृते अधिकं विश्वसनीयं भवति परन्तु एतत् निमीलनम् बाह्यसंशोधकानां प्रतिरूपस्य पूर्णतया अवगमनस्य नवीनीकरणस्य च क्षमताम् अपि सीमितं करोति ।

गतवर्षस्य मेमासे विदेशीयमाध्यमेन गूगलेन एकं दस्तावेजं लीक् कृतम् इति ज्ञापितं यत् "अस्माकं खातः नास्ति, ओपनएआइ अपि नास्ति। अद्यापि वयं विवादं कुर्मः, मुक्तस्रोतः अस्माकं कार्याणि शान्ततया अपहृतवान्। मेटा इत्यनेन तस्मिन् एव वर्षे मुक्तस्रोतस्य बृहत् मॉडल् लामा २ इति विमोचनस्य अनन्तरं याङ्ग लिकुन् इत्यनेन उक्तं यत् लामा २ इत्यनेन बृहत् भाषा मॉडल् इत्यस्य विपण्यसंरचना परिवर्तयिष्यति इति ।

जनाः ल्लामा-माडल-श्रृङ्खलायाः नेतृत्वे मुक्त-स्रोत-समुदायस्य कृते उत्सुकाः सन्ति । पूर्वं अत्यन्तं उन्नतं बन्द-स्रोत-प्रतिरूपं GPT-4 सर्वदा किञ्चित् उत्तमं भवति स्म, यद्यपि तस्मिन् समये Llama 3 इत्यस्य मध्ये अन्तरं पूर्वमेव अतीव अल्पम् आसीत् ।

बृहत् मॉडल् क्षेत्रे सर्वाधिकं प्रामाणिकसूची Large Model Arena (LLM Arena) अस्ति, यया शतरंजस्य ELO बिन्दुप्रणाली स्वीकृता अस्ति । अस्य मूलभूतः नियमः अस्ति यत् उपयोक्तारः द्वयोः अनामयोः मॉडलयोः (उदा. ChatGPT, Claude, Llama) कृते किमपि प्रश्नं पृच्छितुं शक्नुवन्ति तथा च उत्तम उत्तरयुक्तस्य कृते मतदानं कुर्वन्तु । उत्तम उत्तरयुक्ताः आदर्शाः अंकं प्राप्नुयुः, अन्तिमक्रमाङ्कनं च सञ्चितबिन्दुभिः निर्धारितं भवति । एरियान् ईएलओ इत्यनेन ५,००,००० जनानां मतदानस्य आँकडानां संग्रहः कृतः ।

बृहत् आदर्शक्रमाङ्कनस्य अवलोकनं, स्रोतः: एलएलएम एरिना

एलएलएम एरिना क्रमाङ्कने OpenAI इत्यस्य GPT-4o इत्येतत् सम्प्रति शीर्षस्थानं धारयति । शीर्षदशमाडलाः सर्वे बन्दस्रोतः सन्ति । यद्यपि बन्द-स्रोत-प्रतिरूपं अद्यापि श्रेणीषु दूरं अग्रे अस्ति तथापि मुक्त-स्रोत-बन्द-स्रोत-प्रतिरूपयोः मध्ये अन्तरं न वर्धते यथा २०२४ तमे वर्षे बैडु-ए.आइ.-विकासक-सम्मेलने रोबिन् ली इत्यनेन उक्तं, परन्तु वस्तुतः क्रमेण संकुचितं भवति

WAIC इत्यस्य समये रोबिन् ली इत्यनेन उक्तं यत् "मुक्तस्रोतः वस्तुतः एकप्रकारस्य बुद्धिकरः अस्ति।"साभारः बैडु

अद्य Llama 3.1 इत्यस्य विमोचनेन मुक्तस्रोतप्रतिरूपं अन्ततः बन्दस्रोतप्रतिरूपेण सह स्पर्धां कर्तुं शक्नोति ।

यथा कः मुक्तस्रोतः अथवा बन्दस्रोतप्रतिरूपः श्रेष्ठः इति विषये "जिआजी गुआन्ग्नियन्" इत्यनेन अनेकेषां एआइ उद्योगस्य अभ्यासकानां सह चर्चा कृता अस्ति । उद्योगः सामान्यतया मन्यते यत् : १.प्रायः स्वस्य व्यक्तिगतस्थितेः उपरि निर्भरं भवति, न तु सरलः कृष्णशुक्लः विषयः ।

मुक्तस्रोतस्य बन्दस्रोतस्य च विषयः केवलं तान्त्रिकभेदः नास्ति, अपितु व्यापारप्रतिरूपस्य चयनस्य विषये अधिकं भवति । सम्प्रति, मुक्तस्रोतस्य वा बन्दस्रोतस्य बृहत्प्रतिरूपं वा न भवतु, अद्यापि पूर्णतया सफलं व्यापारप्रतिरूपं न प्राप्तम् ।

अतः मुक्तस्रोतस्य बन्दस्रोतस्य च प्रतिरूपयोः क्षमताभेदं के कारकाः प्रभावितयन्ति?

वेइबो इत्यस्य नूतनप्रौद्योगिकीसंशोधनविकासस्य प्रमुखः झाङ्ग जुन्लिन् इत्यनेन दर्शितं यत् आदर्शक्षमतानां वृद्धिदरः प्रमुखः कारकः अस्ति । यदि मॉडल् क्षमता तीव्रगत्या वर्धते तर्हि अल्पकाले एव बृहत् परिमाणेन कम्प्यूटिङ्ग् संसाधनानाम् आवश्यकता भवति अस्मिन् सन्दर्भे बन्द-स्रोत-प्रतिरूपस्य संसाधन-लाभानां कारणात् अधिकानि लाभाः सन्ति प्रत्युत यदि मॉडलक्षमता मन्दं वर्धते तर्हि मुक्तस्रोतस्य बन्दस्रोतस्य च मध्ये अन्तरं न्यूनीभवति तथा च ग्रहणस्य गतिः त्वरिता भविष्यति

सः मन्यते यत् आगामिषु कतिपयेषु वर्षेषु मुक्त-बन्द-स्रोत-प्रतिरूपयोः क्षमतायाः अन्तरं "सिंथेटिक-दत्तांश"-प्रौद्योगिक्याः विकासे निर्भरं भविष्यति यदि "सिंथेटिक डाटा" प्रौद्योगिक्याः आगामिवर्षद्वये महती प्रगतिः भवति तर्हि द्वयोः मध्ये अन्तरं वर्धयितुं शक्यते यदि सफलता न भवति तर्हि द्वयोः क्षमता समाना भवितुं प्रवृत्ता भविष्यति

समग्रतया "संश्लेषितदत्तांशः" भविष्ये बृहत्भाषाप्रतिमानानाम् विकासाय प्रमुखप्रौद्योगिकी भविष्यति ।

मुक्तस्रोतः अथवा बन्दस्रोतः स्वयं प्रतिरूपस्य कार्यक्षमतां न निर्धारयति । बन्दस्रोतप्रतिमानाः बन्दस्रोतत्वात् नेतृत्वं न कुर्वन्ति, मुक्तस्रोतप्रतिमानाः च मुक्तस्रोतत्वात् पृष्ठतः न पतन्ति । तद्विपरीतम् अपि, मॉडल् अग्रणीत्वात् बन्दस्रोतं चिनोति, पर्याप्तं अग्रणी नास्ति इति कारणेन मुक्तस्रोतं चिन्वतु

यदि कम्पनी अत्यन्तं कार्यक्षमं प्रतिरूपं निर्माति तर्हि तत् पुनः मुक्तस्रोतः न भवेत् ।

उदाहरणार्थं, फ्रांसीसी-तारक-स्टार्टअप-संस्था Mistral, तस्य सर्वाधिकशक्तिशाली मुक्त-स्रोत-7B-माडल-Mistral-7B तथा च प्रथमः मुक्त-स्रोत-MoE-माडल-8x7B (MMLU 70)-इत्येतत् मुक्त-स्रोत-समुदायस्य सर्वाधिकं लोकप्रिय-माडल-मध्ये अन्यतमम् अस्ति परन्तु तदनन्तरं मिस्ट्रल् इत्यनेन प्रशिक्षिताः मिस्ट्रल्-मीडियम (MMLU-75) तथा मिस्ट्रल्-लार्ज (MMLU-81) इत्येतौ द्वौ अपि बन्द-स्रोत-प्रतिरूपौ स्तः ।

सम्प्रति सर्वोत्तमप्रदर्शनं बन्द-स्रोत-प्रतिरूपं सर्वोत्तम-प्रदर्शन-मुक्त-स्रोत-प्रतिरूपं च द्वयोः बृहत्-कम्पनीनां वर्चस्वं वर्तते, बृहत्-कम्पनीषु च मेटा-इत्यत्र सर्वाधिकं मुक्त-स्रोत-निर्धारणं वर्ततेयदि OpenAI व्यावसायिकप्रतिफलनस्य कारणेन मुक्तस्रोतः नास्ति तर्हि मेटा इत्यस्य मुक्तस्रोतत्वं चयनं कृत्वा उपयोक्तृभ्यः निःशुल्कं प्रयासं कर्तुं किं प्रयोजनम्?

अन्तिमत्रिमासे वित्तीयप्रतिवेदने जुकरबर्गस्य अस्मिन् विषये प्रतिक्रिया आसीत् यत् मेटा इत्यस्य एआइ-प्रौद्योगिक्याः मुक्तस्रोतः प्रौद्योगिकी-नवीनीकरणस्य प्रवर्धनं, मॉडल-गुणवत्ता-सुधारः, उद्योग-मानकानां स्थापना, प्रतिभानां आकर्षणं, पारदर्शिता-वर्धनं, दीर्घकालीन-विचारस्य समर्थनं च आसीत्

अस्मिन् समये जुकरबर्ग् इत्यनेन "ओपन सोर्स एआइ इज द पथ फॉरवर्ड" इत्यस्मिन् "किमर्थं मुक्तस्रोत-एआइ विकासकानां कृते उत्तमम्" इति विस्तरेण व्याख्यातम् ।

विश्वस्य विकासकैः, मुख्यकार्यकारीभिः, सर्वकारीय-अधिकारिभिः च सह वार्तालापेषु अहं प्रायः तेषां स्वस्य आदर्शानां प्रशिक्षणस्य, सूक्ष्म-समायोजनस्य, अनुकूलनस्य च आवश्यकतायाः उपरि बलं दत्तुं शृणोमि

प्रत्येकस्य संस्थायाः अद्वितीयाः आवश्यकताः सन्ति, तथा च तेषां आवश्यकतानां कृते भिन्न-आकारस्य मॉडल् अनुकूलितं कर्तुं शक्यते, विशिष्टदत्तांशैः प्रशिक्षितं वा सूक्ष्म-समायोजनं वा कर्तुं शक्यते । सरल-उपकरण-कार्यं वर्गीकरण-कार्यं च लघु-प्रतिरूपस्य आवश्यकता भवितुम् अर्हति, यदा तु अधिकजटिल-कार्यस्य बृहत्तर-प्रतिरूपस्य आवश्यकता भवितुम् अर्हति ।

इदानीं भवान् अत्याधुनिक-लामा-माडलस्य उपयोगं कर्तुं शक्नोति तथा च स्वस्य दत्तांशैः सह तान् प्रशिक्षितुं निरन्तरं शक्नोति, पश्चात् तान् स्वस्य आदर्श-परिमाणे अनुकूलनं कर्तुं शक्नोति-अस्माकं वा अन्यस्य वा कदापि भवतः दत्तांशस्य अभिगमः न भवति।

अस्माकं स्वस्य भाग्यं नियन्त्रयितुं आवश्यकं, न तु निमीलितस्रोतविक्रेतुः ऋणी भवितुम्।

अनेकाः संस्थाः यस्य आदर्शस्य उपरि अवलम्बितुं न इच्छन्ति यत् ते स्वयमेव चालयितुं नियन्त्रयितुं च न शक्नुवन्ति । तेषां चिन्ता अस्ति यत् बन्द-स्रोत-प्रतिरूपस्य प्रदातारः प्रतिरूपं, उपयोगस्य शर्ताः, अथवा सेवाः पूर्णतया विच्छिन्नाः अपि भवितुम् अर्हन्ति । ते अपि एकस्मिन् मेघमञ्चे निरुद्धाः भवितुम् न इच्छन्ति यस्य कस्यचित् मॉडलस्य अनन्यः अधिकारः अस्ति । मुक्तस्रोतः अनेकेभ्यः कम्पनीभ्यः संगतसाधनशृङ्खलां प्रदाति, येन भिन्न-भिन्न-प्रणालीनां मध्ये परिवर्तनं सुलभं भवति ।

अस्माभिः अस्माकं दत्तांशस्य रक्षणं करणीयम्।

अनेकाः संस्थाः संवेदनशीलदत्तांशं सम्पादयन्ति तथा च एतत् दत्तांशं मेघ-एपिआइ-माध्यमेन बन्द-स्रोत-प्रतिरूपेषु प्रेषणात् रक्षणस्य आवश्यकता वर्तते । अन्ये संस्थाः केवलं बन्दस्रोतप्रतिरूपप्रदातृणां आँकडासंसाधनस्य दृष्टिकोणे विश्वासं न कुर्वन्ति । मुक्तस्रोतः यत्र इच्छति तत्र मॉडल् चालयितुं दत्त्वा एतासां समस्यानां समाधानं करोति, विकासप्रक्रियायाः पारदर्शितायाः कारणात् च व्यापकतया अधिकं सुरक्षितं मन्यते

अस्माकं कार्यानुष्ठानार्थं कुशलः किफायती च मार्गः आवश्यकः।

विकासकाः स्वस्य आधारभूतसंरचनायाः अनुमानार्थं Llama 3.1 405B मॉडल् चालयितुं शक्नुवन्ति, GPT-4o इत्यादीनां बन्द-स्रोत-माडलस्य उपयोगस्य प्रायः आर्धेन व्ययेन, यत् उपयोक्तृ-मुखी-अफलाइन-अनुमान-कार्ययोः कृते उपयुक्तम् अस्ति

वयं एकस्मिन् पारिस्थितिकीतन्त्रे दावान् कुर्मः यत् दीर्घकालीनमानकं भवितुम् प्रतिज्ञायते।

बहवः जनाः बन्दस्रोतप्रतिमानानाम् अपेक्षया मुक्तस्रोतप्रतिमानानाम् विकासं द्रुततरं पश्यन्ति, तेषां निर्मितं प्रणालीवास्तुकला महत्तमं दीर्घकालीनलाभं आनयिष्यति इति ते आशां कुर्वन्ति

(मेटा एक्स खातेन आवरणचित्रम्)

समाचारं

आमुख

मम सम्पर्कसूचना