समाचारं

बृहत् मॉडल उद्योगे “वास्तविकः” मुक्तस्रोतः सर्वथा नास्ति?

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


लेखक सोमवार मुस्कान
ईमेल@ [email protected]

मुक्तस्रोतस्य बृहत् मॉडलस्य बाजारः अद्यतने अतीव सजीवः अभवत् प्रथमं एप्पल् इत्यनेन ७ अरब पैरामीटर् लघु मॉडल् DCLM इति मुक्तस्रोतः, ततः भारी मेटा इत्यस्य लामा ३.१ तथा मिस्ट्रल् लार्ज २ इत्येतयोः एकस्य पश्चात् अन्यस्य मुक्तस्रोतः आसीत् बन्दस्रोतस्य SOTA Model इत्येतत् अतिक्रान्तवान् ।

परन्तु मुक्तस्रोतस्य बन्दस्रोतस्य च गुटयोः मध्ये वादविवादः स्थगितस्य लक्षणं न दृश्यते ।

एकस्मिन् पक्षे मेटा लामा ३.१ इत्यस्य विमोचनानन्तरं अवदत् यत् "अधुना वयं मुक्तस्रोतस्य नेतृत्वे नूतनयुगस्य आरम्भं कुर्मः अपरपक्षे सैम आल्टमैन् "वाशिङ्गटन पोस्ट्" इत्यत्र लेखं लिखितवान्, प्रत्यक्षतया विरोधाभासं उत्थापितवान् देशस्य चेतनायाः च मुक्तस्रोतस्य बन्दस्रोतस्य च मध्ये।

किञ्चित्कालपूर्वं विश्वकृत्रिमबुद्धिसम्मेलने रोबिन् ली इत्यनेन स्पष्टतया उक्तं यत् "मुक्तस्रोतः वस्तुतः एकप्रकारस्य बुद्धिकरः अस्ति" यतोहि बन्दस्रोतप्रतिमानाः स्पष्टतया अधिकशक्तिशालिनः सन्ति तथा च तर्कव्ययः न्यूनः भवति, येन पुनः चर्चाः आरब्धाः

पश्चात् फू शेङ्गः अपि स्वमतं प्रकटितवान् यत् मुक्तस्रोतस्य, बन्दस्रोतस्य च शिबिरद्वयं परस्परं स्पर्धां कुर्वतः, एकत्र विकासः च भवति इति । सः "मुक्तस्रोतः वस्तुतः एकप्रकारस्य बुद्धिकरः अस्ति" इति मतस्य अपि खण्डनं कृतवान्: "मुक्तस्रोतस्य बृहत्भाषाप्रतिरूपं निःशुल्कम् अस्ति, तस्य बुद्धिकरः कथं प्राप्तः, तथा च करं को संग्रहयति?", "यदि अद्यतनकम्पनयः उपयुञ्जते paid closed source बृहत् भाषा मॉडल्स्, तत् 'IQ tax' इति उच्यते, विशेषतः अत्यन्तं उच्चं मॉडल् लाइसेंसिंग शुल्कं एपिआइ शुल्कं च, यस्य मूल्यं वर्षे कोटिकोटिरूप्यकाणि भवति, अन्ते च अलङ्काररूपेण पुनः क्रीताः, तथा च कर्मचारी अपि तान् उपयोक्तुं न शक्तवन्तः सर्वथा (प्रतिमानाः ) ।”

अस्य वादविवादस्य मूलं प्रौद्योगिकीविकासस्य दिशां प्रतिरूपं च सम्मिलितं भवति, यत् विभिन्नानां हितधारकाणां दृष्टिकोणं स्थितिं च प्रतिबिम्बयति, ततः पूर्वं वयं बृहत्भाषाप्रतिमानानाम् मुक्तस्रोतस्य, बन्दस्रोतस्य च विषये वक्तुं शक्नुमः, अस्माभिः "मुक्तस्रोत" तथा " इति पदं स्पष्टीकर्तुं आवश्यकम् closed source". द्वे मूलभूतसंकल्पना।

"मुक्तस्रोत" इति पदं सॉफ्टवेयरक्षेत्रात् उत्पद्यते तथा च सॉफ्टवेयरविकासप्रक्रियायाः समये तस्य स्रोतसङ्केतं सार्वजनिकं कर्तुं निर्दिशति, येन कोऽपि तत् द्रष्टुं, परिवर्तनं, वितरितुं च शक्नोतिमुक्तस्रोतसॉफ्टवेयरम्सॉफ्टवेयरस्य विकासः सामान्यतया पारस्परिकसहकार्यस्य तथा सहकर्मीनिर्माणस्य सिद्धान्तानां अनुसरणं करोति, उत्पादनमॉड्यूलस्य, संचारपाइपलाइनस्य, अन्तरक्रियाशीलसमुदायस्य च सुधारं प्रवर्धयति विशिष्टप्रतिनिधिषु Linux तथा Mozilla Firefox च सन्ति

बन्द स्रोतसॉफ्टवेयर (स्वामित्वयुक्तं सॉफ्टवेयर) २. वाणिज्यिककारणात् अन्यकारणात् वा स्रोतसङ्केतः न प्रकटितः भवति तथा च केवलं सङ्गणकपठनीयाः कार्यक्रमाः (द्विचक्रीयस्वरूपाः इत्यादयः) प्रदत्ताः सन्ति । स्रोतसङ्केतः केवलं विकासकस्य स्वामित्वं नियन्त्रितं च भवति । विशिष्टप्रतिनिधिषु विण्डोज, एण्ड्रॉयड् च सन्ति ।

मुक्तस्रोतः मुक्तता, साझेदारी, सहकार्यं च आधारितं सॉफ्टवेयरविकासप्रतिरूपं भवति यत् एतत् सर्वेषां कृते सॉफ्टवेयरविकासे सुधारणे च भागं ग्रहीतुं प्रोत्साहयति तथा च प्रौद्योगिक्याः निरन्तरप्रगतिं व्यापकप्रयोगं च प्रवर्धयति

बन्दस्रोतसहितं विकसितं सॉफ्टवेयरं स्थिरं, केन्द्रितं उत्पादं भवितुं अधिकं सम्भावना भवति, परन्तु बन्दस्रोतसॉफ्टवेयरस्य प्रायः धनव्ययः भवति, यदि च तस्मिन् किमपि दोषः अथवा गम्यमानविशेषताः सन्ति तर्हि भवन्तः विकासकस्य समस्यां निवारयितुं प्रतीक्षितुम् अर्हन्ति

मुक्तस्रोतस्य बृहत्प्रतिरूपं किम् इति विषये उद्योगः मुक्तस्रोतसॉफ्टवेयरवत् स्पष्टसहमतिं न प्राप्तवान् ।

बृहत् भाषाप्रतिमानानाम्, सॉफ्टवेयर मुक्तस्रोतस्य च मुक्तस्रोतः अवधारणायां समानौ स्तः, ते द्वौ अपि मुक्ततायां, साझेदारीयां, सहकार्ये च आधारितौ स्तः, समुदायं विकासे सुधारे च भागं ग्रहीतुं प्रोत्साहयति, प्रौद्योगिकीप्रगतिं प्रवर्धयति, पारदर्शितासुधारं च करोति

परन्तु कार्यान्वयनस्य आवश्यकतायाः च महत्त्वपूर्णाः भेदाः सन्ति ।

सॉफ्टवेयर मुक्तस्रोतः मुख्यतया अनुप्रयोगानाम् उपकरणानां च उद्देश्यं भवति, मुक्तस्रोतस्य संसाधनानाम् आवश्यकता न्यूना भवति, यदा तु बृहत्भाषाप्रतिमानानाम् मुक्तस्रोतस्य गणनासंसाधनानाम् उच्चगुणवत्तायुक्तानां च आँकडानां बृहत् परिमाणं भवति, तथा च अधिकानि उपयोगप्रतिबन्धाः भवितुम् अर्हन्ति अतः यद्यपि मुक्तस्रोतस्य उद्देश्यं नवीनतां प्रौद्योगिक्याः प्रसारणं च प्रवर्तयितुं वर्तते तथापि बृहत्भाषाप्रतिरूपस्य मुक्तस्रोतस्य अधिकजटिलतानां सामना भवति तथा च समुदायस्य योगदानस्य रूपमपि भिन्नम् अस्ति

रोबिन् ली इत्यनेन द्वयोः मध्ये अन्तरं बोधितम् अपि मुक्तस्रोतप्रतिरूपस्य अर्थः मुक्तस्रोतसङ्केतः नास्ति: "मुक्तस्रोतप्रतिरूपं केवलं मापदण्डानां समूहं प्राप्तुं शक्नोति, तथा च भवद्भिः SFT (निरीक्षितं सूक्ष्म-समायोजनम्) सुरक्षा-संरेखणं च कर्तव्यम् । यदि अपि you get the corresponding source code, you can't get it." एतेषां मापदण्डानां प्रशिक्षणार्थं कियत् किं च अनुपातं दत्तांशस्य उपयोगः कृतः इति ज्ञात्वा सर्वेषां कृते अग्नौ इन्धनं योजयितुं न शक्यते। एतानि वस्तूनि प्राप्तुं भवतः अनुमतिः न भविष्यति दिग्गजानां स्कन्धेषु स्थित्वा पुनरावर्तनीयरूपेण विकासं कर्तुं "।

बृहत्भाषाप्रतिमानानाम् पूर्णप्रक्रियामुक्तस्रोते आदर्शविकासस्य सम्पूर्णप्रक्रियायाः, आँकडासंग्रहणात्, आदर्शनिर्माणात्, प्रशिक्षणात् परिनियोजनपर्यन्तं, मुक्तं पारदर्शकं च करणं समावेशितम् अस्ति अस्मिन् दृष्टिकोणे न केवलं दत्तांशसमूहानां, आदर्शवास्तुकलायां च प्रकटीकरणं समावेशितम्, अपितु प्रशिक्षणप्रक्रियायाः कोडसाझेदारी, पूर्वप्रशिक्षितमाडलभारस्य विमोचनं च समाविष्टम् अस्ति

गतवर्षे बृहत्भाषाप्रतिमानानाम् संख्यायां महती वृद्धिः अभवत्, बहवः मुक्तस्रोतत्वेन दावान् कुर्वन्ति, परन्तु ते वास्तवतः कियत् मुक्ताः सन्ति?

नेदरलैण्ड्देशस्य रेडबौड् विश्वविद्यालयस्य कृत्रिमबुद्धिसंशोधनविद्वान् आन्द्रेयस् लीसेन्फेल्ड्, कम्प्यूटेशनल् भाषाविदः मार्क डिङ्गेमान्से च अपि ज्ञातवन्तः यत् यद्यपि "मुक्तस्रोत" इति पदस्य व्यापकरूपेण प्रयोगः भवति तथापि बहवः आदर्शाः सर्वोत्तमे केवलं "मुक्तभाराः" एव सन्ति, अन्ये च अधिकांशः विषयः system construction सर्वे पक्षाः गुप्ताः सन्ति।

यथा, यद्यपि मेटा, माइक्रोसॉफ्ट इत्यादीनां प्रौद्योगिकीनां बृहत् भाषाप्रतिमानं "मुक्तस्रोत" इति विपणनं भवति तथापि ते अन्तर्निहितप्रौद्योगिक्या सह सम्बद्धानि महत्त्वपूर्णानि सूचनानि न प्रकाशयन्ति तेषां आश्चर्यं यत् एआइ-कम्पनीनां, अल्पसंसाधनयुक्तानां संस्थानां च कार्यप्रदर्शनम् अधिकं प्रशंसनीयम् आसीत् ।

शोधदलेन लोकप्रियस्य "मुक्तस्रोतस्य" बृहत्भाषाप्रतिरूपपरियोजनानां श्रृङ्खलायाः विश्लेषणं कृत्वा तेषां वास्तविकमुक्ततायाः मूल्याङ्कनं बहुपक्षेभ्यः यथा कोड, आँकडा, भार, एपिआइ, दस्तावेजीकरणं च कृतम् अध्ययनेन OpenAI इत्यस्य ChatGPT इत्यस्य अपि बन्दस्रोतस्य सन्दर्भबिन्दुरूपेण उपयोगः कृतः, यत्र “मुक्तस्रोत” परियोजनानां यथार्थस्थितिः प्रकाशिता ।




✔ इत्यस्य अर्थः उद्घाटितः, ~ इत्यस्य अर्थः आंशिकरूपेण उद्घाटितः, X इत्यस्य अर्थः बन्दः इति

परिणामेषु परियोजनासु महत्त्वपूर्णाः अन्तराः दृश्यन्ते अस्य क्रमाङ्कनस्य अनुसारं एलेन् इन्स्टिट्यूट् फ़ॉर् एआइ इत्यस्य ओल्मो सर्वाधिकं मुक्तस्रोतप्रतिरूपम् अस्ति, तदनन्तरं बिगसायन्सस्य ब्लूमजेड् इति, ययोः द्वयोः अपि अलाभकारीसंस्थाभिः विकसितम्

पत्रे उक्तं यत् यद्यपि मेटा इत्यस्य ल्लामा तथा गूगल डीपमाइण्ड् इत्यस्य गेम्मा मुक्तस्रोतस्य वा मुक्तस्य वा दावान् कुर्वन्ति तथापि ते वस्तुतः केवलं मुक्तभाराः एव सन्ति बाह्यसंशोधकाः पूर्वप्रशिक्षितमाडलानाम् अभिगमनं उपयोगं च कर्तुं शक्नुवन्ति, परन्तु मॉडलस्य निरीक्षणं वा अनुकूलनं वा कर्तुं न शक्नुवन्ति, तथा च कथं इति न जानन्ति आदर्शः विशिष्टकार्यं लक्ष्यं करोति।

LLaMA 3 तथा Mistral Large 2 इत्येतयोः अद्यतनविमोचनेन बहु ध्यानं आकृष्टम् अस्ति । मॉडल उद्घाटनस्य दृष्ट्या LLaMA 3 मॉडलभारं उजागरयति उपयोक्तारः एतान् पूर्वप्रशिक्षितान् निर्देशान् च सूक्ष्मतया ट्यूनिङ्ग् कर्तुं शक्नुवन्ति, तदतिरिक्तं मेटा मॉडलपूर्वप्रशिक्षणस्य निर्देशस्य च सूक्ष्मसमायोजनस्य कृते किञ्चित् मूलभूतं कोडं अपि प्रदाति । परन्तु सम्पूर्णः प्रशिक्षणसङ्केतः न प्रदत्तः, LLaMA 3 इत्यस्य प्रशिक्षणदत्तांशः च सार्वजनिकः न कृतः । परन्तु अस्मिन् समये LMeta इत्यनेन LLaMA 3.1 405B इत्यस्य विषये ९३ पृष्ठीयं तकनीकीप्रतिवेदनम् आनयत् ।

Mistral Large 2 इत्यस्य स्थितिः अपि एतादृशी एव अस्ति यत् एतत् मॉडलभारस्य एपिआइ इत्यस्य च दृष्ट्या उच्चस्तरीयं मुक्ततां निर्वाहयति, परन्तु सम्पूर्णसङ्केतस्य प्रशिक्षणदत्तांशस्य च दृष्ट्या न्यूनतां प्राप्नोति। अनुसन्धानं अनुमन्यते व्यावसायिकप्रयोगे प्रतिबन्धैः सह उपयोगः।

गूगलः अवदत् यत् कम्पनी "स्वभाषायां अतीव सटीका" अस्ति यदा मॉडलस्य वर्णनं करोति, ते च गेम्मा इत्येतत् मुक्तस्रोतस्य अपेक्षया मुक्तस्रोतम् इति आह्वयन्ति स्म । "विद्यमानाः मुक्तस्रोतसंकल्पनाः सर्वदा एआइ-प्रणालीषु प्रत्यक्षतया प्रयोज्यः न भवन्ति" ।

अस्य अध्ययनस्य महत्त्वपूर्णः सन्दर्भः यूरोपीयसङ्घस्य कृत्रिमबुद्धि-अधिनियमः अस्ति, यः यदा प्रवर्तते तदा मुक्तरूपेण वर्गीकृतेषु मॉडलेषु शिथिलतरविनियमाः आरोपयति, अतः मुक्तस्रोतस्य विषये परिभाषाः अधिकाः महत्त्वपूर्णाः भवितुम् अर्हन्ति

नवीनतां प्राप्तुं एकमात्रः उपायः इति शोधकर्तारः वदन्ति यत् मॉडलस्य tweak करणीयम्, यस्य कृते भवतः स्वस्य संस्करणस्य निर्माणार्थं पर्याप्तसूचना आवश्यकी भवति । न केवलं, अपितु आदर्शानां परीक्षणं करणीयम् यथा, यदि कश्चन आदर्शः बहुसंख्यया परीक्षणनमूनानां विषये प्रशिक्षितः भवति तर्हि विशिष्टपरीक्षायाः उत्तीर्णता उपलब्धिः न भवितुम् अर्हति ।

ते अपि एतावता मुक्तस्रोतविकल्पानां उद्भवेन आनन्दिताः सन्ति, तथा च ChatGPT एतावत् लोकप्रियं यत् तस्य प्रशिक्षणदत्तांशस्य वा अन्येषां पर्दापृष्ठस्य युक्तीनां विषये किमपि विस्मर्तुं सुलभम् अस्ति ये प्रतिरूपं अधिकतया अवगन्तुं वा तदधारितं अनुप्रयोगं निर्मातुम् इच्छन्ति तेषां कृते एतत् जालम् अस्ति, यदा तु मुक्तस्रोतविकल्पाः महत्त्वपूर्णं मूलभूतसंशोधनं सक्षमं कुर्वन्ति

सिलिकन स्टार इत्यनेन केषाञ्चन घरेलुमुक्तस्रोतबृहभाषाप्रतिमानानाम् मुक्तस्रोतस्थितेः विषये अपि आँकडानि निर्मिताः:


वयं सारणीतः द्रष्टुं शक्नुमः यत् विदेशेषु विद्यमानस्य स्थितिसदृशं अधिकं सम्यक् मुक्तस्रोतप्रतिरूपं मूलतः शोधसंस्थाभिः नेतृत्वं भवति एतत् मुख्यतया यतोहि शोधसंस्थानां लक्ष्यं वैज्ञानिकसंशोधनप्रगतेः उद्योगविकासस्य च प्रवर्धनं भवति, ते च अधिकं सन्ति स्वसंशोधनपरिणामान् उद्घाटयितुं प्रवृत्ताः।

वाणिज्यिककम्पनयः स्वस्य संसाधनलाभानां उपयोगं अधिकशक्तिशालिनः आदर्शानां विकासाय कुर्वन्ति तथा च समुचितमुक्तस्रोतरणनीत्याः माध्यमेन प्रतियोगितायां लाभं प्राप्नुवन्ति


GPT-3 तः BERT पर्यन्तं मुक्तस्रोतः बृहत् आदर्शपारिस्थितिकीतन्त्राय महत्त्वपूर्णं प्रेरणाम् आनयत् ।

अस्य वास्तुकलाप्रशिक्षणपद्धतीनां सार्वजनिकीकरणं कृत्वा शोधकर्तारः विकासकाः च एतेषु आधारेषु अधिकं अन्वेषणं सुधारं च कर्तुं शक्नुवन्ति, येन अधिकानि अत्याधुनिकप्रौद्योगिकीनि अनुप्रयोगाः च प्राप्यन्ते

मुक्तस्रोतस्य बृहत्प्रतिमानानाम् उद्भवेन विकासस्य सीमा महत्त्वपूर्णतया न्यूनीकृता अस्ति तथा च लघुमध्यम-आकारस्य उद्यमाः एतेषां उन्नत-ए.आइ. एतेन अधिकानि नवीनपरियोजनानि उत्पादानि च शीघ्रं कार्यान्वितुं शक्यन्ते, येन सम्पूर्णस्य उद्योगस्य विकासः प्रवर्धितः भवति । विकासकाः सक्रियरूपेण अनुकूलनविधयः अनुप्रयोगप्रकरणाः च मुक्तस्रोतमञ्चे साझां कुर्वन्ति, यत् प्रौद्योगिकीपरिपक्वतां अनुप्रयोगं च प्रवर्धयति ।

शिक्षायाः वैज्ञानिकसंशोधनस्य च कृते मुक्तस्रोतस्य बृहत्भाषाप्रतिमानाः बहुमूल्यं संसाधनं प्रददति । एतेषां आदर्शानां अध्ययनेन उपयोगेन च छात्राः नवीनविकासकाः च शीघ्रमेव उन्नत-एआइ-प्रौद्योगिकीषु निपुणतां प्राप्तुं, शिक्षणवक्रं लघु कर्तुं, उद्योगे ताजां रक्तं आनेतुं च शक्नुवन्ति

परन्तु बृहत् भाषाप्रतिमानानाम् मुक्तता सरलं द्विचक्रीयगुणं नास्ति । ट्रांसफॉर्मर-आधारित-प्रणाली-वास्तुकला तस्य प्रशिक्षण-प्रक्रिया च अत्यन्तं जटिला अस्ति तथा च केवलं मुक्त-बन्द-रूपेण वर्गीकरणं कठिनम् अस्ति । मुक्तस्रोतस्य बृहत्प्रतिरूपं सरलं लेबलं नास्ति, अपितु अधिकं स्पेक्ट्रम इव भवति, पूर्णतया मुक्तस्रोतः आरभ्य आंशिकरूपेण मुक्तस्रोतपर्यन्तं, भिन्न-भिन्न-अङ्कैः सह

बृहत्भाषाप्रतिमानानाम् मुक्तस्रोतः जटिलं सुक्ष्मं च कार्यम् अस्ति, सर्वेषां प्रतिमानानाम् मुक्तस्रोतः न भवितुमर्हति ।

न च अस्माभिः "नैतिकअपहरणस्य" रूपेण पूर्णमुक्तस्रोतस्य आग्रहः कर्तव्यः, यतः अस्मिन् बहुधा प्रौद्योगिकी, संसाधनं, सुरक्षाविचाराः च समाविष्टाः सन्ति, तथा च मुक्ततायाः सुरक्षायाश्च, नवीनतायाः, उत्तरदायित्वस्य च मध्ये सन्तुलनस्य आवश्यकता वर्तते प्रौद्योगिक्याः अन्यपक्षेषु इव योगदानस्य विविधाः उपायाः समृद्धतरं प्रौद्योगिकीपारिस्थितिकीतन्त्रं निर्मान्ति ।

मुक्तस्रोतस्य बन्दस्रोतस्य च प्रतिरूपयोः सम्बन्धस्य तुलना सॉफ्टवेयर-उद्योगे मुक्तस्रोतस्य बन्दस्रोतस्य च सॉफ्टवेयरस्य सह-अस्तित्वेन सह भवितुं शक्यते

मुक्तस्रोतप्रतिरूपं प्रौद्योगिक्याः व्यापकप्रसारं नवीनतां च प्रवर्धयति तथा च शोधकर्तृणां उद्यमानाञ्च अधिकसंभावनाः प्रदाति, यदा तु बन्दस्रोतप्रतिरूपं सम्पूर्णे उद्योगे मानकसुधारं प्रवर्धयति द्वयोः मध्ये स्वस्थप्रतियोगिता निरन्तरं सुधारं प्रेरयति, उपयोक्तृभ्यः विविधविकल्पान् च प्रदाति ।

यथा मुक्तस्रोत-स्वामित्व-सॉफ्टवेयरयोः संयुक्तरूपेण अद्यतन-सॉफ्टवेयर-पारिस्थितिकीतन्त्रस्य आकारः कृतः,मुक्तस्रोतस्य बन्दस्रोतस्य च बृहत्प्रतिमानयोः मध्ये द्विपक्षीयविरोधः नास्ति । एआइ-प्रौद्योगिक्याः निरन्तर-उन्नतिं कर्तुं भिन्न-भिन्न-अनुप्रयोग-परिदृश्यानां आवश्यकतानां पूर्तये च द्वयोः सह-अस्तित्वं महत्त्वपूर्णं चालकशक्तिः अस्ति अन्ततः उपयोक्तारः विपण्यं च तेषां अनुकूलं विकल्पं करिष्यन्ति ।