समाचारं

एआइ पीएचडी कथं प्रभावशालिनः शोधं उत्पादयति? स्लोनपुरस्कारविजेतानां शिष्याः स्वस्य अनुभवान् साझां कुर्वन्ति

2024-10-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय संकलन

लेखकः उमर खट्टब

सम्पादकः अण्डस्य चटनी, जेनान

पत्रं लिखन् ? तत् केवलं एकं लघु पदम् एव।

स्नातकविद्यालये बहवः जनाः प्रायः स्वस्य संशोधनस्य संरचना कथं करणीयम् इति भ्रमिताः भवन्ति । पूर्वमेव जनसङ्ख्यायुक्ते कृत्रिमबुद्धेः क्षेत्रे भेदं कर्तुं कथं संशोधनं कर्तव्यम् ?

अत्यधिकाः जनाः मन्यन्ते यत् दीर्घकालीनाः परियोजनाः, समुचितसङ्केतविमोचनं, सुविचारिताः च मापदण्डाः पर्याप्तं प्रेरकाः न सन्ति - कदाचित् एतत् किमपि भवितुम् अर्हति यत् भवन्तः शीघ्रं अपराधबोधेन च कुर्वन्ति, ततः पुनः "वास्तविक" शोधं कर्तुं गच्छन्ति

अद्यैव स्टैन्फोर्डविश्वविद्यालये एनएलपी-समूहे पीएचडी-छात्रः उमर-खट्टाबः प्रभावशालिनः शोधं कर्तुं शीर्ष-ए.आइ.-विद्वानानां विचाराणां चर्चां कृत्वा एकं ब्लॉग्-पोस्ट् प्रकाशितवान्

सः किं उक्तवान् इति पश्यामः-

शोधप्रभावः अनेकरूपेण आगच्छति, अहं केवलं मुक्तस्रोतकार्यस्य माध्यमेन (उदा. मॉडल्, सिस्टम्, फ्रेमवर्क्स् अथवा बेन्चमार्क्स्) एआइ इत्यस्य विषये शोधप्रभावस्य मापनं प्रति केन्द्रीक्रियिष्यामि। यतो हि मम लक्ष्यस्य भागः मम विचाराणां परिष्कारः, विशिष्टसूचनानां अभिलेखनं, प्रतिक्रियासङ्ग्रहः च अस्ति, अहं कथनं अधिकं संक्षिप्तं करिष्यामि । यदि भवतः अन्ये विचाराः सन्ति तर्हि टिप्पणीक्षेत्रे चर्चां कुर्वन्तु।

प्रथमं अत्र मार्गदर्शकसिद्धान्ताः सन्ति- १.

  • परियोजनासु ध्यानं ददातु, कागदपत्रेषु न।

  • विकासाय अधिकं स्थानं भवति इति समुचितसमस्यां चित्वा भवान् "छिद्रं खनितुं" शक्नोति ।

  • द्वौ पदौ अग्रे चिन्तयित्वा शीघ्रं पुनरावृत्तिं कुर्वन्तु।

  • स्वकार्यं सार्वजनिकं कुरुत, स्वविचारानाम् प्रचारं च कुर्वन्तु।

  • स्वयमेव प्रेरयितुं उपायान् अन्वेष्टुम् : अत्र भवतः मुक्तस्रोतसंशोधनस्य विकासाय युक्तयः सन्ति ।

  • नूतनपत्रैः सह स्वस्य परियोजनायां निवेशं निरन्तरं कुर्वन्तु।

  • पञ्चमः बिन्दुः “मुक्तस्रोतसंशोधनविकासाय युक्तयः” स्वस्य दीर्घतरं लेखं अर्हति । तस्य विषये अहं मम अग्रिमे पोस्ट् मध्ये लिखितुं शक्नोमि।

परियोजनासु ध्यानं ददातु

कागदस्य अपेक्षया

एषः एकः निर्णायकः चिन्तनः अस्ति यस्मिन् अन्यत् सर्वं आधारितम् अस्ति।

आरम्भिकाः छात्राः प्रथमेषु कतिपयेषु पत्रेषु प्रकाशने महत् बलं दास्यन्ति। एतस्य अर्थः अस्ति यत् भवन्तः कथं शोधं कर्तुं शिक्षन्ति, प्रारम्भिकदिशा अन्वेषयन्ति, प्रारम्भिकप्रगतिः च प्रदर्शयन्ति इति। परन्तु एषः एकः चरणः अस्ति यत् भवद्भिः अन्ते अवश्यमेव त्यक्तव्यम् : दीर्घकालं यावत् भवतः उपलब्धयः वृद्धिः च पत्राणां निरपेक्षसङ्ख्यायां न्यूनतया भवतः प्रभावे, भवता प्रसारितस्य समग्रसंशोधनसन्दर्भस्य च उपरि अधिकं निर्भरं भविष्यति।

दुर्भाग्येन, अत्यधिकाः पीएचडी-छात्राः अधिकांशं सम्भाव्यं प्रभावशालिनः व्यवहारं "अप्रेरक" इति पश्यन्ति । एतेन अहं तावत्पर्यन्तं भ्रमितः अभवम् यत् तेषां अभिप्रायः किम् अस्ति यत् एतानि कार्याणि भवतः अग्रिमपत्रं प्रकाशयितुं भवतः क्षमतां मन्दं कर्तुं शक्नुवन्ति इति। परन्तु भवतः अग्रिमपत्रं एतावता शीघ्रं प्रकाशयितुं क्षमता न्यूना महत्त्वपूर्णा अस्ति।

अहं सुझावमिदं ददामि यत् भवान् स्वकार्यं पृथक्कृतपत्राणां श्रृङ्खलारूपेण न चिन्तयति, अपितु स्वयमेव पृच्छतु यत् भवान् काः बृहत्तराणि दृष्टयः नेतृत्वं कर्तुं गच्छन्ति, तदन्तर्गताः उपक्षेत्राणि वा प्रतिमानाः वा के सन्ति? भवन्तः स्वकार्यं किं भेदं कर्तुम् इच्छन्ति ? अतः भवन्तः बेन्चमार्कं अन्वेष्टुं स्थापयितुं च व्यक्तिगतपत्राणि प्रकाशयिष्यन्ति, यदा तु बृहत्तरं दृष्टिः किमपि भवितुम् अर्हति यस्य विषये भवन्तः इच्छया पुनरावृत्तिं कुर्वन्ति। कागदस्य वहनात् बहु बृहत्तरं भवितुम् आवश्यकम्, अवश्यमेव च एषा समस्या अद्यापि पूर्णतया समाधानं न प्राप्ता ।

एतत् कर्तुं एकः उपायः अस्ति यत् भवन्तः मुक्तस्रोतक्षेत्रे परिपालितानां सुसंगतानां कलाकृतीनां (यथा आदर्शाः, प्रणालीः, ढाञ्चाः, अथवा बेन्चमार्काः) परितः केचन शोधपत्राणि संरचयन्तु इयं रणनीतिः "केचन प्रयोगान् चालयित्वा क्षणिकं द्रुतं भण्डारं विमोचयन्तु" इत्यस्मात् अधिकं महत् अस्ति, परन्तु एषा भवन्तं वास्तविकप्रभावयुक्तां समस्यां अन्वेष्टुं बाध्यं करोति तथा च एतत् सुनिश्चितं कर्तुं साहाय्यं करोति यत् भवन्तः यत् नूतनं शोधं कुर्वन्ति तत् वस्तुतः सुसंगतं उपयोगी च भवति: भवन्तः प्रयासं न कुर्वन्ति भवता विकसितानां, परिपालितानां च कलाकृतीनां कृते व्यर्थं लघुविशेषतां वा युक्तिं वा प्रवर्तयितुं ।

सुधारस्य अधिकं स्थानं युक्ताः समुचितप्रश्नान् चिनुत

"छिद्रं खनितुं" शक्नोति।

भवता लिखितं प्रत्येकं पत्रं अनिश्चितकालं यावत् निवेशस्य योग्यं न भवति। अनेकाः पत्राः एकवारं अन्वेषणात्मकाः पत्राः सन्ति । बृहत्तरपरियोजनासु परिणतुं शक्नुवन्ति दिशाः अन्वेष्टुं निम्नलिखितमापदण्डानां उपयोगं कुर्वन्तु ।

प्रथमं समस्या अत्याधुनिकं भवितुमर्हति। भवन्तः बहुधा परिभाषितुं शक्नुवन्ति, परन्तु इत्यस्मिन्...क्षेत्रे एकः प्रभावी रणनीतिः अस्ति यत् एतादृशं समस्यास्थानं अन्वेष्टव्यं यत् २-३ वर्षेभ्यः परं "उष्णं" भविष्यति परन्तु अद्यापि मुख्यधारायां न जातम्।

द्वितीयं, समस्यायाः छिद्रखननस्य महती सम्भावना भवितुमर्हति अर्थात् अनेकेषु अधःप्रवाहसमस्यासु सम्भाव्यप्रभावः । मूलतः एतेषां प्रश्नानां परिणामाः पर्याप्तजनानाम् लाभाय वा रुचिकराः वा भवितुम् अर्हन्ति । शोधकर्तारः जनाः च चिन्तयन्ति यत् तेषां लक्ष्यं प्राप्तुं किं साहाय्यं करोति, अतः भवतः प्रश्नः अन्येषां वस्तूनाम् निर्माणे सहायतां कर्तुं वा अनुसन्धानं वा उत्पादनं वा लक्ष्यं प्राप्तुं वा इव किमपि भवितुम् अर्हति सैद्धान्तिकमूलाधाराः, प्रणालीमूलसंरचना, नवीनमापदण्डाः, नूतनाः प्रतिरूपाः, अन्ये च बहवः विषयाः अध्ययनार्थं भवान् एतत् फ़िल्टरं प्रयोक्तुं शक्नोति ।

तृतीयम्, समस्यां बृहत्तरेण मार्जिनेन सह अवश्यं त्यक्तव्यम्। यदि भवान् जनान् वदति यत् तेषां प्रणाली १.५ गुणाधिकं द्रुततरं वा ५% अधिकं कार्यक्षमतां वा भवितुम् अर्हति तर्हि सम्भवतः तत् रोचकं नास्ति । मम मनसि एतत् प्रतीयते यत् भवद्भिः एतादृशाः समस्याः अन्वेष्टव्याः यत्र न्यूनातिन्यूनं वर्षाणां परिश्रमस्य अनन्तरं भवतः किमपि शीघ्रं, कथयतु २०x द्रुततरं वा ३०% अधिकं कुशलं वा कर्तुं शून्यरहिता आशा भवति। अवश्यं सफलतां प्राप्तुं भवता तत्र सर्वं मार्गं न गन्तव्यम्, प्रथमं पत्रं प्रकाशयितुं वा प्रथमं कार्यं विमोचयितुं वा यावत् भवन्तः सम्पूर्णतया तत्र न प्राप्नुवन्ति तावत् प्रतीक्षा न कर्तव्या

अहं बहु अमूर्तः भवितुम् न इच्छामि, दृष्टान्तरूपेण colbert इत्यस्य उपयोगं कुर्मः। २०१९ तमस्य वर्षस्य अन्ते पुनर्प्राप्त्यर्थं bert इत्यस्य प्रयोगस्य विषये शोधः अतीव लोकप्रियः आसीत्, परन्तु एताः पद्धतयः अतीव महत् मूल्यं धारयन्ति । स्वाभाविकतया पृच्छति यत्, किं वयं अस्य उपायस्य कार्यक्षमतायाः महत्त्वपूर्णं सुधारं कर्तुं शक्नुमः? किम् एषः उत्तमः प्रश्नः भवति ?

प्रथमं अतीव प्रस्तावना अस्ति। वयं सम्यक् पूर्वानुमानं कर्तुं शक्नुमः यत् २०२१ तमवर्षपर्यन्तं (१.५ वर्षाणाम् अनन्तरं) बहवः शोधकर्तारः bert इत्यस्य आधारेण कुशलं पुनर्प्राप्तिवास्तुकलाम् अन्वेषयिष्यन्ति । द्वितीयं, अस्मिन् विकासाय बहु स्थानं वर्तते। नवीन एमएल प्रतिमानाः एतादृशाः भवन्ति यतोहि अधिकांशः एतादृशाः प्रयासाः प्रारम्भे कार्यक्षमतायाः अवहेलनां कुर्वन्ति । वस्तुतः मूलपद्धत्या प्रश्नस्य उत्तरं दातुं ३० सेकेण्ड् यावत् समयः भवितुं शक्नोति, परन्तु अधुना ३० मिलीसेकेण्ड् मध्ये उच्चगुणवत्तायुक्तानि पुनर्प्राप्तिः सम्पन्नं कर्तुं शक्नोति, यत् १,००० गुणाधिकं द्रुततरम् अस्ति तृतीयम्, अस्य महत् फैनआउट् अस्ति । स्केलेबल-पुनर्प्राप्तिः एकः उत्तमः "आधारः" समस्या अस्ति: सर्वेषां पुनर्प्राप्तीनां उपरि किमपि निर्मातुं आवश्यकता वर्तते, परन्तु अल्पाः एव तान् निर्मातुम् इच्छन्ति ।

द्वौ पदौ अग्रे चिन्तयतु

शीघ्रं च पुनरावृत्तिं कुर्वन्ति

इदानीं यदा भवतः उत्तमसमस्या अस्ति, तदा भवतः पुरतः स्थितं निम्नलम्बितफलं भवतः उपायरूपेण चयनं कर्तुं मा त्वरितम्! कस्मिन्चित् समये न्यूनातिन्यूनं बहुजनाः अन्ते "स्पष्टं" दृष्टिकोणं विचारयिष्यन्ति ।

अपि तु न्यूनातिन्यूनं द्वौ पदौ अग्रे चिन्तयन्तु। यदा अयं समयसापेक्षः विषयः अन्ततः मुख्यधारायां भवति तदा अधिकांशजनानां मार्गं चिनुत। ततः, मार्गस्य एव सीमाः चित्वा ताः सीमाः अवगन्तुं सम्बोधयितुं च कार्यं कुर्वन्तु ।

व्यवहारे एतत् कीदृशं दृश्यते ? colbert प्रकरणं पुनः अवलोकयामः। bert इत्यस्य उपयोगेन कुशलं रिट्रीवरं निर्मातुं स्पष्टः उपायः दस्तावेजान् सदिशेषु एन्कोड् करणं भवति । रोचकं तत् अस्ति यत् २०१९ तमस्य वर्षस्य अन्ते यावत् केवलं सीमितं आईआर-कार्यं एव एतत् प्राप्तवान् आसीत् । यथा, अस्मिन् वर्गे सर्वाधिकं उद्धृतं कार्यं (dpr) केवलं २०२० तमस्य वर्षस्य एप्रिलमासे एव प्रथमं पूर्वमुद्रणं प्रकाशितम् ।

एतत् दृष्ट्वा भवान् चिन्तयति यत् २०१९ तमे वर्षे सम्यक् कार्यं bert मार्गेण महान् एक-सदिश-ir-प्रतिरूपस्य निर्माणम् अस्ति । तस्य विपरीतम्, केवलं द्वौ पदौ अग्रे चिन्तयन् प्रश्नं याचते यत् शीघ्रं वा पश्चात् वा सर्वे एकसदिश-पद्धतिं निर्मान्ति, अतः एषः एक-सदिश-पद्धतिः मौलिकरूपेण कुत्र अटति? वस्तुतः एषा समस्या पश्चात् अन्तरक्रियाप्रतिमानानाम्, व्यापकरूपेण प्रयुक्तानां प्रतिमानानाम् च कारणं जातम् ।

अन्यत् उदाहरणरूपेण वयं dspy इत्यस्य उपयोगं कर्तुं शक्नुमः । २०२२ तमस्य वर्षस्य फेब्रुवरीमासे यथा यथा संकेताः अधिकाधिकं शक्तिशालिनः अभवन् तथा तथा स्पष्टं जातं यत् जनाः पूर्ववत् सूक्ष्म-समायोजनस्य अपेक्षया पुनः प्राप्ति-आधारित-गुणवत्ता-आश्वासनार्थं संकेतानां उपयोगं कर्तुम् इच्छन्ति एतत् कर्तुं स्वाभाविकतया अस्माभिः एकः विधिः स्थापनीयः । पदद्वयं गत्वा वयं पृच्छामः यत् एतादृशः उपायः कुत्र अटति ? अन्ततः "retrieve then generate" (अथवा rag) इति दृष्टिकोणः सम्भवतः lm सम्मिलितः सरलतमः उपायः अस्ति ।

येषु कारणेषु जनाः तस्मिन् रुचिं लभन्ते, तेषां रुचिः स्पष्टतया अधिकाधिकं भविष्यति: (i) मॉड्यूलानां अधिकजटिलसंयोजनानि अभिव्यक्तुं (ii) अन्तर्निहितस्य lm how to इत्यस्य स्वचालितप्रोम्प्टिंग् अथवा सूक्ष्म-समायोजनस्य माध्यमेन किं कर्तव्यमिति चिन्तयितुं; परिणामितजटिलपाइपलाइनस्य निरीक्षणं वा अनुकूलनं वा करोति। एतत् dspy अस्ति।

अस्य नियमस्य उत्तरार्धं "शीघ्रं पुनरावृत्तिः" इति । एषः सम्भवतः प्रथमः शोधसल्लाहः आसीत् यः मम सल्लाहकारः matei zaharia (sloan prize विजेता अपाचे spark इत्यस्य संस्थापकः च) मम पीएचडी इत्यस्य प्रथमसप्ताहे मम कृते दत्तवान्: एकं विषयं चिन्तयित्वा यत्र भवान् शीघ्रं पुनरावृत्तिं कर्तुं शक्नोति तथा च प्रतिक्रियां प्राप्तुं शक्नोति (यथा delay अथवा verify score) संस्करणं समस्यायाः, यत् भवतः प्रहेलिकासमाधानस्य सम्भावनासु महतीं सुधारं कर्तुं शक्नोति। यदि भवान् द्वौ पदौ अग्रे चिन्तयति तर्हि एतत् महत्त्वपूर्णं, यत् कठिनं अनिश्चितं च पर्याप्तम्।

स्वकार्यं सार्वजनिकं कुरुत

भवतः विचाराः अन्तः मज्जन्तु

अस्मिन् क्षणे भवान् उत्तमसमस्यां आविष्कृतवान्, यावत् भवान् किमपि शीतलं न आविष्कृत्य अन्वेषणात्मकं लेखं न लिखितवान् तावत् पुनरावृत्तिं कुर्वन् आसीत् । अग्रिमपत्रं प्रति मा गच्छतु । तस्य स्थाने स्वस्य कार्यस्य परिणामान् विश्वे प्राप्तुं ध्यानं दत्तव्यं तथा च जनानां सह वास्तविकं अन्तरक्रियाः कर्तुं प्रयतस्व, न केवलं स्वस्य एकस्य पत्रस्य विमोचनस्य विषये, अपितु भवन्तः सक्रियरूपेण शोधं कुर्वन्ति तस्य विशालस्य चित्रस्य विषये। अथवा तस्मात् अपि उत्तमम्, भवता निर्मितस्य, परिपालितस्य च उपयोगी मुक्तस्रोतसाधनस्य विषये जनान् ज्ञापयन्तु यत् भवतः मुख्यविचारं गृह्णाति ।

एकं सामान्यं प्रथमं सोपानं arxiv इत्यत्र स्वस्य पत्रस्य पूर्वमुद्रणं प्रकाशयितुं ततः स्वस्य पत्रस्य प्रकाशनस्य घोषणां कृत्वा "पोस्ट्" प्रकाशयितुं भवति। एतत् कुर्वन् सुनिश्चितं कुर्वन्तु यत् भवान् स्वस्य पोस्ट् विशिष्टेन, सारभूतेन, अवगम्यमानेन च दावेन आरभते। लक्ष्यं न भवति यत् भवान् एकं पत्रं प्रकाशितवान् इति जनान् कथयितुं, यस्य आन्तरिकं मूल्यं नास्ति लक्ष्यं भवतः मुख्यतर्कं प्रत्यक्षतया आकर्षकरूपेण च प्रसारयितुं भवति। (आम्, अहं जानामि यत् कठिनम् अस्ति, परन्तु आवश्यकम्)।

सम्भवतः अधिकं महत्त्वपूर्णं यत्, प्रक्रिया प्रथमेन "प्रक्षेपणेन" न समाप्तं भवति, केवलं आरम्भः एव । इदानीं भवान् परियोजनासु निवेशितः अस्ति, न केवलं कागदपत्रेषु निवेशितः इति दृष्ट्वा, भवतः विचाराः वैज्ञानिकसञ्चारः च वर्षभरि निरन्तरं भविष्यति, पृथक्कृतपत्रप्रकाशनात् दूरम्।

यदा अहं स्नातकछात्राणां कार्यस्य विषये ट्वीट् कर्तुं साहाय्यं करोमि तदा तेषां प्रारम्भिक-पोष्ट्-मध्ये तेषां आशासितं ध्यानं न प्राप्यते इति न असामान्यम् | छात्राः प्रायः एतत् स्वसंशोधनस्य प्रकाशनस्य भयस्य प्रमाणीकरणरूपेण पश्यन्ति तथा च एतत् अन्यत् संकेतं गृह्णन्ति यत् तेषां अग्रिमपत्रं प्रति गन्तव्यम् इति। स्पष्टतया एषः विचारः अशुद्धः अस्ति ।

व्यक्तिगत-अनुभवस्य, द्वितीय-हस्त-अनुभवस्य, अवलोकनस्य च धनं वर्तते यत् दर्शयति यत् अस्मिन् विषये धैर्यं धारयितुं बहु सार्थकता वर्तते (यत्, प्रायः, बहवः जनाः न कुर्वन्ति)। अर्थात् दुर्लभाः अपवादाः विहाय, सद्विचारकर्षणं भवन्तं भिन्नसन्दर्भेषु बहुवारं जनान् मुख्यवस्तूनि कथयितुं आवश्यकं भवति, तथा च यावत् समुदायः कालान्तरे एतान् विचारान् आत्मसातुं समर्थः न भवति तावत् यावत् निरन्तरं स्वविचारं विचारस्य च भवतः वितरणं परिष्कृत्य क्षेत्रं विकासस्य सम्यक् चरणं प्राप्नोति यत्र एते विचाराः अधिकसुलभतया अवगम्यन्ते।

उत्साहं सङ्गृह्यताम्

मुक्तस्रोतसंशोधनस्य प्रकाशनार्थं युक्तयः

भवतः शोधस्य विषये जनान् उत्साहितं कर्तुं साधु वस्तु अस्ति, परन्तु मुक्तस्रोतसाधनानाम् प्रकाशनस्य, योगदानस्य, विकासस्य च माध्यमेन प्रासंगिक-अधःप्रवाह-अनुप्रयोगेषु भवतः विचारान् वितरितुं प्रायः अधिकं प्रभावः भवितुम् अर्हति

एतत् कर्तुं सुलभं नास्ति: केवलं readme इत्यनेन सह कोडसञ्चिकाः github इत्यत्र अपलोड् करणं पर्याप्तं नास्ति । एकः उत्तमः भण्डारः भवतः परियोजनायाः "गृहं" भविष्यति, यत् भवता प्रकाशितस्य कस्यापि पत्रस्य अपेक्षया अधिकं महत्त्वपूर्णम् ।

उत्तमं मुक्तस्रोतसंशोधनं प्रायः स्वतन्त्रगुणद्वयस्य आवश्यकता भवति । प्रथमं, तत् उत्तमं शोधं, नवीनं, समयसापेक्षं, सुव्याप्तियुक्तं, समीचीनं च भवितुमर्हति। द्वितीयं, तस्य स्पष्टा अधःप्रवाहस्य उपयोगिता, न्यूनघर्षणं च आवश्यकम् ।

एषः एव महत्त्वपूर्णः भागः अस्ति: जनाः सर्वेषां "असत्य" कारणानां कृते भवतः oss कार्यं बहुवारं परिहरिष्यन्ति (अन्ये च पुनः पुनः उपयोगं करिष्यन्ति) । यथा, भवतः शोधं वस्तुनिष्ठरूपेण "अत्याधुनिकता" भवितुम् अर्हति, परन्तु सर्वासु सम्भावनासु जनाः न्यूनघर्षणयुक्तान् विकल्पान् प्राथमिकताम् अददात् । अपरपक्षे स्नातकछात्राः प्रायः भवतः साधनस्य उपयोगं किमर्थं कुर्वन्ति इति विषयं त्यजन्ति, उदाहरणार्थं, यतः ते भवतः अत्यन्तं सृजनात्मकभागानाम् पूर्णं लाभं न लभन्ते एतत् न किमपि प्रतिरोधयोग्यं, अपितु अवगन्तुं योग्यं, सुधारं च कर्तव्यम् ।

अस्य आधारेण अहं कतिपयानि माइलस्टोन्स् सूचीबद्धं कर्तुम् इच्छामि यत् यदा मुक्तस्रोतसंशोधनपरिणामानां विषयः आगच्छति तदा ध्यानं दातव्यम्।

माइलस्टोन् 0: प्रकाशितसामग्री उपलब्धं कुर्वन्तु

कोऽपि चालयितुं न शक्नोति इति कोडं विमोचयितुं कोऽपि अर्थः नास्ति । भवतः शोधक्षेत्रे एते जनाः भवतः परिणामस्य प्रतिकृतिं कर्तुम् इच्छन्ति कदाचित् ते भवतः कार्यात् परं गत्वा भवतः शोधपरिणामानां उद्धरणं करिष्यन्ति। एते जनाः अन्यप्रकारस्य उपयोक्तृणां अपेक्षया अधिकं धैर्यं धारयन्ति । अद्यापि, कोडस्य पट्टिकाकरणं कियत् सुलभं इति अवलम्ब्य शैक्षणिकप्रभावे विशालाः भेदाः भवन्तः प्राप्नुवन्ति ।

माइलस्टोन् १ : प्रकाशितसामग्री उपयोगी करणीयम्

भवतः आलापे जनानां अतिरिक्तं, भवता सुनिश्चितं कर्तव्यं यत् भवतः विमोचनं प्रेक्षकाणां कृते उपयोगी भवति ये अन्येषां वस्तूनाम् निर्माणार्थं परियोजनायाः वास्तविकरूपेण उपयोगं कर्तुम् इच्छन्ति । कृत्रिमबुद्धिसंशोधने एषः माइलस्टोन् स्वाभाविकतया दुर्लभतया एव आगच्छति । भवन्तः येषां समस्यानां समाधानं कर्तुं प्रयतन्ते (संशोधनं, उत्पादनम् इत्यादयः) तथा च भवतः एआइ-प्रयत्नाः कुत्र साहाय्यं कर्तुं शक्नुवन्ति इति चिन्तयितुं बहुकालं विनियोजयेत् यदि भवान् एतत् सम्यक् कर्तुं शक्नोति तर्हि तस्य बहु लाभः भविष्यति, परियोजनायाः डिजाइनात् आरभ्य उजागरित-एपिआइ-पर्यन्तं तथा च प्रस्तुतानि दस्तावेजीकरणं/उदाहरणानि च ।

माइलस्टोन् २: विमोचनं अवगम्यमानं कुरुत

एआइ-संशोधकानां कृते एतत् कठिनम् अस्ति, परन्तु अस्माभिः अवगन्तव्यं यत् उपयोगी संस्करणं, यत्र सर्वं तकनीकीरूपेण उपलब्धं भवति तथा च किञ्चित् व्याख्यानीयं भवति, तस्य अर्थः न भवति यत् भवतः सम्भाव्यप्रयोक्तृणां बहुमतम् एतत् प्राप्स्यति संस्करणं अवगन्तुं सुलभं भवति तथा च तान् स्थापयितुं पर्याप्तम् शिक्षणे वा तस्य प्रयोगे वा प्रवृत्तः।

ए.आइ. बेन् क्लेवी इत्यनेन अपि अस्य विषये बहुधा लिखितम्, अस्माभिः colbert इत्यत्र कृतं कार्यं गृहीत्वा अधिकं समीपयोग्यं कर्तुं सः महत् भागं कृतवान् अस्ति।

माइलस्टोन् ३ : स्पष्टः विकल्पः किमर्थं असफलः इति चिन्तयित्वा धैर्यं धारयन्तु

वयं द्वौ पदौ अग्रे चिन्तयित्वा आरब्धाः। मम मते एतत् महत्त्वपूर्णं, परन्तु एतस्य अपि अर्थः अस्ति यत् अधिकांशजना: न अवगमिष्यन्ति यत् तेषां समस्यायाः समाधानस्य आवश्यकता किमर्थम् अस्ति यत् ते अद्यापि स्पष्टतया अवलोकयितुं न शक्नुवन्ति। अहं मन्ये कालान्तरे भवतः कार्यस्य भागः प्रकरणस्य निर्माणं भवति। प्रमाणानि सङ्गृह्य सुलभतया व्याख्यातव्यं यत् स्पष्टविकल्पाः (एकैकं पदं चिन्तयन्तु) किमर्थं विफलाः भविष्यन्ति।

माइलस्टोन् ४: उपयोक्तृणां प्रकारं अवगत्य वृद्ध्यर्थं एतस्य लाभं गृहाण

यदा अहं colbert तथा dspy आरब्धवान् तदा मम प्रारम्भिकदर्शकाः शोधकर्तारः व्यावसायिकाः ml अभियंताः च आसन् । कालान्तरे अहं तत् त्यक्त्वा अवगन्तुं ज्ञातवान् यत् भवान् बृहत्तरं प्रेक्षकवर्गं प्राप्तुं शक्नोति, परन्तु ते भिन्नानि वस्तूनि इच्छन्ति। किमपि कर्तुं पूर्वं सम्भाव्यप्रयोक्तृणां भिन्नवर्गाणां परोक्षरूपेण प्रत्यक्षतया वा अपि न अवरुद्धं कुर्वन्तु । एषा स्थितिः जनानां चिन्तापेक्षया बहु अधिका अस्ति ।

द्वितीयं, उपयोक्तृणां अन्वेषणकाले अस्माभिः द्वयोः प्रकारयोः उपयोक्तृयोः मध्ये सन्तुलनं अन्वेष्टव्यम् । एकतः उन्नत-उपयोग-प्रकरणैः सह विशेषज्ञ-निर्मातृभिः भवतः बहु धनं निवेशयितुं अपेक्षितं भवेत्, परन्तु कतिपय-उपयोग-प्रकरणं शोध-अर्थेन अग्रे धकेलितुं प्रवृत्ताः भवन्ति, यत् फलं दातुं शक्नोति सार्वजनिकनिर्मातारः तु सामान्यतया एम.एल. भवतः उभयस्य आवश्यकता अस्ति।

माइलस्टोन् ५ : रुचिं वर्धमानसमुदाये परिणमयन्तु

ओएसएस-कार्यस्य यथार्थसफलता भवतः प्रयत्नात् स्वतन्त्रस्य समुदायस्य उपस्थितौ तस्य निरन्तरवृद्धौ च निहितं भवति । सामान्यतया, एकः उत्तमः समुदायः जैविकः भवितुमर्हति, परन्तु भवद्भिः तस्य निर्माणे सहायतार्थं सक्रियरूपेण कार्यं कर्तव्यम्, यथा योगदानस्य चर्चायाः च स्वागतं, रुचिं योगदानं वा कस्यचित् प्रकारस्य मञ्चे (यथा discord अथवा github) परिणतुं अवसरान् अन्वेष्टुं च।

माइलस्टोन् 6: रुचिं सक्रिय, सहकारि, मॉड्यूलर डाउनस्ट्रीम परियोजनासु परिवर्तयन्तु

संभावना अस्ति यत्, भवतः oss परियोजना प्रारम्भिकपदे भवतः मूलदृष्टौ सर्वाणि समस्यानि समाधानं न करोति। सुविकसितायाः परियोजनायाः प्रायः बहुविधाः मॉड्यूलरभागाः भविष्यन्ति ये भवन्तं शोधसहकार्यं (अथवा अन्यप्रयत्नाः) आरभुं शक्नुवन्ति तथा च नूतनदलस्य सदस्यान् न केवलं परियोजनां उन्नतयितुं, अपितु परियोजनायाः महत्त्वपूर्णभागानाम् अपि स्वामित्वं कर्तुं शक्नुवन्ति, येन तस्य प्रभावः द्रुततरः वा बृहत्तरः वा भवति परियोजनायां नाटकीयरूपेण सुधारं कुर्वन् तेषां विचारान्। उदाहरणार्थं, dspy इत्यस्य सम्प्रति पृथक् पृथक् दलाः सन्ति ये जस्ट-इन्-टाइम-अनुकूलनम्, प्रोग्रामिंग-अमूर्तीकरणं, सुदृढीकरण-शिक्षणं च इत्यत्र अनुसंधान-विकास-प्रयत्नानाम् नेतृत्वं कुर्वन्ति । colbert इत्यस्य घटकाः यथा बाह्य-अनुप्रयोग-प्रोग्रामिंग-अन्तरफलकाः, अन्तर्निहित-पुनर्प्राप्ति-अन्तर्निर्मितं, कोर-प्रतिरूपणं च मुख्यतया भिन्न-भिन्न-परियोजनासु भिन्न-भिन्न-जनैः चालिताः भवन्ति

आगच्छन्तु, सारांशं कुरुत। मुक्तस्रोतसंशोधनस्य स्वीकरणाय उत्तमं शोधं, उत्तमं मुक्तस्रोतपरिणामं च आवश्यकम् । एतत् संतुलनं कठिनं प्रहारं कर्तुं शक्यते, परन्तु एकदा भवन्तः सम्यक् प्राप्तवन्तः तदा अतीव फलप्रदं भवितुम् अर्हति । व्यक्तिगतरूपेण एतत् ग्रहीतुं, आन्तरिकरूपेण च मम बहुकालः अभवत् । एतत् मम डॉक्टरेट्-परिवेक्षकाणां क्रिस-पोट्स्-मटेइ-जहरिया-योः पुनः पुनः प्रतिक्रियायाः, तथैव हीदर-मिलर-जेरेमी-हावर्ड-योः बहुमूल्यं निवेशस्य च धन्यवादः अभवत्

संशोधनस्य मूल्याङ्कनस्य मानदण्डः पूर्वज्ञानस्य तुलने "वृद्धिः" अस्ति, परन्तु "वृद्धेः" सार्थकरूपेण शोषणं कर्तुं पूर्वं सॉफ्टवेयरः एव प्रभावी भवितुम् अर्हति सॉफ्टवेयरस्य प्रभावी भवितुं तस्य दस्तावेजीकरणं अपि प्रभावी भवितुमर्हति: जनाः यावत् भवन्तः तान् न दर्शयन्ति तावत् यावत् सॉफ्टवेयरस्य उपयोगं कर्तुं कल्पितानि सर्वाणि अधःप्रवाहमार्गाणि न पश्यन्ति। अर्थात् यावत् एतानि कार्याणि स्वतन्त्रसमुदायेन विकसितुं न शक्यन्ते।

तत् सर्वं उक्त्वा अस्मिन् खण्डे सर्वाधिकं महत्त्वपूर्णं कौशलं "प्रकाशनं", वास्तविकरूपेण प्रकाशनं, प्रायः प्रकाशनं, तस्मात् शिक्षितुं च अस्ति ।

नवीन पत्र प्रकाशित करें

स्वस्य परियोजनासु निवेशं निरन्तरं कुर्वन्तु

यदा भवान् पञ्चमं नियमं पठति तदा स्वाभाविकं यत् पृच्छति यत् स्नातकछात्राः मुक्तस्रोतसॉफ्टवेयर् इत्यत्र एतावत् समयं कुत्र यापयन्ति? वास्तविकं संशोधनं कदा कर्तुं शक्यते ?

व्यावहारिकं उत्तरम् अस्ति यत् मुक्तस्रोते व्यतीतः अधिकांशः समयः नूतनं रोमाञ्चकं च संशोधनं कर्तुं उपयोक्तुं शक्यते स्म । तौ यथा दृश्यते तथा पृथक् न स्तः। किमर्थं तत् वदसि ?

प्रथमं, एतादृशस्य मुक्तस्रोतसॉफ्टवेयरकार्यस्य अग्रणीत्वेन भवन्तः अत्यन्तं प्रारम्भे एव नूतनानां समस्यानां सहजतया परिचयं कर्तुं शक्नुवन्ति । अन्यथा अपेक्षया भवन्तः समस्यां सहजतया अवगमिष्यन्ति। तदतिरिक्तं, भवता निर्मितः समुदायः प्रायः भवतः स्वस्य पद्धतिप्रोटोटाइप्स् विषये प्रत्यक्षप्रतिक्रियां ददाति तथा च समस्यायाः महत्त्वं अवगच्छन् प्रतिभाशालिनः सहकारिणां प्रवेशं ददाति भवन्तः उपयोगिनो "वितरणमार्गेषु" अपि प्रवेशं प्राप्नुयुः येन सुनिश्चितं भवति यत् भवन्तः अस्मिन् क्षेत्रे प्रकाशयन्ति प्रत्येकं नूतनं पत्रं भवतः प्रेक्षकाणां मध्ये भवति तथा च भवतः विद्यमानं मञ्चं सुदृढं करोति।

यथा, "colbert" केवलं २०२० तमस्य वर्षस्य आरम्भे एव पत्रं नास्ति । अधुना सम्भवतः दश वा अनुवर्तनसम्बद्धाः पत्राः सन्ति, येषु उन्नतप्रशिक्षणं, न्यूनस्मृतिपदचिह्नं, द्रुततरं पुनर्प्राप्तिसंरचना, उत्तमडोमेन् अनुकूलनक्षमता, अधःप्रवाह-एनएलपी-कार्यैः सह उत्तममेलनं च निवेशः अस्ति तथैव dspy पत्रं न, अपितु प्रोग्रामिंग एब्स्ट्रैक्शन्, हिन्ट् ऑप्टिमाइजेशन, डाउनस्ट्रीम प्रोग्राम् इत्येतयोः विषये पत्रसङ्ग्रहः अस्ति । एतेषु बहवः पत्राणि विविधैः उत्तमलेखकैः लिखितानि सन्ति, तेषां कार्यस्य महत् प्रभावः अभवत्, यस्य भागः मुक्तस्रोतसॉफ्टवेयरचैनलद्वारा बृहत् प्रेक्षकवर्गस्य निर्माणं कृतम्

अतः, एकं उत्तमं मुक्तस्रोतसाधनं मॉड्यूलरकार्यं निर्मातुम् अर्हति येषां अन्वेषणं, स्वामित्वं, नूतनसंशोधकैः योगदातृभिः च विकसितुं शक्यते ।

सन्दर्भ मूल पाठः https://github.com/okhat/blog/blob/main/2024.09.impact.md