समाचारं

“अन्तर्जालस्य सर्वेऽपि उच्चगुणवत्तायुक्ताः पाठदत्तांशाः २०२८ तमवर्षपर्यन्तं उपयुज्यन्ते” इति ।

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

शोधसंस्था Epoch AI इत्यस्य भविष्यवाणी अस्ति यत् अन्तर्जालस्य सर्वेषां उच्चगुणवत्तायुक्तानां पाठदत्तांशस्य उपयोगः २०२८ तमवर्षपर्यन्तं भविष्यति, तथा च यन्त्रशिक्षणदत्तांशसमूहाः २०२६ तमवर्षपर्यन्तं सर्वाणि "उच्चगुणवत्तायुक्तानि भाषादत्तांशं" समाप्तुं शक्नुवन्ति

शोधकर्तारः दर्शयन्ति यत् कृत्रिमबुद्ध्या (AI) उत्पन्नेषु दत्तांशसमूहेषु यन्त्रशिक्षणप्रतिमानानाम् भाविपीढीनां प्रशिक्षणेन "प्रतिरूपपतनः" भवितुम् अर्हति बृहत् एआइ मॉडल् कृते प्रशिक्षणदत्तांशस्य अभावः अस्ति वा इति विषयः अधुना पुनः माध्यमेषु उष्णविषयः अभवत् ।

अधुना एव द इकोनॉमिस्ट् पत्रिकायाः ​​"ए.आइ.-संस्थाः शीघ्रमेव अन्तर्जालस्य अधिकांशं आँकडान् समाप्तं करिष्यन्ति" इति शीर्षकेण लेखः प्रकाशितः, यत्र यथा यथा अन्तर्जालस्य उच्चगुणवत्तायुक्ताः आँकडा: शुष्काः भवन्ति तथा तथा ए.आइ “दत्तांशभित्तिः” । एआइ-बृहत्-माडल-कम्पनीनां कृते अधुना आव्हानं नूतन-दत्तांश-स्रोतान् अथवा स्थायि-विकल्पान् अन्वेष्टुम् अस्ति ।

लेखः शोधसंस्थायाः Epoch AI इत्यस्य भविष्यवाणीं उद्धृतवान् यत् २०२८ तमवर्षपर्यन्तं अन्तर्जालस्य सर्वेषां उच्चगुणवत्तायुक्तानां पाठदत्तांशस्य उपयोगः भविष्यति, तथा च यन्त्रशिक्षणदत्तांशसमूहाः २०२६ तमवर्षपर्यन्तं सर्वाणि "उच्चगुणवत्तायुक्तानि भाषादत्तांशं" समाप्तुं शक्नुवन्ति एषा घटना उद्योगे "दत्तांशभित्तिः" इति प्रसिद्धा अस्ति । "दत्तांशभित्तिः" कथं निबद्धव्या इति अद्यत्वे एआइ-कम्पनीनां सम्मुखे प्रमुखेषु विषयेषु अन्यतमः अस्ति, अपि च एषः विषयः अपि भवितुम् अर्हति यस्य प्रशिक्षणप्रगतिः मन्दं कर्तुं सर्वाधिकं सम्भाव्यते लेखः दर्शयति यत् यथा यथा अन्तर्जालस्य प्रशिक्षणपूर्वदत्तांशः शुष्कः भवति तथा तथा प्रशिक्षणोत्तरं महत्त्वपूर्णं भवति। Scale AI, Surge AI इत्यादीनां लेबलिंग्-कम्पनयः प्रशिक्षणोत्तर-आँकडानां संग्रहणं कृत्वा प्रतिवर्षं कोटि-कोटि-डॉलर्-रूप्यकाणि अर्जयन्ति ।


इकोनॉमिस्ट् पत्रिकायां Epoch AI आरेखस्य उद्धरणं कृतम् अस्ति

वस्तुतः “दत्तांशक्षयम्” इति विषये उद्योगे चिरकालात् स्वराः सन्ति । पत्रे अवलोकितं यत् २०२३ तमस्य वर्षस्य जुलैमासस्य आरम्भे कैलिफोर्नियाविश्वविद्यालयस्य बर्कले-नगरस्य कम्प्यूटरविज्ञानस्य प्राध्यापकः "कृत्रिमबुद्धिः - आधुनिकदृष्टिकोणाः" इत्यस्य लेखकः च स्टुअर्ट रसेल् इत्यनेन चेतावनी दत्ता यत् कृत्रिमबुद्धि-सञ्चालित-रोबोट् यथा ChatGPT इत्यादयः शीघ्रमेव "Exhausting the text in the universe," इति बहुमात्रायां पाठसङ्ग्रहणं कृत्वा रोबोट्-प्रशिक्षणार्थं प्रौद्योगिकी "कठिनतासु धावितुं आरब्धा अस्ति" ।

परन्तु उद्योगे भिन्नाः स्वराः अपि सन्ति । २०२४ तमस्य वर्षस्य मे-मासे ब्लूमबर्ग्-प्रौद्योगिक्याः संवाददातृणा एमिली चाङ्ग-इत्यनेन सह साक्षात्कारे प्रसिद्धा कम्प्यूटर-वैज्ञानिका, स्टैन्फोर्ड-विश्वविद्यालयस्य कृत्रिम-बुद्धि-प्रयोगशालायाः सह-निर्देशिका, स्टैन्फोर्ड-विश्वविद्यालयस्य प्राध्यापिका च ली फेइफेइ इत्यनेन स्पष्टं कृतम् यत् सा "अस्माकं" इत्यनेन सह सहमतः नास्ति “एआइ मॉडल् मध्ये प्रशिक्षणार्थं दत्तांशः समाप्तः भवति” इति अधिकं निराशावादी दृष्टिकोणम् । ली फेइफेइ इत्यस्य मतं यत् एतत् मतम् अतीव संकीर्णम् अस्ति । केवलं भाषाप्रतिमानानाम् दृष्ट्या अद्यापि अधिकानि अनुकूलितप्रतिमाननिर्माणार्थं खननस्य प्रतीक्षमाणानां विभेदितदत्तांशस्य बृहत् परिमाणं वर्तते

अद्यत्वे सीमितप्रशिक्षणदत्तांशस्य समस्यायाः एकं समाधानं कृत्रिमदत्तांशस्य उपयोगः अस्ति, यत् यन्त्रनिर्मितम् अस्ति अतः असीमितम् अस्ति । परन्तु कृत्रिमदत्तांशैः कृत्रिमदत्तांशस्य जोखिमः अपि भवति । आउटपुट्, एषा अवधारणा "model collapse" इति कथ्यते । यतः दूषितदत्तांशस्य विषये आदर्शाः प्रशिक्षिताः भवन्ति, ते अन्ते वास्तविकतायाः दुर्व्याख्यां कुर्वन्ति ।

शोधदलेन अध्ययने दर्शितं यत् बृहत्भाषाप्रतिरूपशिक्षणकार्य्ये अन्तर्निहितवितरणस्य पुच्छं महत्त्वपूर्णं भवति यत् अन्तर्जालस्य सामग्रीं प्रकाशयितुं बृहत्भाषाप्रतिमानानाम् बृहत्परिमाणेन उपयोगः तेषां उत्तराधिकारिणां प्रशिक्षणार्थं आँकडासंग्रहणप्रयासान् दूषयिष्यति। भविष्ये मनुष्याः बृहत्भाषाप्रतिरूपपरस्परक्रियासु वास्तविकदत्तांशः अधिकाधिकं मूल्यवान् भविष्यति। परन्तु एआइ-जनितदत्तांशः सर्वथा अवांछनीयः नास्ति, परन्तु दत्तांशः कठोररूपेण छाननीयः इति अपि शोधदलेन उक्तम् । उदाहरणार्थं, प्रत्येकस्य पीढीप्रतिरूपस्य प्रशिक्षणदत्तांशेषु, मूलदत्तांशस्य १०% वा २०% वा स्थापयन्तु, भवान् विविधदत्तांशस्य उपयोगं अपि कर्तुं शक्नोति, यथा मनुष्यैः उत्पन्नदत्तांशः, अथवा अधिकदृढप्रशिक्षण-अल्गोरिदम् अध्ययनं कर्तुं शक्नोति