2024-08-16
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
शङ्घाई जिओ टोङ्ग विश्वविद्यालये वाङ्ग डेक्वान् इत्यस्य शोधसमूहेन योगदानम्
Qubits |.सार्वजनिक खाता QbitAI
शाङ्घाई जियाओ टोङ्ग विश्वविद्यालये प्रोफेसर वाङ्ग डेक्वान् इत्यस्य शोधसमूहेन नवीनतमसंशोधने एतादृशः प्रश्नः उत्थापितः।
एतत् परिदृश्यं कल्पयतु : बालवाड़ीयां एकः बालकः व्याघ्रस्य चित्रं गृहीत्वा भवन्तं पृच्छति यत् "एषः बिल्लीपुत्रः अतीव प्रियः अस्ति। किं भवन्तः बिडालस्य मादा अस्ति?"
भवन्तः प्रत्यक्षतया "आम्" "न" इति उत्तरं न दातुं शक्नुवन्ति, परन्तु प्रथमं अस्मिन् प्रश्ने "विरोधं" दर्शयन्तु——इदं चित्रं व्याघ्रस्य, न तु बिडालस्य。
परन्तु बृहत् आदर्शाः कथं प्रतिक्रियां दास्यन्ति इति विषये पूर्वं व्यवस्थितं संशोधनं अल्पं कृतम् अस्ति ।
भवद्भिः अवश्यं ज्ञातव्यं यत् "निर्देशविग्रहान्" ज्ञातुं न शक्नोति इति एआइ-प्रतिरूपं "उत्तराणि न भवितुमर्हन्ति" इति प्रश्नानां परिणामान् जनयिष्यति, तथा च उत्पन्नपरिणामाः द्वन्द्वस्य कस्मिन् अपि पक्षे पक्षपातपूर्णाः न भवेयुः, तत् सम्भाव्यविपदानि जनयिष्यति, एआइ प्रभावितं च करिष्यति security and Superalignment (Super Alignment) इति ।
अस्मिन् नवीनतमे अध्ययने दलेन प्रस्तावः कृतःबहुविध मानदण्ड——विरोधाभासः निर्देशः समुच्चयः, तथा एकं अभिनवं डिजाइनं कृतवान्स्वचालितदत्तांशसमूहनिर्माणरूपरेखा, नामस्वतः रचयतु。
दलेन ज्ञातं यत् बहुविध-बृहत्-प्रतिरूपस्य विरोधाभास-उपयोक्तृ-निर्देशानां पत्ताङ्गीकरणे अतीव अभावः अस्ति, अतः ते प्रस्तावम् अकुर्वन्संज्ञानात्मक उत्तेजना प्रेरक विधि(CAP), यत् बाह्यजगत् संज्ञानात्मकक्षमतां प्रविशति तस्मात् विरोधाभासानां अन्वेषणक्षमतायां सुधारः भवति ।
अस्मिन् वर्षे अक्टोबर्मासे कम्प्यूटरदृष्टिविषये १८ तमे यूरोपीयसम्मेलने (ECCV) एतत् पत्रं प्रकाशितं भविष्यति।
वर्तमान समये बहुविधबृहत्प्रतिमानैः वैज्ञानिकसंशोधनक्षेत्रेषु अनुप्रयोगक्षेत्रेषु च महती प्रगतिः अभवत् । ते पाठं चित्रं च सहितं विविधदत्तांशप्रकारं संसाधितुं शक्नुवन्ति, मानवसंज्ञानसदृशानि क्षमतानि दर्शयन्ति ।
दलस्य मतं यत् एतेषां आदर्शानां सफलता विस्तृतस्य अनुसन्धानविकासकार्यस्य कारणेन अस्ति यत् तेषां मानवनिर्देशानां निकटतया अनुसरणं कर्तुं शक्नोति, किञ्चित् "वशीभूतः" अपि
तदतिरिक्तं दीर्घसन्दर्भेषु एते आदर्शाः विशेषतया उत्तमाः सन्ति । क्लाउड् ३, जेमिनी १.५ प्रो इत्यादीनां बहुविधा बृहत् मॉडल् इत्यनेन शक्तिशालिनः क्षमताः प्रदर्शिताः सन्ति । क्लाउड् ३ श्रृङ्खला मॉडल् २००K टोकनस्य सन्दर्भविण्डो प्रदाति, जेमिनी १.५ प्रो इत्यस्य मानकसन्दर्भविण्डो आकारः १२८K अस्ति, निजीपूर्वावलोकनचरणस्य समये १M टोकनपर्यन्तं अपि प्राप्तुं शक्नोति
एताः उन्नतयः बहुविध-बृहत्-प्रतिमानाः जटिल-कार्य-नियन्त्रणे उत्तमं प्रदर्शनं कर्तुं, दीर्घकालीन-अन्तर्क्रियाणां कृते मनुष्याणां आवश्यकतानां पूर्तये च सक्षमाः भवन्ति ।
परन्तु बहुविधपरस्परक्रियायाः गभीरतायाः सन्दर्भदीर्घतायाः वृद्ध्या च विरोधाभासयुक्तानां उपयोक्तृनिर्देशानां समस्या अधिकाधिकं प्रमुखा भवति
यथा अधः दर्शितं, यदा उपयोक्तारः (यथा बालकाः वा भाषायाः आरम्भकाः) एतानि आदर्शानि उपयुञ्जते तदा ते प्रायः सम्भाव्यबहुविधविग्रहेभ्यः अनभिज्ञाः भवन्ति ।
तस्मिन् एव काले यथा यथा संवादपरिवर्तनस्य संख्या वर्धते, सन्दर्भविण्डो च विस्तारं प्राप्नोति तथा तथा उपयोक्तृभ्यः सर्वविवरणानि स्मर्तुं कठिनं भवति, येन निर्देशानां मध्ये विग्रहाः भवन्ति
अपि च यथा यथा मोडालिटीनां संख्या वर्धते तथा तथा मोडालिटीमध्ये विग्रहाः अपि भवितुम् अर्हन्ति । एकदा एतेषु आदर्शेषु आत्म-जागरूकतायाः, विरोधाभास-विवेचन-क्षमतायाः च अभावः भवति तदा तेषां कार्यप्रदर्शनं दुःखं प्राप्नोति ।
एतासां आव्हानानां निवारणाय अस्य लेखस्य शोधदलेन बहुविधं बेन्चमार्कपरीक्षां प्रस्तावितं - "विरोधाभासः निर्देशः समुच्चयः” (Self-Contradictory Instructions, SCI), बहुविधबृहत्प्रतिमानानाम् परस्परविरोधिनां निर्देशानां पत्ताङ्गीकरणस्य क्षमतायाः मूल्याङ्कनार्थं प्रयुक्तम् ।
SCI समाविष्टम् अस्ति२०,००० परस्परविरोधिनः निर्देशाःतथा८ कार्याणि, सम वितरित inभाषा - भाषातथादृग्-वाचिकद्वयोः प्रतिमानयोः ।
चित्रस्य उपरिभागे भाषा-भाषिकप्रतिमानस्य सन्दर्भाणां निर्देशानां च मध्ये विग्रहाः सन्ति, यथा डिजाइनस्य परस्परविरोधिनः नियमाः, परस्परविरोधिनः वस्तुगुणाः, अनन्यनिर्देशाः, निषिद्धशब्दकोशाः च
आकृतेः अधः भागे : दृश्य-भाषिकप्रतिमानेन बहुविध-विग्रहाः, यथा ओसीआर-पाठ-परिचय-विग्रहाः, आरेख-विग्रहाः, ज्यामितीय-विग्रहाः, शब्दार्थ-विग्रहाः च आच्छादिताः सन्ति अष्टसु कार्येषु केवलं शब्दार्थविग्रहेषु अन्यदत्तांशसमूहाः (ImageNet) सम्मिलिताः भवन्ति ।
विशिष्टं उदाहरणं दातुं शब्दार्थविग्रहाणां निर्माणकाले शोधकर्तारः प्रथमं चित्राधारितं तत्सम्बद्धं पाठं जनयिष्यन्ति, ततः पाठे मुख्यशब्दार्थसूचनाः नूतनानां शब्दार्थविज्ञानेन प्रतिस्थापयिष्यन्ति ये समानाः परन्तु भिन्नाः सन्ति
अधोलिखिते चित्रे एकः शुतुरमुर्गः (शुतुरमुर्गः) अस्ति लेखकः "किं चित्रे शुतुरमुर्गस्य आकारः चित्रितः अस्ति?"
तदनन्तरं अस्य प्रश्नपाठस्य "शुतुरमुर्गः" इति मुख्यशब्दार्थस्य स्थाने "किवी" इति शब्दः स्थापितः । एवं बहुविधनिर्देशयुगलं विरोधाभासयुक्तं निर्मीयते ।
सम्पूर्णे SCI निर्माणप्रक्रियायां लेखकेन एकं अभिनवं स्वचालितं स्वचालितदत्तांशसमूहनिर्माणरूपरेखां डिजाइनं कृतम्——स्वतः रचयतु。
एतत् कार्यक्रमानां, बृहत्भाषाप्रतिमानानाम् माध्यमेन बहुविधपाशं निर्माति । स्वचालितदत्तांशसमूहनिर्माणं सक्षमं कर्तुं रूपरेखा कार्यक्रमानां बृहत्भाषाप्रतिमानानाञ्च लाभं लभते ।
AutoCreate इत्येतत् अनेककार्यसम्बद्धैः बीजदत्तांशैः आरभते तथा च बीजसमूहं निर्वाहयति । प्रत्येकं चक्रस्य अन्तः AutoCreate इत्यत्र द्वौ शाखाः समाविष्टौ स्तः :भाषा शाखा(वाम) चदृश्यशाखा(दक्षिणः)। प्रत्येकं शाखा जनरेटर्, अलङ्कारकर्तारः च भवन्ति ।
अन्ते स्वच्छकः मापदण्डं न पूरयति इति दत्तांशं बहिष्कृतं करिष्यति । मानवविशेषज्ञैः गुणवत्तापरीक्षां उत्तीर्णं कृत्वा एतत् दत्तांशं अग्रिमपरिक्रमाय बीजकुण्डे पुनः प्रविशति ।
AutoCreate SCI आँकडासमूहानां निर्माणवेगं सामग्रीविस्तारं च बहुधा सुधारयति ।
एससीआई-दत्तांशसमूहस्य उपयोगेन शोधकर्तारः विरोधाभासपूर्णनिर्देशानां निबन्धने बृहत्प्रतिमानानाम् कार्यप्रदर्शनस्य व्यापकरूपेण मूल्याङ्कनं कृतवन्तः ।
प्रयोगपरिणामाः दर्शयन्ति यत् वर्तमानबृहत्प्रतिमानाः प्रायः विरोधाभासयुक्तनिर्देशानां सम्मुखे कतिपयानि न्यूनानि दर्शयन्ति ।
ते सूचनां ज्ञानं च संसाधितुं शक्नुवन्ति, परन्तु...निर्देशानां युक्तियुक्ततायाः मूल्याङ्कनक्षमतायाः अभावः, यत् शोधदलः "संज्ञानात्मक" क्षमता इति कथयति ।
एषः अभावः आत्मजागरूकतायाः अभावात्, निर्देशेषु असङ्गतिं ज्ञातुं असमर्थतायाः च कारणेन उद्भवति ।
अतः शोधकर्तृभिः "संज्ञानात्मक जागरण युक्तियाँ”(संज्ञानात्मक जागरण प्रेरणा, CAP)。
इनपुट् मध्ये CAP पाससरलं स्मारकं योजयन्तु, संज्ञानात्मकक्षमताः बाह्यजगत् प्रविष्टुं शक्यन्ते, तस्मात् बृहत्प्रतिरूपस्य विरोधाभासपरिचयक्षमतायां सुधारः भवति, मूलतः नकारात्मकः प्रभावः न भविष्यति
एतत् निष्कर्षं सूचयति यत् वर्तमानबहुविधबृहत्प्रतिमानानाम् जटिलनिर्देशविग्रहान् उत्तमरीत्या नियन्त्रयितुं अधिका आत्मजागरूकतायाः संज्ञानात्मकक्षमतायाश्च आवश्यकता भवति।
अधिकविवरणार्थं इच्छुकाः बालकाः मूलपत्रं द्रष्टुं शक्नुवन्ति।
पत्रस्य प्रथमः लेखकः शङ्घाई जिओ टोङ्ग विश्वविद्यालये डॉक्टरेट् पदस्य अभ्यर्थी अस्तिगाओ जिन。
तस्य शोधकार्यं सङ्गणकदृष्टिः, बहुविधाः बृहत्प्रतिमानाः, कृत्रिमबुद्ध्या सशक्ताः जीवनविज्ञानम् इत्यादयः सन्ति ।
पत्रस्य तत्सम्बद्धः लेखकः शङ्घाई जिओ टोङ्ग विश्वविद्यालये कार्यकालीनः सहायकप्रोफेसरः डॉक्टरेट् पर्यवेक्षकः च अस्तिवाङ्ग डेक्वान्, सः फुडान् विश्वविद्यालयात् स्नातकपदवीं प्राप्तवान्, बर्कले-नगरस्य कैलिफोर्निया-विश्वविद्यालयात् च पीएच.डी.
तस्य शोधकार्यं CVPR, ICCV, ECCV, ICLR, ICML, ICRA, IROS इत्यादिषु शीर्षस्थेषु अन्तर्राष्ट्रीयसम्मेलनेषु प्रकाशितम् अस्ति।विगतपञ्चवर्षेषु Google Scholar इत्यत्र तस्य पत्राणां उद्धरणं 10,000 अधिकवारं प्राप्तम् अस्ति, यत्र H- सूचकाङ्कः २०.
पेपर लिङ्कः https://arxiv.org/abs/2408.01091
परियोजनालिङ्कः https://selfcontradiction.github.io/