निजीदत्तांशस्य दुरुपयोगं कर्तुं विपरीतशिक्षणम्! चीनी विज्ञान अकादमी इत्यादिभिः "Multi-step Error Minimization" इति पद्धतिः प्रकाशिता |

2024-08-01

नवीन बुद्धि प्रतिवेदन

सम्पादकः एलआरएसटी इत्येव निद्रालुः

[नव प्रज्ञायाः परिचयः] । शोधकर्तारः बहुविधविपरीतशिक्षणप्रतिमानेन व्यक्तिगतदत्तांशस्य दुरुपयोगात् रक्षितुं बहुविधा अशिक्षणनमूनानां जननार्थं नवीनबहुचरणीयदोषनिमनीकरण (MEM) पद्धतिं प्रस्तावन्ति। इमेज् शोरस्य पाठस्य च ट्रिगरस्य अनुकूलनं कृत्वा MEM पद्धतिः प्रभावीरूपेण मॉडलं भ्रामयति, निजीदत्तांशेषु तस्य शिक्षणक्षमतां न्यूनीकरोति, तथा च विभिन्नमाडलयोः मध्ये सशक्तं स्थानान्तरणं प्रदर्शयति

बहुविधविपरीतशिक्षणेन (यथा CLIP) अन्तर्जालतः स्क्रैप् कृतानां कोटिकोटिप्रतिबिम्ब-कैप्शनयुग्मानां शिक्षणेन शून्य-शॉट्-वर्गीकरणे महती प्रगतिः प्राप्ता अस्ति

परन्तु एतत् निर्भरता गोपनीयताजोखिमान् जनयति, यतः हैकर्-जनाः प्राधिकरणं विना मॉडल-प्रशिक्षणार्थं चित्र-पाठ-दत्तांशस्य शोषणं कर्तुं शक्नुवन्ति, यस्मिन् व्यक्तिगत-गोपनीयता-संवेदनशील-सूचनाः समाविष्टाः भवितुम् अर्हन्ति

अद्यतनकार्यं प्रस्तावयति यत् प्रशिक्षणप्रतिबिम्बेषु अगोचरविक्षोभान् योजयित्वा अशिक्षितानि उदाहरणानि जनयित्वा रक्षणसहिताः शॉर्टकट् स्थापयितुं शक्यन्ते।

परन्तु एताः पद्धतयः एकविधवर्गीकरणकार्यस्य कृते विनिर्मिताः सन्ति तथा च बहुविधविपरीतशिक्षणे अल्पानुसन्धानाः एव तिष्ठन्ति । अयं पत्रः प्रथमं इमेज-कैप्शन-युग्मेषु विद्यमान-विधिनाम् कार्यप्रदर्शनस्य मूल्याङ्कनं कृत्वा अस्य सन्दर्भस्य अन्वेषणं करोति, यत्र पूर्व-विधयः अस्मिन् परिदृश्ये लेबल्-अभावात् बहु-मोडल-दत्तांशं प्रति प्रभावीरूपेण सामान्यीकरणं कर्तुं न शक्नुवन्ति, तथा च शॉर्टकट्-स्थापने सीमित-प्रभावशीलता भवति

अस्मिन् पत्रे वयं बहु-चरणीय-दोष-न्यूनतमीकरणं (MEM) प्रस्तावयामः, यत् बहु-विधा-अशिक्षणीय-नमूनानां जननार्थं नवीन-अनुकूलन-प्रक्रिया अस्ति । इदं चित्रशब्दस्य अतिरिक्तपाठ-उद्दीपकस्य च अनुकूलनार्थं त्रुटि-निमनीकरण-रूपरेखां विस्तारयति, तस्मात् अनुकूलन-स्थानं वर्धयति तथा च शोर-विशेषतानां पाठ-उद्दीपकानां च मध्ये शॉर्टकट्-शिक्षणार्थं मॉडलं प्रभावीरूपेण भ्रामयति

पेपर लिङ्कः https://arxiv.org/abs/2407.16307

कोडलिङ्कः https://github.com/thinwayliu/बहुविध-अशिक्षणीय-उदाहरणानि

विशेषतः, शोर न्यूनीकरणसमस्यायाः समाधानार्थं प्रक्षेपितं ढाल-अवरोहणं स्वीक्रियते, तथा च इष्टतमपाठ-उद्दीपकं अन्वेष्टुं ढालस्य अनुमानं कर्तुं शब्दानां प्रतिस्थापनार्थं च HotFlip पद्धतेः उपयोगः भवति

बहूनां प्रयोगैः पद्धतेः प्रभावशीलता सिद्धा अस्ति, रक्षणानन्तरं पुनः प्राप्तिपरिणामाः यादृच्छिक-अनुमानस्य प्रायः अर्धाः सन्ति, तथा च भिन्न-भिन्न-प्रतिमानयोः मध्ये अत्यन्तं स्थानान्तरणीयः भवति अस्य कार्यस्य कागदं, कोडः च मुक्तस्रोतः अस्ति ।

शोध पृष्ठभूमि

अन्तिमेषु वर्षेषु बहुविधशिक्षणस्य उदयेन सह शोधकर्तारः पाठः, चित्राणि, श्रव्यं च इत्यादीनां बहुविधदत्तांशप्रकारानाम् संयोजनं कुर्वन्ति इति प्रतिरूपेषु तीव्ररुचिं प्राप्तवन्तः

तेषु बहुविधविपरीतशिक्षणम् अस्मिन् क्षेत्रे महत्त्वपूर्णा पद्धतिः अभवत् वर्गीकरणं, जननम् इत्यादिषु कार्येषु क्षमता।

परन्तु एतेषां प्रतिरूपानाम् प्रशिक्षणं बहुविधदत्तांशस्य बृहत् परिमाणे निर्भरं भवति, यत् प्रायः CC12M, YFCC100M तथा LAION5B इत्यादिभ्यः सार्वजनिकरूपेण उपलब्धदत्तांशसमूहेभ्यः आगच्छति, परन्तु एते आँकडासमूहाः अद्यापि अपर्याप्ताः भवितुम् अर्हन्ति तथा च संवेदनशीलव्यक्तिगतसूचनाः बृहत् परिमाणेन भवितुं शक्नुवन्ति, triggering गोपनीयताभङ्गस्य विषये चिन्ता।

वयं एकं परिदृश्यं विचारयामः यत् बहुविधविपरीतशिक्षणेन सह सम्बद्धानां गोपनीयताजोखिमानां निवारणाय बहुविधा अशिक्षणीयनमूनानां जनने केन्द्रीक्रियते। अस्मिन् परिदृश्ये वयं प्रतिनिधिबहुविधदत्तांशसमूहरूपेण चित्र-पाठयुग्मेषु ध्यानं दद्मः । कल्प्यते यत् उपयोक्तारः प्रायः फेसबुक् इत्यादिषु सामाजिकमाध्यममञ्चेषु पाठेन सह व्यक्तिगतचित्रं साझां कुर्वन्ति, यत्र मुखं, नाम, दूरभाषसङ्ख्या, पता च इत्यादीनि काश्चन निजीपरिचयसूचनाः सन्ति

सम्प्रति हैकर्-जनाः अन्तर्जालतः एतादृशानां चित्र-पाठ-युग्मानां बहूनां संख्यां संग्रहीतुं बहुविध-विपरीत-शिक्षण-प्रविधिनाम् उपयोगेन बृहत्-माडल-प्रशिक्षणं वा सूक्ष्म-समायोजनं वा कर्तुं प्रयतन्ते, यथा चित्रस्य १ वाम-अर्धे दर्शितम् अस्ति

एते मॉडल् अप्रमादेन उपयोक्तृणां निजसूचनाः, मुखस्य विशेषताः च गृह्णन्ति, येन सम्भाव्यगोपनीयता-लीकः भवति । रक्षकाणां उद्देश्यं बहुविधदत्तांशयोः उपरि अशिक्षणीयपद्धतीनां कार्यान्वयनेन एतेषां संवेदनशीलदत्तांशस्य अनधिकृतशोषणात् निवारणं भवति । एताः पद्धतयः एतादृशेषु बहुविध-अशिक्षणनमूनेषु प्रशिक्षितस्य प्रतिरूपस्य कृते उपयोक्तुः निज-विशेषताः दुर्गमाः भवन्ति, यदा तु चित्राणि पाठाः च पोस्ट् कृत्वा उपयोक्तुः सामाजिक-अन्तर्क्रियायां बाधां न कुर्वन्ति, यथा चित्रस्य १ दक्षिणार्धे दर्शितम् अस्ति

चित्रम् १: फेसबुक्-मध्ये पोस्ट्-पत्राणि अनवधानेन व्यक्तिगत-सूचनाः प्रकाशयितुं शक्नुवन्ति (वामभागे), परन्तु अनधिकृत-माडल-निजी-विशेषतासु प्रवेशं निवारयितुं बहुविध-अशिक्षणीय-नमूनानां उपयोगेन आँकडानां रक्षणं कर्तुं शक्यते (दक्षिणे)

प्रयुक्ति

अद्यतनसंशोधनं अशिक्षितानां उदाहरणानां माध्यमेन चित्रवर्गीकरणे दत्तांशस्य अनधिकृतप्रयोगस्य निवारणे केन्द्रितम् अस्ति । एताः पद्धतयः दत्तांशस्य सूक्ष्मक्षोभं प्रयोजयित्वा प्रतिरूपं प्रतिबिम्बविशेषतां ज्ञातुं बाधन्ते, यत् उपलब्धता आक्रमणम् अथवा अविवेकी विषप्रहारः इति अपि ज्ञायते

इदं मुख्यतया एजेण्ट्-रहित-माडल-आक्रमणेषु एजेण्ट्-आधारित-माडल-आक्रमणेषु च विभक्तम् अस्ति, यत्र एजेण्ट्-रहित-माडल-आक्रमणानि पिक्सेल-स्तरस्य कोलाहलं जनयन्ति, एजेण्ट्-आधारित-माडल-आक्रमणानि एजेण्ट्-प्रतिरूपस्य माध्यमेन विशेषता-स्तरस्य कोलाहलं जनयन्ति

परन्तु वर्गीकरणार्थं सर्वाणि एजेण्ट्-रहित-प्रतिरूप-विधयः बहुविध-परिदृश्येषु चित्र-कोलाहलं जनयितुं असफलाः भवन्ति यतोहि एतेषां पद्धतीनां उद्देश्यं विशिष्ट-वर्गेण सह सम्बद्धानां चित्राणां कृते विशिष्ट-शब्द-प्रतिमानानाम् एकां श्रृङ्खलां अन्वेष्टुं भवति, यदा तु चित्र-पाठ-युग्मानि There are no labels in दत्तांशः ।

अतः केवलं एजेण्ट् मॉडल-आधारित-विधयः एव प्रयोक्तुं शक्यन्ते, तथा च वयं अ-शिक्षणीय-बहु-मोडल-उदाहरणानि (EM तथा UAP) जनयितुं द्वौ विशिष्टौ पद्धतौ विस्तारयामः ।

Error-minimizing Noise (EM) पद्धतिः : १.

अलक्षित प्रतिद्वन्द्वी क्षोभ।(UAP) विधि:

यद्यपि EM तथा UAP इत्येतत् इमेज-उपशीर्षकयुग्मेषु प्रयोक्तुं शक्यते तथापि ते कुशलं रक्षणं प्राप्तुं असफलाः भवन्ति, विशेषतः UAP । वयं एतेषां पद्धतीनां प्रभावशीलतायां प्रतिबिम्बवर्गीकरणात् बहुविधविपरीतशिक्षणपर्यन्तं किमर्थं न्यूनतां गच्छन्ति इति कारणानि अन्वेषयामः।

चित्रवर्गीकरणे ईएम तथा यूएपी समानलेबलयुक्तानि चित्राणि विशेषतास्थाने अभिसरणार्थं अनुकूलयन्ति, येन मॉडलः एतान् अतिरिक्तशब्दान् सहजतया गृह्णाति, लेबलेन सह सहसंबन्धं च ज्ञातुं शक्नोति, यथा चित्रे २(क) दर्शितम् अस्ति

चित्र 2: पारम्परिकवर्गीकरणे बहुविधविपरीतशिक्षणे च विभिन्नपद्धतीनां तुलना। प्रतिबिम्बं प्रतिनिधियति, युग्मितशीर्षकं च भवति ।नीलक्षेत्रं अशिक्षणीयनमूनानां विषये प्रशिक्षितस्य प्रतिरूपस्य अपेक्षितनिर्णयसीमा अस्ति

परन्तु बहुविधविपरीतशिक्षणे ईएम तथा यूएपी पद्धतीनां प्रभावीरूपेण प्रयोगाय अनुकूलितप्रतिबिम्बकोलाहलस्य दिशा पाठस्य विशेषताभिः सह सम्बद्धा भवितुमर्हति, येन चित्रविशेषताः एतेषां विशेषतानां समीपे वा दूरं वा भवन्ति .

परन्तु चित्र–पाठदत्तांशसमूहेषु पाठविशेषतानां भिन्नाः युग्माः व्यापकरूपेण प्रकीर्णाः भवितुम् अर्हन्ति । यथा चित्रे २(ख) (ग) च दर्शितं, वर्गीकरणस्य विपरीतम्, ईएम तथा यूएपी द्वारा उत्पन्नस्य उपशीर्षकस्य शोरस्य च सहसंबन्धं गृहीतुं मॉडलस्य कृते अधिकं कठिनम् अस्ति

चित्रे २(ग) यूएपी इत्यस्य शिक्षणनिर्णयस्थानं अधिकं जटिलं भवति, अतः तस्य रक्षणप्रभावः उत्तमः नास्ति ।

प्रक्रिया

चित्र 3: बहुचरणीयदोषनिक्षेपणपद्धतेः (MEM) रूपरेखा

प्रतिबिम्ब-पाठयुग्मानां प्रसारस्य कारणात् प्रॉक्सी-प्रतिरूप-आधारित-विधयः अद्यापि प्रभावी-रक्षणं प्राप्तुं न शक्नुवन्ति । एकः सहजज्ञानयुक्तः वर्धनरणनीतिः अस्ति यत् बृहत्तरं अनुकूलनस्थानं प्राप्तुं चित्राणि पाठं च एकत्रैव अनुकूलितं कर्तुं तथा च विशेषतास्थाने विभिन्नयुग्मेषु तेषां अभिसरणं प्रवर्तयितुं शक्यते

अतः चित्रस्य पाठसमूहस्य च अनुकूलितविशेषताप्रतिपादनानि समानवितरणं प्रदर्शयन्ति, येन प्रतिरूपं तेषां शॉर्टकट् ज्ञातुं सुविधा भवति, यथा चित्रे 2(d) दर्शितम् अस्ति

अस्य कृते वयं EM-पद्धतिं मूलभूतरूपरेखारूपेण गृह्णामः तथा च पाठकार्ययोः प्रतिद्वन्द्वी-आक्रमणानां सेटिंग्-अनुसरणं कृत्वा, विपरीत-हानिः न्यूनीकर्तुं उपशीर्षकाणां पूर्वं अतिरिक्त-लघुपाठ-उद्दीपकाः योजयितुं प्रस्तावयामः अस्माकं पद्धतिः EM इत्यस्य बहुचरणीयप्रक्रियायाः सदृशं त्रिस्तरीयं पुनरावर्तनीयं अनुकूलनसमस्यारूपेण अवधारणां कर्तुं शक्यते ।

विशेषतया, वयं अनुकूलितप्रतिबिम्बस्य I + δ तथा अनुकूलितपाठस्य T ⊕ t मध्ये विपरीतहानिम् न्यूनीकर्तुं शोर δ तथा पाठ ट्रिगर t क्रमेण अनुकूलितं कुर्मः, यत्र ⊕ एकं ट्रिगरं प्रतिनिधियति यत् स्वच्छपाठं T भिन्नस्थानेषु सम्मिलितुं शक्नोति

सरलतायै अस्मिन् लेखे वयं पाठस्य आरम्भे पाठ-उद्दीपकं योजयितुं चिनोमः । अतः अस्माकं बहुचरणीयदोषनिक्षेपण (MEM) पद्धतिः एतादृशी सूत्रयितुं शक्यते यत् :

उपर्युक्तसमस्याः EM मध्ये पद्धतीनां सन्दर्भेण पुनरावर्तनीयरूपेण अनुकूलिताः भवन्ति । समीकरणे शोर न्यूनीकरणसमस्यायाः समाधानार्थं प्रक्षेपित-ढाल-अवरोहण (PGD) इत्यस्य उपयोगः भवति ।

उल्लेखनीयं यत्, स्वच्छ उपशीर्षकेषु कोलाहलस्य अतिफिटिंग् न्यूनीकर्तुं वयं स्वच्छ उपशीर्षकान् बैच्स् मध्ये स्क्रैम्ब्ल् कृत्वा सम्यक् मेलितं पाठ-उद्दीपकं योजयित्वा तान् वर्धयामः अतः शब्दार्थरूपेण अशुद्धउपशीर्षकाणां सम्मुखे अयं जनितः कोलाहलः आंशिकउपशीर्षकाणां अपेक्षया पाठ्य-उद्दीपकानां विषये अधिकं ध्यानं दातुं शक्नोति । अतः निम्नलिखित पुनरावर्तनीयसूत्रानुसारं इष्टतमं δ प्राप्तुं शक्नुमः ।

पाठ-उत्प्रेरक-निम्नीकरण-समस्यायाः कृते प्रथमं सर्वेषां निवेशानां पुरतः "the" अथवा "a" इति शब्दं पुनरावृत्त्य ट्रिगर-क्रमस्य आरम्भः भवति ।

तदतिरिक्तं, पाठ-उद्दीपकं HotFlip इत्यस्य आधारेण अनुकूलितं भवति तथा च चिह्नस्य प्रतिस्थापनस्य प्रभावः ढालेन अनुमानितः भवति । वर्तमान टोकन एम्बेडिंग् परितः CLIP हानिः प्रथमक्रमस्य Taylor अनुमानं न्यूनीकर्तुं प्रत्येकस्य ट्रिगरिंग् टोकनस्य एम्बेडिंग् अद्यतनं कृत्वा:

अन्ते वयं अभ्यर्थी टैग्स् इत्यस्य समुच्चये प्रत्येकं इष्टतमं पाठं ट्रिगरं अन्वेष्टुं beam search इत्यस्य उपयोगं कर्तुं शक्नुमः । वयं उपर्युक्तसमीकरणात् शीर्ष k अभ्यर्थिनः विचारयामः तथा च फ्लिप्-फ्लॉपस्य प्रत्येकस्मिन् स्थाने अग्रे पृष्ठतः अन्वेषणं कुर्मः तथा च वर्तमान बैचस्य हानिम् उपयुज्य प्रत्येकं बण्डल् स्कोरं कुर्मः।

वयं Wallace et al. चित्रे ३ बहुविध-अशिक्षणीय-नमूनानां निर्माणार्थं अस्माकं MEM-इत्यस्य उपयोगस्य रूपरेखां द्रष्टुं शक्नुमः ।

प्रयोगात्मकः प्रभावः

प्रभावी रक्षणम्

सारणी 1: विभिन्नदत्तांशसमूहेषु अनेकविधिभिः उत्पन्नस्य अशिक्षणीयनमूनानां प्रभावशीलतायाः तुलना

सारणी १ भिन्नदत्तांशसमूहेषु तेषां पुनर्प्राप्तिपरिणामान् दर्शयति । स्पष्टतया, यूएपी बहुविधदत्तांशस्य कृते प्रायः कोऽपि रक्षणं न ददाति, यदा तु ईएम किञ्चित् स्तरं रक्षणं प्रदर्शयति ।

तथापि अस्माकं MEM बहुविधदत्तांशस्य कृते सर्वदा दृढं रक्षणं प्रदाति, येन पुनर्प्राप्तिप्रदर्शनं यादृच्छिकअनुमानस्य प्रायः आर्धं यावत् न्यूनीकरोति । विशेषतः MEM-5 इत्यनेन दीर्घतरपाठ-उद्दीपकस्य कारणेन MEM-3 इत्यस्मात् अपेक्षया हैकर-माडल-प्रदर्शनस्य न्यूनीकरणे अधिकः प्रभावः प्राप्तः ।

चित्र 4 स्वच्छपरीक्षासमूहे विभिन्नपद्धतिभिः उत्पन्नस्य अशिक्षणीयनमूनानां प्रशिक्षणार्थं प्रशिक्षणहानिक्षयवक्राणि दर्शयति तथा च स्वच्छपरीक्षणसमूहे पुनः प्राप्तिमेडर्। (क) तः अवलोकयितुं शक्यते यत् यद्यपि ईएम सामान्यप्रशिक्षणात् शीघ्रं हानिपातं करोति तथापि अस्माकं पद्धतीनां MEM-3 तथा MEM-5 प्रथमयुगे लघुहानिः भवति, यत् दर्शयति यत् मॉडलः शीघ्रं शॉर्टकट् ज्ञातुं शक्नोति

(ख) तः वयं पश्यामः यत् सर्वेषां मॉडलानां मेडरः यादृच्छिकरूपेण अनुमानं करणसमये अपेक्षया न्यूनः भवति, परन्तु अशिक्षितनमूनानां विषये प्रशिक्षितः मॉडलः शीघ्रतमं शिक्षणं स्थगयति, दुष्टतमं पुनर्प्राप्तिपरिणामं प्राप्नोति, तथा च युगस्य वर्धनेन अधिकं न वर्धते। उपर्युक्तानि अवलोकनानि सारणी 1 मध्ये प्राप्तैः परिणामैः सह सङ्गतानि सन्ति ।

चित्र 4: प्रशिक्षणहानिस्य वक्रपरिवर्तनस्य अभिलेखाः परीक्षणसूचकाः च Medr

क्रॉस-मॉडल पोर्टेबिलिटी

सारणी 2: भिन्न-भिन्न-माडल-वास्तुकलासु ResNet50-प्रतिरूपस्य आधारेण MEM-3-पद्धत्या उत्पन्नस्य गैर-शिक्षणीय-नमूनानां स्थानान्तरण-क्षमता

वयं कल्पयामः यत् दत्तांशसंरक्षणं पूर्णतया कृष्ण-पेटी-व्यवस्थापनम् अस्ति, यत्र रक्षकः हैकर-प्रतिरूपस्य वास्तुकला-विषये अनभिज्ञः अस्ति । अतः वयं ResNet50 प्रॉक्सी मॉडल् इत्यत्र उत्पन्नस्य MEM इत्यस्य कार्यक्षमतायाः मूल्याङ्कनं कुर्मः, यत्र ResNet101, ViT च समाविष्टाः भिन्नाः हैकिंग् मॉडल् सन्ति । परिणामाः सारणी २ मध्ये दर्शिताः सन्ति । अस्माभिः ज्ञातं यत् एते नमूनाः भिन्न-भिन्न-माडल-मध्ये सफलतया स्थानान्तरितुं शक्यन्ते, CLIP-माडल-प्रदर्शनस्य च अवनतिं कर्तुं शक्नुवन्ति ।

दृश्यविश्लेषणम्

चित्र 5: ध्यानमानचित्रदृश्यीकरणं: स्वच्छदत्तांशस्य अशिक्षणनमूनानां च चतुर्णां प्रतिमानानाम् भिन्नविधिभिः सह तुलना

चित्रे ५ स्वच्छदत्तांशयोः प्रशिक्षितानां आदर्शानां ध्यानतापमानचित्रं तथा च भिन्नविधिभिः उत्पन्नस्य अशिक्षणीयनमूनानां दर्शितम् अस्ति । चित्राणां कृते वयं मॉडलस्य ध्यानं दृश्यमानं कर्तुं Grad-CAM इत्यस्य उपयोगं कुर्मः, पाठस्य कृते तु ध्यानस्य दृश्यीकरणार्थं Integrated Gradients इत्यस्य उपयोगं कुर्मः । वर्णः यथा लघुः भवति तथा मॉडलस्य ध्यानं अधिकं भवति ।

ज्ञातव्यं यत् चित्रे ५(१), (२) (३) च दृश्यमानानां आदर्शानां कृते सर्वे केन्द्रीयक्षेत्रे केन्द्रीभवन्ति, यत् उपशीर्षकैः सह सम्बद्धम् अस्ति ।

परन्तु चित्रे ५(४) मध्ये MEM-3 द्वारा उत्पन्ननमूनानां विषये प्रशिक्षितं प्रतिरूपं स्वच्छानि चित्राणि सम्यक् चिन्तयितुं न शक्नोति यतोहि केवलं शोरविशेषताः एव शिक्षते पाठे अपि प्रथमत्रिषु आदर्शाः "काच" इति कीवर्डस्य विषये केन्द्रीभवन्ति, यदा तु उत्तरेषु आदर्शः प्रथमत्रिषु शब्देषु केन्द्रितः भवति एतत् यतोहि MEM-3 सर्वदा कोलाहलस्य प्रथमत्रिशब्दानां च अनुकूलनं करोति शॉर्टकट् निर्मातुं उत्प्रेरयति ।

एते दृश्यीकरणपरिणामाः दर्शयन्ति यत् ईएम तथा यूएपी बहुविधदत्तांशस्य रक्षणार्थं प्रभावी न भवति, यदा तु एमईएम महत्त्वपूर्णतया प्रभावी भवति ।

चित्र 6: स्वच्छनमूनानां t-SNE दृश्यीकरणं तथा स्वच्छप्रतिरूपस्य विषाक्तप्रतिरूपस्य च अन्तर्गतं MEM-3 अनुकूलितस्य अशिक्षणीयनमूनानां

वयं सामान्यप्रतिरूपस्य अन्तर्गतं स्वच्छनमूनानां विशेषतावितरणं तथा च चित्रे 6 विषाक्तप्रतिरूपे MEM3 द्वारा अनुकूलितस्य अशिक्षणनमूनानां विशेषतावितरणं कल्पयामः। वयं चित्रविशेषतानां प्रतिनिधित्वार्थं त्रिकोणानां उपयोगं कुर्मः, पाठविशेषतानां प्रतिनिधित्वार्थं वृत्तानां उपयोगं कुर्मः, तथा च समानवर्णः दत्तांशसमूहे पञ्च समानानि किन्तु परिवर्तितानि चित्राणि तेषां तत्सम्बद्धानि भिन्नवर्णनानि च प्रतिनिधियति

(क) तः वयं अवलोकयितुं शक्नुमः यत् स्वच्छप्रतिरूपस्य अन्तर्गतं समानानि चित्राणि पाठाः च आन्तरिकरूपेण एकत्र समूहीकृताः सन्ति, तत्सम्बद्धाः बिम्ब-पाठयुग्मानि च परस्परं समीपे सन्ति

परन्तु (ख) इत्यत्र समानं बिम्बं पाठं च विचलितं भवति, केवलं बिम्बपाठयुगलानि एव परस्परं समीपे भवन्ति । एतेन ज्ञायते यत् अस्माकं पद्धतिः प्रभावीरूपेण शोरस्य पाठस्य च उत्प्रेरकयोः मध्ये शॉर्टकट् ज्ञातुं मॉडल् प्रवर्धयति ।

प्रकरणस्य अध्ययनम् : मुखस्य गोपनीयतासंरक्षणम्

वयं अस्माकं MEM शोरस्य वास्तविक-दुनिया-परिदृश्ये प्रयोजयित्वा एकं केस-अध्ययनं कृतवन्तः: व्यक्तिगत-मुख-प्रतिबिम्बानां रक्षणं तथा च सामाजिक-माध्यम-मञ्चेषु नाम-इत्यादीनां सम्बन्धित-सूचनानाम् रक्षणम्।

वयं PubFig-दत्तांशकोशस्य उपयोगेन प्रयोगान् कृतवन्तः, यत् एकः विशालः वास्तविक-जगतः मुख-दत्तांशसमूहः अस्ति यस्मिन् अन्तर्जालतः एकत्रितानां २०० व्यक्तिनां ५८,७९७ चित्राणि सन्ति । पुनर्प्राप्तिमूल्यांकनार्थं वयं प्रत्येकस्य प्रसिद्धस्य एकं फोटो यादृच्छिकरूपेण परीक्षणसमूहरूपेण चयनं कुर्मः, अवशिष्टानि सर्वाणि चित्राणि प्रशिक्षणार्थं उपयुञ्ज्महे ।

यथार्थसूक्ष्म-समायोजनाय वयं तेषां नाम परिवर्त्य उपशीर्षकजननार्थं तस्य नामसम्बद्धानां पाठ-सारूप्यानां समुच्चयं प्रदत्तवन्तः । तदनन्तरं वयं MEM इत्यस्य उपयोगं कृत्वा अशिक्षणीयनमूनानां निर्माणं कुर्मः तथा च भिन्न-भिन्न-हैकिंग्-माडलस्य उपयोगेन तेषां मूल्याङ्कनं कुर्मः । परिणामाः सारणी 3 मध्ये दर्शिताः सन्ति।

MEM एतेषां सूक्ष्म-समायोजित-प्रतिमानानाम् मुख-नाम-विशेषतानां मध्ये सहसंबन्धं ज्ञातुं निवारयति, येन परीक्षण-समूहे सटीक-व्यक्ति-पुनर्प्राप्तिः बाधते

सारणी 3: विभिन्नपूर्वप्रशिक्षितमाडलयोः ResNet50 सूक्ष्म-समायोजनेन उत्पन्नस्य अशिक्षणीय-नमूनानां संरक्षण-प्रभावः

निगमन

अस्मिन् पत्रे वयं बहुविधदत्तांशसंरक्षणस्य अन्वेषणं कुर्मः, विशेषतया चित्र-पाठयुग्मेषु केन्द्रीकृत्य, यत्र बहुविधविपरीतशिक्षणेन शोषणं निवारयितुं बहुविधा अशिक्षणनमूनानि जनयामः। वयं पूर्ववर्गीकरणपद्धतीनां विस्तारं अस्मिन् सन्दर्भे कुर्मः, वर्धितानां मोडालिटीनां, विकीर्णदत्तांशस्य च कारणेन सीमाः प्रकाशयामः ।

एतेषां निष्कर्षाणां आलोके वयं बहु-चरण-दोष-न्यूनीकरणं (MEM) इति नामकं नवीनं जननात्मकं पद्धतिं प्रवर्तयामः, या ईएम-रूपरेखायाः आधारेण भवति । MEM प्रभावीरूपेण शोरस्य पाठस्य च ट्रिगरयोः मध्ये शॉर्टकट् स्थापयति तथा च भिन्न-भिन्न-हैकिंग्-माडलयोः मध्ये हस्तांतरणीयतां प्रदर्शयति ।

अपि च, वयं विविधदृश्यसाधनानाम् उपयोगेन अस्माकं दृष्टिकोणस्य प्रभावशीलतां सत्यापयामः । अस्माकं कार्यं नूतनां दिशां उद्घाटयति यत् अन्येषु मोडालिटीयुग्मेषु यथा श्रव्य-पाठ-श्रव्य-प्रतिबिम्ब-युग्मेषु प्रयोज्यम् इति अपेक्षा अस्ति ।

लेखकस्य विषये

अस्य लेखस्य लेखकाः सूचनाप्रौद्योगिकीसंस्थायाः, चीनीविज्ञानस्य अकादमीयाः, नान्याङ्गप्रौद्योगिकीविश्वविद्यालयस्य, सिङ्गापुरस्य राष्ट्रियविश्वविद्यालयस्य, सन याट्-सेन् विश्वविद्यालयस्य च सन्ति । लेखक सूची: लियू Xinwei, जिया Xiaojun, Xunyuan, लिआंग Siyuan, काओ Xiaochun.

तेषु प्रथमः लेखकः लियू सिन्वेई चीनीयविज्ञान-अकादमी-सूचना-प्रौद्योगिकी-संस्थायाः डॉक्टरेट्-छात्रः अस्ति । तत्सम्बद्धाः लेखकाः सन याट्-सेन् विश्वविद्यालयस्य प्रोफेसरः काओ जिओचुन्, नान्याङ्ग प्रौद्योगिकीविश्वविद्यालयस्य पोस्टडॉक्टरेल् शोधकर्त्ता जिया जिओजुन् च सन्ति ।

सन्दर्भाः : १.

https://scst.sysu.edu.cn/सदस्याः/caoxiaochun.html

https://jiaxiaojunqaq.github.io

समाचारं

आमुख

मम सम्पर्कसूचना