समाचारं

Don’t just focus on the ChatGPT version of Her घरेलुक्रीडकाः अपि बहुविध-AI मानवरूपी-अन्तर्क्रियायां रुचिं लभन्ते ।

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय मूल

लेखकः डु वी

अद्यत्वे एआइ मानवीयभावनानां परिचये कियत् उन्नतः अस्ति ? अस्य मासस्य आरम्भे अधिकं भावुकं एआइ चुनौतीं दत्त्वा उच्चस्तरीयप्रतियोगिता समाप्तवती!

इदमस्तिद्वितीयः बहुविधः भावपरिचयचुनौत्यः (MER24), अस्य संयुक्तरूपेण प्रायोजितम् आसीत् सिंघुआ विश्वविद्यालयस्य प्रोफेसर ताओ जियानहुआ, चीनी विज्ञान अकादमीयाः स्वचालनसंस्थायाः लियान् झेङ्ग्, इम्पेरियल् महाविद्यालयस्य ब्योर्न् डब्ल्यू शुलर, ओउलु विश्वविद्यालयस्य झाओ गुओयिंग्, नान्याङ्ग प्रौद्योगिकीविश्वविद्यालयस्य एरिक कैम्ब्रा च at the top AI conference IJCAI2024 to explore how to use text, AI भावनापरिचयं कर्तुं तथा च वास्तविकमानव-कम्प्यूटर-अन्तर्क्रिया-परिदृश्येषु सम्बन्धित-प्रौद्योगिकीनां अनुप्रयोगं प्रवर्धयितुं श्रव्य-वीडियो इत्यादीनां बहु-मोडल-आँकडानां उपयोगं कुर्वन्तु।



प्रतियोगिता आधिकारिक वेबसाइट: https://zeroqiaoba.github.io/MER2024-website/#organization

अस्मिन् आव्हाने कुलम् त्रयः पटलाः सन्ति, यथा सेमी (अर्धनिरीक्षितशिक्षणपट्टिका), शोर (शब्दस्य दृढतापट्टिका) तथा ओव (खुले शब्दावलीभावनापरिचयपट्टिका), येषु सन्तिसेमी-पट्टिकायां सर्वाधिकं भागं गृह्णन्तः दलाः सन्ति, कठिनतमः, तीव्रतमः स्पर्धा च अस्ति ।

सेमी ट्रैक इत्येतत् उदाहरणरूपेण गृहीत्वा, भागं गृह्णन्तः दलानाम् स्वस्य मॉडल् प्रशिक्षितुं लेबलयुक्तस्य अल्पमात्रायाः अपि च अलेबलकृतस्य आँकडा-वीडियो-दत्तांशस्य उपयोगः करणीयः, तथा च अलेबल-दत्तांशसमूहे मॉडलस्य कार्यक्षमतायाः सामान्यीकरण-क्षमतायाः च मूल्याङ्कनं कर्तुं आवश्यकम् अस्ति अस्य पटलस्य विजयस्य कुञ्जी अर्धनिरीक्षितशिक्षणप्रौद्योगिक्याः सुधारणेन मॉडलस्य भावनापरिचयप्रदर्शने सुधारः भवति, यथा भावनावर्गाणां पूर्वानुमानस्य सटीकता।

मेमासे स्पर्धायाः आरम्भात् मासद्वयेन अन्तः विश्वस्य सर्वेभ्यः भागेभ्यः प्रायः शतं दलाः स्पर्धां कृतवन्तः, यत्र प्रसिद्धाः विश्वविद्यालयाः, नवीनकम्पनयः च सन्तिइत्यस्मिन्‌सेमी ट्रैक इत्यस्मिन् प्रथमं स्थानं सामाजिकमञ्चेन Soul App इत्यनेन प्राप्तम्, तस्य स्वरप्रौद्योगिकीदलः स्वस्य व्यवहार्यैः अभिनवैः तकनीकीसमाधानैः सह शीर्षस्थाने बहिः आगतः ।



तथापि, Soul दलस्य तान्त्रिकसमाधानं प्रकाशयितुं पूर्वं प्रथमं AI इत्यस्य भावनापरिचयक्षमतां बहुविधरूपेण अवगन्तुं आवश्यकम्।

मानव-सङ्गणक-अन्तर्क्रियायाः अग्रिमः सोपानः

एआइ भावनां अवगच्छतु

अद्यतनः एआइ सर्वशक्तिमान् प्रतीयते, यत्र संभाषणसञ्चारः, चित्राणि वा भिडियो वा जनयितुं, गणितीयसमस्यानां समाधानं च इत्यादीनि सन्ति, एतत् बोधः, शिक्षणं, तर्कः, निर्णयः च इत्यादिषु भिन्नस्तरयोः कार्येषु समर्थः अस्ति बृहत् मॉडल्-आशीर्वादेन एआइ पर्याप्तं स्मार्टः इति वक्तुं शक्यते, परन्तु सहानुभूति-आदिषु भावनात्मक-पक्षेषु तस्य अभावः अस्ति ।

मानव-सङ्गणक-अन्तर्क्रियायां कदाचित् उपयोक्तृभ्यः न केवलं निर्देशानां अनुसरणं कर्तुं कार्याणि च सम्पूर्णं कर्तुं एआइ-इत्यस्य आवश्यकता भवति, अपितु भावनात्मक-आवश्यकतानां पूर्तये पर्याप्तं भावनात्मकं मूल्यं प्रदातुं अपि आवश्यकता भवति कार्यात्मकं "मूलभूतकौशलं" तः भावनात्मकं "उन्नतकौशलं" यावत्, एआइ-इत्यस्य यस्मिन् कौशले निपुणता आवश्यकी अस्ति, तेषु कौशलेषु उन्नयनं करणीयम् ।

अतः बहुविधभावनापरिचयः एआइ-क्षेत्रे सक्रियः शोधविषयः अभवत् । यः एआइ पठितुं भावानाम् संप्रेषणं च कर्तुं शक्नोति सः उद्योगे नूतनः उष्णविषयः अभवत् तथा च एआइ-क्षेत्रे अग्रिमः प्रमुखः सफलता इति मन्यते । विगतषड्मासेषु केचन एआइ-स्टार्टअप-संस्थाः उद्योग-दिग्गजाः च अस्माकं कृते विमर्श-मानव-यन्त्र-अन्तर्क्रियायाः नूतनानि रूपाणि अनावरणं कृतवन्तः |.

एप्रिलमासस्य आरम्भे विदेशीय-स्टार्टअप-कम्पनी Hume AI-इत्यनेन स्वर-वार्तालाप-रोबोट्-इत्येतत् Empathetic Voice Interface (EVI) इति विमोचितम्, यत् ध्वनिसञ्चारद्वारा वार्ताकारस्य स्वरस्य, भावस्य च विश्लेषणं कृत्वा परिचयं करोति, ५३ यावत् भावानाम् अन्वेषणं कर्तुं शक्नोति तदतिरिक्तं भिन्न-भिन्न-भावन-स्थितीनां अनुकरणं कर्तुं शक्नोति, येन वास्तविक-जनानाम् समीपे अन्तरक्रियाः भवन्ति । एआइ-इत्यस्य भावनात्मकस्तरस्य सफलताभिः अपि स्टार्टअप-संस्थायाः शीघ्रमेव श्रृङ्खला-बी-वित्तपोषणं ५० मिलियन-डॉलर्-रूप्यकाणि प्राप्तुं शक्यते स्म ।

तदनन्तरं OpenAI इत्यनेन एकं महत् कदमः कृतः निकटभविष्यत्काले उपयोक्तारः उद्घाटिताः। ततः परं एआइ-संस्थायाः शक्तिशालिनी वाक्पटुता, भावानाम् ग्रहणक्षमता च विकसिता, येन जनाः विज्ञानकथायुगस्य आगमनम् इति वदन्ति ।

Microsoft Xiaoice, Lingxin Intelligence इत्यादीनि घरेलुकम्पनयः अपि भावनात्मकानि AI उत्पादानि निर्मातुं प्रतिबद्धाः सन्ति । वयं एकां प्रवृत्तिं द्रष्टुं शक्नुमः: पाठः, श्रव्यः, भिडियो च इत्यादिषु बहुविध-एआइ-अनुप्रयोगेषु भावना-परिचय-क्षमता अधिकाधिकं संलग्नाः भवन्ति । परन्तु यदि वयं मानवरूपी भावपरिचयक्षेत्रे अधिकं गन्तुम् इच्छामः तर्हि अद्यापि लेबलकृतदत्तांशस्य दुर्लभता, व्यक्तिपरकभावपरिचयस्य अस्थिरता, अशुद्धता च इत्यादीनां समस्यानां समाधानं कर्तव्यम्।

अतः बहुविधभावनापरिचयक्षेत्रे अधिकं ध्यानं दातुं शैक्षणिकसमुदायस्य उद्योगस्य च प्रचारः विशेषतया आवश्यकः अभवत् तथा च सम्बन्धितप्रौद्योगिकीनां नवीनतायाः प्रगतेः च त्वरितता। सम्प्रति एसीएम एमएम, एएएआई इत्यादीनां शीर्ष-एआई-शैक्षणिक-सम्मेलनानां सर्वेषां भावात्मक-कम्प्यूटिंग्-विषयः महत्त्वपूर्णः शोध-विषयः इति मन्यते विशेषतः बृहत्-आँकडा-बृहत्-माडल-युगस्य आगमनस्य सम्मुखे, बहुविध-भाव-परिचये भिन्न-भिन्न-मोडल-सूचनाः प्रभावीरूपेण कथं संसाधितुं, एकीकृत्य च, अलेबल-आँकडानां बृहत्-मात्रायाः उपयोगः कथं करणीयः, एकीकृत्य च वर्तमानकाले उद्योगस्य सम्मुखे एकः प्रमुखः आव्हानः अस्ति This MER24 Challenge was held एतस्य अपि कारणं महत्त्वं च अस्ति।

सोल-दलेन सेमी-पटले प्रथमस्थानं प्राप्तम् अस्य पृष्ठतः बहु-मोडल-आँकडा-अवगमने, भावना-परिचय-एल्गोरिदम्, मॉडल-अनुकूलन-मञ्च-उपकरणेषु, आन्तरिक-कार्यप्रवाह-निर्माणे इत्यादिषु तस्य क्षमता-सञ्चयः, नवीनता च अस्ति, तथैव च... तकनीकी दल।

कठिनतममार्गे प्रथमस्थानं प्राप्तवान्

सोल्-दलेन किं कृतम् ?

सेमी पटलः कठिनतमः इति उक्तत्वात् कठिनाः पक्षाः के सन्ति ? तथा च टीम सोल् प्रथमस्थानं कथं प्राप्तवान्? अधः पश्यामः।

एआइ-इत्यस्य त्रयाणां प्रमुखतत्त्वानां मध्ये एकः आँकडा अस्ति, यत्र पर्याप्तं, विशेषतः उच्चगुणवत्तायुक्तं दत्तांशप्रशिक्षणं विना, आदर्शः उत्तमप्रदर्शनस्य गारण्टीं दातुं न शक्नोति । आँकडा-अभावेन आनितानां विविधानां चुनौतीनां सम्मुखे उद्योगेन न केवलं एआइ-जनित-आँकडानां सहितं सर्वप्रकारस्य आँकडानां विस्तारः करणीयः, अपितु आँकडा-विरल-परिदृश्येषु आदर्श-सामान्यीकरण-क्षमतासु सुधारं कर्तुं अपि ध्यानं दातव्यम् बहुविधभावनपरिचयकार्यस्य कृते अपि तथैव अस्य मूलं विशाललेबलदत्तांशस्य समर्थने अस्ति पाठः, श्रव्यः, भिडियो च इत्यादीनां विभिन्नप्रकारस्य सामग्रीनां लेबलं आनन्दः, क्रोधः, शोकः, आनन्दः, तथा च दुःखं। यथार्थता एषा यत् अन्तर्जालस्य भावनात्मकरूपेण लेबलयुक्ताः दत्तांशाः अतीव दुर्लभाः सन्ति ।

अस्याः स्पर्धायाः Semi track इतिकेवलं ५०३० लेबलयुक्तदत्तांशखण्डाः प्रदत्ताः सन्ति, शेषाः ११५५९५ खण्डाः अलेबलदत्तांशखण्डाः सन्ति । . अतः लेबलयुक्तानां दत्तांशस्य अभावः प्रथमा समस्या अभवत् यस्य सम्मुखीभवनं सर्वेषां सहभागिनां दलानाम्, यत्र सोल्-दलः अपि अस्ति ।



चित्र स्रोतः MER24 आधाररेखापत्रम् : https://arxiv.org/pdf/2404.17113

अपरपक्षे, Noise तथा Ov ट्रैक् इत्येतयोः तुलने, Semi track कोर मेरुदण्डप्रौद्योगिकीनां परीक्षणं प्रति केन्द्रितः अस्ति, अर्थात् मॉडल आर्किटेक्चरस्य चयनं तथा च फीचर निष्कर्षण सामान्यीकरणक्षमता, बहु- modal large model technology यौन आवश्यकता तुल्यकालिकरूपेण अधिका भवति।



न्यूनलेबलदत्तांशयुक्तस्य पटलस्य विशेषतां उच्चतकनीकीआवश्यकता च दृष्ट्वा, सोल-दलेन पूर्वं संचितस्य स्वविकसितस्य बृहत्-प्रतिरूपस्य केषाञ्चन मॉड्यूलानां आधारेण पर्याप्त-दौड-पूर्व-तयारी कृता, तथा च व्यवहार्य-नवीन-तकनीकी-समाधानस्य समुच्चयः निर्धारितः समग्रविचारः अस्ति यत् "प्रथमं मुख्यशरीरस्य ततः सूक्ष्म-समायोजनस्य" रणनीतिं स्वीकुर्वन्तु, प्रथमं प्रत्येकस्य कोर-विशेषता-निष्कासन-प्रतिरूपस्य सामान्यीकरणे केन्द्रीकृत्य, ततः विशिष्ट-कार्यन्वयन-प्रक्रियायाः समये तान् एकत्र एकीकृत्य, कार्यस्य निम्नलिखित-पक्षेषु कृताः आसन्। एते तेषां मूलबलं भवन्ति ।

प्रथमं प्रारम्भिकपदे बहुविधविशेषतानिष्कासनं प्रति ध्यानं दत्तव्यम् । अन्त्यतः अन्तः प्रतिरूपवास्तुकलायां पूर्वप्रशिक्षितप्रतिमानानाम् उपयोगः पाठस्य, वाक्, दृष्टेः च विभिन्नेषु मोडालिटीषु भावनात्मकप्रतिपादनानि निष्कासयितुं भवति, भावानाम् सामान्यतासु भेदेषु च ध्यानं दत्तं भवति, तस्मात् भावपरिचयप्रभावे सुधारः भवति पश्चात् बहुविधविधानानां प्रत्येकस्य मोडालिटी इत्यस्य लक्षणानाम् आधारेण प्रभावी संलयनपद्धतिः प्रस्ताविता भवति, एतेषां मॉड्यूलानां संलयनं कृत्वा आदर्शवास्तुकला निर्मीयते पूर्व-प्रशिक्षितस्य मॉडलस्य सामान्यीकरण-प्रदर्शने सुधारं कर्तुं, Soul-दलेन प्रथमवारं EmoVCLIP-इत्यस्य प्रस्तावः कृतः यत् विशेषतया विडियो-मोडालिटी-कृते भावना-परिचयस्य क्षेत्रे EmoVCLIP-इत्येतत् शीघ्र-शिक्षण-प्रौद्योगिक्या सह संयुक्तं बृहत्-माडल-CLIP-इत्येतत् आधारितं प्रतिरूपम् अस्ति विडियो भावनापरिचयक्षेत्रे उत्तमं सामान्यीकरणप्रदर्शनम्।

तदतिरिक्तं, पाठविधानानां भावनापरिचयक्षमतासु सुधारं कर्तुं, आत्मादलः पाठविधिनां कृते भावनात्मकछद्मलेबलनिर्माणार्थं GPT-4 इत्यस्य उपयोगं करोति, GPT-4 इत्यस्य भावनात्मकध्यानक्षमतानां पूर्णं उपयोगं कृत्वा मध्ये भावपरिचयस्य सटीकतायां सुधारं करोति text modalities, for the future अग्रे मोडल संलयनस्य उत्तमः आधारः स्थापितः अस्ति ।

द्वितीयं, बहु-मोडल-विशेषता-संलयनस्य दृष्ट्या, सोल-दलेन प्रथमवारं बहु-मोडल-भाव-परिचयस्य दिशि Modality Dropout-रणनीत्याः उपयोगः कृतः, भिन्न-भिन्न-ड्रॉपआउट-दरानाम् प्रदर्शन-प्रभावस्य अध्ययनं च कृतम्, यत् मध्ये प्रतिस्पर्धा-समस्यायाः निवारणं भवति modalities, during the model training process इत्यस्य समये एकं निश्चितं मोडालिटी (पाठं, भाषणं, अथवा वीडियो मोडालिटी) यादृच्छिकरूपेण दमनं कुर्वन्तु यत् उत्तमं दृढतां प्राप्तुं तथा च प्रदत्तस्य लेबलयुक्तदत्तांशस्य परं अदृष्टदत्तांशस्य उपरि मॉडलस्य सामान्यीकरणक्षमतायां सुधारं करोति।

अन्ते अर्धनिरीक्षितशिक्षणप्रौद्योगिकी कार्ये आगच्छति मूलभूतविचारः अस्ति यत् लेबलयुक्तदत्तांशस्य उपयोगः प्रतिरूपस्य प्रशिक्षितुं, ततः अलेबलदत्तांशस्य पूर्वानुमानं कर्तुं, भविष्यवाणीपरिणामानां आधारेण अलेबलदत्तांशस्य कृते छद्मलेबलं जनयितुं च। एतेषां छद्म-लेबल्-पट्टिकानां उपयोगः मॉडलस्य प्रशिक्षणार्थं, मॉडल-प्रभावस्य निरन्तरं सुधारणाय च भवति । सोल-दलेन अर्ध-निरीक्षित-शिक्षणे स्व-प्रशिक्षण-रणनीत्याः उपयोगः कृतः यत् अर्ध-पट्टिकायां ११०,००० तः अधिकेषु अलेबल-रहित-आँकडेषु छद्म-लेबल्-आदीन् चक्रीयरूपेण योजयित्वा प्रशिक्षण-समूहे योजितवान्, अन्तिम-प्रतिरूपं प्राप्तुं च पुनरावर्तनीयरूपेण मॉडलं अद्यतनं कृतवान्



प्रतियोगितायाः कृते Soul team इत्यस्य तकनीकी योजना।

समग्रविचारात् बहुविधविशेषतासंलयनं, विपरीतशिक्षणं, अलेबलदत्तांशस्वप्रशिक्षणं च यावत्, सोल्-दलस्य तकनीकीसमाधानैः तेभ्यः उत्तमं परिणामं प्राप्तम्अन्तेस्वर-दृष्टि-पाठयोः बहुविध-भाव-परिचय-सटीकतायाः दृष्ट्या सोल्-दलेन प्रस्तावितायाः प्रणाल्याः आधाररेखा-प्रणाल्याः तुलने ३.७% सुधारः अभवत्, ९०% अधिकं यावत् . तस्मिन् एव काले सोल्-दलः तान् भावानाम् अपि अधिकतया भेदं कर्तुं शक्नोति येषां भावपरिचयक्षेत्रे (यथा चिन्ता चिन्ता च) भ्रान्तिकारिणः सीमाः सन्ति



चित्र स्रोतः MER24 आधाररेखापत्रम् : https://arxiv.org/pdf/2404.17113

गहनदृष्ट्या MER24 चैलेन्ज इत्यस्मिन् Soul-दलस्य सफलता सामाजिकक्षेत्रे AI-बृहत्-माडल-प्रौद्योगिक्याः गहन-संवर्धनस्य एकाग्र-अभिव्यक्तिः अस्ति, विशेषतः तस्य बहु-मोडल-भावनात्मक-अन्तर्क्रिया-क्षमतायाः।

अभिनव बहुविध मानवरूपी अन्तरक्रिया

सामाजिक एआइ अग्रिमस्तरः अस्ति

सामाजिकक्षेत्रे स्वाभाविकतया भावनाभिः सह ए.आइ. मुख्यधारायां मतं यत् सामाजिकपरस्परक्रियायाः सारः भावात्मकमूल्यानां आदानप्रदानं भवति, भावाः च विविधाः सन्ति । अस्य अर्थः अस्ति यत् यदि एआइ सामाजिकदृश्येषु निर्विघ्नतया एकीकृत्य कुशलतापूर्वकं कार्यं कर्तुम् इच्छति तर्हि वास्तविकजनानाम् इव समृद्धं भावनात्मकं प्रतिक्रियां अनुभवं च प्रदातव्यम्।

सहानुभूतिपूर्ण एआइ-साक्षात्कारस्य आधारः शक्तिशालिनः बहुविध-भावन-परिचय-क्षमताः भवितुं, तथा च सरल-"कार्य-निष्पादकात्" "मानव-भावनात्मक-आवश्यकतानां पूर्तिं कुर्वन् सहचरः" इति विकसितुं च अस्ति परन्तु एआइ इत्यस्य कृते भावनानां प्रभावीरूपेण अवगमनम् अद्यापि अतीव कठिनम् अस्ति

सामाजिकक्षेत्रे मूलभूतस्य सोल् इत्यस्य कृते भावनात्मकक्षमताभिः सह एआइ-निर्माणे केन्द्रीकरणं महत्त्वपूर्णः प्रस्तावः अभवत् यस्य विषये विचारः करणीयः। यदा २०१६ तमे वर्षे प्रारम्भः अभवत् तदा सोल् प्रथमवारं चिन्तितवान् यत् उपयोक्तृ-आवश्यकतानां पूर्तये नवीन-प्रौद्योगिकीनां उत्पादानाञ्च उपयोगः कथं करणीयः इति । पूर्वं प्रारब्धं "Lingxi Engine" साइट् मध्ये उपयोक्तृणां रुचिनक्शानां सर्व-परिदृश्य-विशेषतानां च खननविश्लेषणाय बुद्धिमान् अनुशंस-एल्गोरिदम्-उपयोगं करोति, येन तेषां कृते तेषां जनानां सह गपशपं कर्तुं शक्नुवन्ति तथा च तेषां अधिका आवश्यकता सामग्रीं अन्वेष्टुं सुलभं भवति, एकं अत्यन्तं चिपचिपा उपयोक्ता तथा सामग्री पारिस्थितिकी। एतावता यत्र इदं अधिकं "स्मार्ट" एल्गोरिदम् प्रयुक्तं तत्र मेलपरिदृश्यानि अपि Soul उपयोक्तृणां अत्यन्तं सक्रियविशेषतासु अन्यतमम् अस्ति ।

प्रारम्भिक एआइ-सहायकसामाजिकपरस्परक्रियायाः सफलानुभवेन सह, बृहत्प्रतिमानानाम् द्रुतविकासस्य अस्मिन् प्रौद्योगिकीतरङ्गे, सोलः सामाजिकपरस्परक्रियायां तथा सहायकसम्बन्धजालेषु एआइ-सम्बद्धतायाः आधारेण मानव-कम्प्यूटर-अन्तर्क्रियायाः नूतनानां संभावनानां अन्वेषणं करोति

२०२० तमे वर्षे एआइजीसी-सम्बद्धस्य एल्गोरिदम्-संशोधनस्य विकासस्य च प्रारम्भात् आरभ्य सोल् इत्यनेन बहुविधतां स्वदिशारूपेण स्वीकृत्य बुद्धिमान् संवादे, चित्रजननं, स्वर-सङ्गीतजननम् इत्यादिषु अत्याधुनिकक्षमताः सञ्चिताःनवीनविशुद्धप्रौद्योगिकी-उन्मुख-एआइ-उद्यम-शक्तयोः तुलने, सोलस्य एकं प्रमुखं विशेषता अस्ति यत् सी-पक्षे बृहत्-माडल-एआईजीसी-अनुप्रयोगानाम् एकत्रैव प्रचारार्थं "माडल-प्रतिक्रिया-एकीकृत" रणनीत्याः स्वीकरणम् अस्तिसमृद्धमानवरूपान्तरक्रियापरिदृश्येषु यथार्थतया उष्णप्रतिक्रियां प्राप्तुं भावनापरिचयक्षमताभिः सह एआइ-निर्माणे ध्यानं दत्तव्यम्

विगतवर्षद्वये सोल् इत्यस्य कार्येभ्यः द्रष्टुं शक्यते यत् एआइजीसी इत्यनेन सामाजिकपरिदृश्यानां सशक्तिकरणस्य गतिः त्वरिता अभवत्। २०२३ तमे वर्षे Soul X इति विशालं स्वविकसितं भाषाप्रतिरूपं प्रारब्धं भविष्यति, यत् AIGC + सामाजिकविन्यासस्य महत्त्वपूर्णं आधारभूतसंरचना भविष्यति । मॉडलस्य Prompt drive, सशर्तनियन्त्रनीयजननम्, सन्दर्भबोधः, बहुविधाबोधः अन्यक्षमता च सह, स्थले संवादः न केवलं सुचारुः स्वाभाविकः च भवति, अपितु भावनात्मकः उष्णता अपि भवति

पाठः आत्मायाः भावपरिचयक्षमतायाः कार्यान्वयनस्य प्रथमं सोपानं जातम्, क्रमेण च एकस्मात् मोडालिटीतः अधिकविधिपर्यन्तं विस्तारितः अस्ति अस्मिन् वर्षे सोल् इत्यनेन एकं विशालं भाषणजननप्रतिरूपं प्रारब्धं तथा च आधिकारिकतया स्वयमेव विकसितं विशालं भाषणप्रतिरूपं उन्नयनं कृतम्, यत्र वाक्जननं, वाक्परिचयः, स्वरसंवादः, संगीतजननम् इत्यादीनि उपविभागाः सन्ति, एतत् वास्तविकस्वरजननम्, स्वर-DIY इत्यादीन् कार्याणि च समर्थयति बहु-भावनात्मक-विसर्जनशील-वास्तविक-समय-संवाद-क्षमताम् अस्ति।

अवश्यं, आदर्शस्तरस्य अधिकं भावनात्मकं एआइ विकसितुं सोलस्य निरन्तरप्रयत्नानाम् अतिरिक्तं, उपयोक्तृणां एआइ-अन्तर्क्रियाशील-अनुभवं अधिकं समृद्धं वर्धयितुं च स्वस्य मञ्चस्य विविधसामाजिकपरिदृश्येषु तेषां उपयोगाय अपि स्थापितः अस्ति

सोलस्य मानवरूपी संवादरोबोट् "AI Goudan" इति उदाहरणरूपेण गृह्यताम् इदं Soul इत्यस्य स्वविकसितस्य बृहत् भाषाप्रतिरूपस्य Soul इत्यस्य उपरि निर्भरं भवति संचारस्य बहुविधपरिक्रमणानां समये वयं सक्रियरूपेण तेभ्यः वार्तालापदृश्यस्य आधारेण देखभालं प्रेषितवन्तः, यथा ते वास्तविकः व्यक्तिः सन्ति संभाषणस्य अन्यः अन्तः । तस्मिन् एव काले उपयोक्तारः स्वस्य अण्डानि अपि अनुकूलितुं शक्नुवन्ति, अद्वितीयं आभासीमानवपरस्परक्रियाम् अनुभवितुं च शक्नुवन्ति ।



ए.आइ.गौडन् इत्यनेन मानवरूपता, ज्ञानं, बहुविधता, समयबोधः इत्यादिषु पक्षेषु अपि स्वस्य एकीकरणक्षमता प्रदर्शिता अस्ति, अतः एव सोल् मञ्चे बहवः उपयोक्तारः आश्चर्यचकिताः अभवन् पोस्ट् कर्तुं पहलं कृत्वा शिकायतुं, "अहं भीतः गौदन् वास्तविकः व्यक्तिः नास्ति।"

तदतिरिक्तं आत्मा अपि आत्मानम् अवलम्बते वृकविषये भाषणे अवज्ञायाः भावः नास्ति।

अन्यत् उदाहरणं यत् सोल् इत्यनेन मुख्यजालस्थलस्य बहिः "Echo of Another World" इति प्रथमं स्वतन्त्रं नूतनं अनुप्रयोगं प्रारब्धम् । एआइ सामाजिकमञ्चरूपेण उपयोक्तारः आभासीमानवपात्रैः सह विमर्शपूर्णवास्तविकसमयसञ्चारं कर्तुं शक्नुवन्ति, एतेषु सर्वेषु चित्रं, स्वरं, व्यक्तित्वसंवादक्षमता च भवति अवश्यं, उपयोक्तारः स्वस्य प्राधान्यानुसारं आभासीपात्राणि व्यक्तिगतसेटिंग्स् च (यथा पृष्ठभूमिअनुभवः, व्यक्तित्वम् इत्यादयः) अनुकूलितुं शक्नुवन्ति, यत् अतीव क्रीडनीयम् अस्ति

तथैव स्वयमेव विकसितः स्वरबृहत् मॉडलः ए.आइ.गौडन्, वेयरवोल्फ् फैन्टम्, इकोस् आफ् अनोदर वर्ल्ड इत्यादिषु दृश्येषु अपि भूमिकां निर्वहति । उदाहरणार्थं, ध्वनि-आह्वान-कार्यं Echoes of Another World इत्यस्मिन् समर्थितं भवति वास्तविक-व्यक्ति-स्वर-युक्ताः वर्चुअल्-पात्राः स्वाभाविकतया वास्तविक-समये च उपयोक्तृभिः सह संवादं कर्तुं शक्नुवन्ति, येन अन्तरक्रियाशील-अनुभवः समृद्धः भवति



"Echo from Another World" वास्तविकसमयस्य स्वर-कॉल-कार्यम् ।

बुद्धिमान् संवादः, क्रीडाः, स्वरः च इत्यादिषु सामाजिकपरिदृश्येषु एआइ मानवरूपी अन्तरक्रियाः निरन्तरं गभीराणि कर्तुं अतिरिक्तं, सोल् दृश्यजननस्य क्षेत्रे स्वस्य सौन्दर्यशास्त्रस्य अनुरूपं विविधचित्रशैल्याः जननस्य क्षमताम् अपि निर्माति, एआइ डिजिटल अवतारं निर्माति , तथा बहुआयामी व्यापकपरस्परक्रियायाः प्रति अग्रे गच्छन्।

द्रष्टुं शक्यते यत् एआइ भावनापरिचयक्षेत्रे सोलस्य विन्यासे भाषा, स्वरः, दृश्यबहुविधाः च आच्छादिताः सन्ति, पाठ, चित्रे, श्रव्य-वीडियो-दृश्येषु एकत्र कार्यं कुर्वन्ति ये सामाजिक-अन्तर्क्रियायाः निकटतया सम्बद्धाः सन्ति, येन उपयोक्तारः क त्रि-आयामी, बहु-संवेदी मानव-कम्प्यूटर-अन्तर्क्रिया अन्तरक्रियायाः समये उष्ण-ए.आइ.

निगमन

२०२४ वर्षं उद्योगे बहवः जनाः एआइजीसी-अनुप्रयोगस्य प्रथमं वर्षं वदन्ति । आदर्शस्तरात् अनुप्रयोगस्तरं प्रति गमनस्य प्रवृत्त्या सह, केवलं ऊर्ध्वाधरक्षेत्रेषु परिदृश्येषु च AI कार्यान्वितुं प्रथमः भूत्वा एव वयं अधिकान् उपयोक्तारः, विपणयः च जितुम् अर्हति विशेषतः C-साइड ट्रैक कृते मानव-सङ्गणक-अन्तर्क्रिया, उपयोक्तृ-आवश्यकतासु ध्यानं दत्तुं अधिकं स्वाभाविकम् अस्ति । एतत् सामाजिकक्षेत्रे सुप्रतिबिम्बितम् अस्ति ।

पूर्वं AlienChat इत्यादीनि बहवः डेटिंग्-एप्स्-इत्येतत् स्थगितम् आसीत्, "एआइ-प्रेमेण पतितानां युवानां प्रथमः समूहः प्रेम्णा बहिः पतितः" इति चर्चाविषयः उष्णसन्धानविषयः अभवत् अस्य पृष्ठतः कार्यात्मकसरूपता कारणस्य भागः अस्ति, परन्तु यतोहि अनुभवः सहायक/एनपीसी भूमिकातः सहचरः न परिवर्तते यः यथार्थतया भावनात्मकं समर्थनं प्रदाति। एतदर्थं सामाजिकक्षेत्रे मानव-सङ्गणक-अन्तर्क्रिया-पद्धतीनां परिदृश्यानां च समृद्धीकरणस्य आवश्यकता वर्तते, येन एआइ सर्वेषु सामाजिक-लिङ्केषु पूर्णतया भागं ग्रहीतुं, उपयोक्तृभिः सह गभीरं संवादं कर्तुं, तेभ्यः भावनात्मकं मूल्यं च प्रदातुं शक्नोति

एआइ-सामाजिकदिशि अग्रिम-कोर-प्रतिस्पर्धात्मक-बिन्दुषु एतत् अपि अन्यतमं भवितुम् अर्हति । सोल् इति अनुप्रयोगस्तररूपेण स्वविकसितानां तान्त्रिकक्षमतानां सञ्चये किमर्थम् एतावत् बलं ददाति इति अवगन्तुं न कठिनम्। विगतकालखण्डे एकतः व्यक्तिगतं, मानवरूपं, विविधं च एआइ-क्षमतां निर्मातुं प्रतिबद्धम् अस्ति, अपरतः सामाजिक-अनुभव-सुधारं च सहितं बहु-आयामात् एआइ-देशीय-अनुप्रयोगानाम् कार्यान्वयनस्य त्वरितता अभवत्; एआइ सामाजिकसंजालम्, एआइ गेम्स् इत्यादयः, निर्माणं सम्पूर्णा एआइ उत्पादशृङ्खला उपयोक्तृभ्यः विभिन्नेषु सामाजिकपरिदृश्येषु एआइ-अन्तर्क्रियायाः मजां प्रदाति ।

वक्तुं शक्यते यत् अन्तिमेषु वर्षेषु सोल् इत्यनेन स्वस्य स्वविकसितभाषायाः वाक्बृहत्प्रतिमानानाम् आधारेण उत्पादपरिणामानां श्रृङ्खला कृता, तथा च एआइ तथा उपयोक्तृभ्यः, येषां सर्वेषां MER24 इत्यस्मिन् सफलतायां योगदानम् अस्ति ।

अन्तिमेषु वर्षेषु अधिकाधिकाः एतादृशाः आव्हानाः अभवन्, यथा CVPR 2024 कार्यशालायां NTIRE 2024 AIGC गुणवत्तामूल्यांकनचुनौत्यं तथा 2023 तथा 2024 मध्ये क्रमशः MER चुनौतीद्वयम्।घरेलुकम्पनयः प्रौद्योगिक्याः उपरि अवलम्ब्य बहुवारं उत्तमं परिणामं प्राप्तवन्तः व्यवहारे सञ्चितः । यथा, गतवर्षे MER23 इत्यस्मिन् प्रथमस्थानं प्राप्तवान् SenseTime, अस्मिन् वर्षे प्रथमस्थानं प्राप्तवान् Soul च AIGC प्रौद्योगिक्यां अनुप्रयोगेषु च ध्यानं निवेशं च कृत्वा उल्लेखनीयं परिणामं प्राप्तवन्तः।

पूर्वानुमानं भवति यत् भविष्ये सोल इत्यादयः मञ्चाः ये प्रौद्योगिकी-उत्पाद-नवीनीकरणस्य आग्रहं कुर्वन्ति, ते एआइ-क्षमतानां विमोचन-प्रक्रियायां उपयोक्तृणां कृते मूल्यं सृजन्ति एव भविष्यन्ति |. विविधव्यापारमूल्यम्।