समाचारं

Llama 3.1 405B VS Mistral Large 2, मुक्तस्रोतस्य राजा कः अस्ति ? एआइ हेङ्गपिंग

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


लेखक|लवण मरिच जेड खरगोश
ईमेल@[email protected]

अधुना एव बृहत्-प्रमाणस्य एआइ-माडलद्वयं मुक्तम् अस्ति ।

23 जुलै, 1999 दिनाङ्के ।मेटाघोषितल्लमा ३.१ ४०५खmodel, यत् न केवलं समर्थयति८ प्रकारःमानवभाषा, अपिबहुसङ्गणकभाषासु प्रवीणः,यथा अधः दर्शितम् : १.


ततः 24 जुलै, 2017 दिनाङ्के ।मिस्त्राल्नवीनतमं पोस्ट् कृतवान्मिस्त्रल बृहत्2model, एतत् मॉडल् समर्थयतिदर्जनशः प्रकाराःमानवभाषा, तथा८० तः अधिकेषु प्रोग्रामिंगभाषासु प्रवीणः , यत्र पायथन्, जावा, सी, सी++, जावास्क्रिप्ट् तथा बैश इत्यादयः सन्ति । स्विफ्ट्, फोर्ट्रान् इत्यादिषु केषुचित् अधिकविशिष्टभाषासु अपि प्रवीणः अस्ति ।


आधार६४ एन्कोडिंग् इयं एन्कोडिंग् पद्धतिः अस्ति या द्विचक्रीयदत्तांशं पाठस्वरूपेण परिवर्तयति तथा च प्रायः पाठप्रोटोकॉलमध्ये द्विचक्रीयदत्तांशं प्रसारयितुं उपयुज्यते । Base64 इत्यनेन एन्कोडेड् कृतम्आँकडा पूर्वसंसाधनम्, मॉडलनिवेशः निर्गमः च, आँकडासुरक्षाअस्य विस्तृतप्रयोगाः सन्ति ।


Base64 एन्कोडिंग् इत्यस्य माध्यमेन वयं एआइ मॉडल् इत्यस्य बहुभाषासंसाधनक्षमतायाः मूल्याङ्कनं कर्तुं शक्नुमः तथा च परीक्षितुं शक्नुमः यत् ते एन्कोडेड् सूचनां सम्यक् अवगन्तुं अनुवादयितुं च शक्नुवन्ति वा, विशेषतः तेषां भिन्नभाषाः एन्कोडिंग् प्रारूपाणि च अवगन्तुं संसाधितुं च क्षमता। ततः तेषां बहुभाषिकानुवादक्षमता, उत्तरसटीकता, तर्कक्षमता च परीक्षिता भवति ।

डिकोडिंग् इति एन्कोडिंग् इत्यस्य विपरीतप्रक्रिया ।यदि एआइ मॉडल् Base64 एन्कोडिंग् अथवा डिकोड् प्रासंगिकसूचनाः समीचीनतया व्याख्यातुं संसाधितुं च शक्नोति तर्हि दैनिकप्रोग्रामिंगकार्यं कर्तुं, संजालदत्तांशस्य विश्लेषणं कर्तुं, जटिलसञ्चिकाभ्यः सूचनां निष्कासयितुं अपि अधिकं सहजं भविष्यति

अद्य वयं एतत् अस्पष्टं प्रतीयमानं उपयुञ्ज्महेBase64 एन्कोडिंग् तथा डिकोडिंग्परीक्षणं कर्तुंबृहत् आदर्शानां कृते बहुभाषिकक्षमता।

तदनन्तरं वयं किञ्चित् "जासूसी" मनोदशा सह Base64 एन्कोडिंग् विषये पहेलीक्रीडां कर्तुं गच्छामः ।

यद्यपि मुख्यक्रीडकाः सन्तिल्लमा ३.१ ४०५खतथामिस्त्रल बृहत्2परन्तु वयम् अपि सम्मिलिताःक्वेन्२-७२BतथाGPT-4o, एकः चीनदेशस्य प्रमुखः मुक्तस्रोतप्रकल्पः, अन्यः बन्दस्रोतप्रतिनिधिः, तान् पश्यन्तुकिं वास्तवमेव एतेषां "कोडिंग्-आव्हानानां" निवारणं साधारणभाषाणां इव सुलभतया कर्तुं शक्यते?वयं पश्यामः !

क्रीडानियमाः : १.

वयं बहुभाषापरीक्षणार्थं Base64 एन्कोडेड् स्ट्रिंग् इत्यस्य उपयोगं करिष्यामः, यत्र चीनीयः आङ्ग्लभाषा च सन्ति । अस्याः परीक्षणस्य माध्यमेन वयं बहुभाषानुवादस्य, उत्तरसटीकता, तर्कक्षमता च इत्येतयोः दृष्ट्या प्रत्येकस्य प्रमुखस्य प्रतिरूपस्य कार्यक्षमतां अवगन्तुं शक्नुमः ।

- परीक्षणस्य २ चक्राः सन्ति, प्रत्येकस्मिन् वृत्ते त्रीणि वार्तालापाः भवन्ति । प्रत्येकं सम्यक् उत्तरस्य मूल्यं १ बिन्दुः भवति ।

- परीक्षणस्य निष्पक्षतां सुनिश्चित्य वयं मॉडलं डिकोडिंग् कृते कोड-उपकरणानाम् उपयोगं न कर्तुं प्रेरयिष्यामः ।

- प्रॉम्प्ट् शब्दः: एषः base64 सन्देशः [] अस्ति कृपया कोडिंग्-उपकरणानाम् उपयोगं विना एषः सन्देशः किम् अस्ति इति वदतु ।


सर्वप्रथमं अस्माकं Base64 एन्कोडिंग् तथा डिकोडिंग् इत्यस्य चरणानां प्रक्रियाणां च रूक्षः विचारः अस्ति ।

Base64 एन्कोडिंग् द्विचक्रीयदत्तांशं विशिष्टानां 64 वर्णानाम् (AZ, az, 0-9, +, /) श्रृङ्खलायां परिवर्तयति यत् तस्य प्रतिनिधित्वं करोति । यदि डिकोडिंग् प्रक्रियायां पदानि अशुद्धानि सन्ति अथवा स्ट्रिंग् वैधं Base64 एन्कोडिंग् नास्ति तर्हि डिकोडिंग् परिणामाः अशुद्धाः अथवा निरर्थकाः भवितुम् अर्हन्ति । वास्तविकं Base64 एन्कोडेड् स्ट्रिंग् किं प्रतिनिधियति इति परीक्षितुं, भवान् स्वस्य प्रोग्रामिंग् भाषायां ऑनलाइन-उपकरणानाम् अथवा पुस्तकालयानाम् उपयोगं कृत्वा तत् सम्यक् डिकोड् कर्तुं शक्नोति ।

1

प्रथमः दौरः आङ्ग्लभाषायाः डिकोडिंग्

अस्मिन् दौरे मूल्याङ्कनार्थं Base64 एन्कोडिंग् इत्यत्र परिवर्तयितुं आङ्ग्लशब्दानां उपयोगः भवति ।

न्याय:SnVzdGljZQo=

शौर्य:QnJhdmVyeQo=

दया:S2luZG5lc3M=

प्रथमं बृहत् मॉडलस्य परिणामस्य परीक्षणार्थं आङ्ग्लसङ्केतनस्य उपयोगं कुर्मः ।ल्लमा ३.१ ४०५खसर्वाणि उत्तराणि सर्वथा सम्यक् सन्ति।३ अंकं प्राप्तवान् ।परन्तु सर्वाणि उत्तराणि आङ्ग्लभाषायां सन्ति, यत् चीनीभाषायां बहु मैत्रीपूर्णं नास्ति।

तथापि, अद्यापि स्वस्य अद्वितीयं इमोटिकॉन् संकुलं कृत्वा आगमिष्यति यत् एषः “मानवस्पर्शः” कस्य न रोचते भावात्मकं मूल्यम् अतीव उत्तमम् अस्ति ।


तथामिस्त्रल बृहत् २Decoded English Base64 सन्देशःप्रश्नद्वयस्य सम्यक् उत्तरं ददातु , २ अंकं प्राप्नोति । द्वितीयप्रश्ने मूलपाठः brevery अस्ति, विकोडितः शब्दः च "शूर" इति दोषस्य सर्वाधिकं सम्भाव्यते स्रोतः वर्णानाम् द्विचक्रीयसूचकाङ्केषु परिवर्तने, अनुक्रमणिकानां द्विचक्रीयसूचकाङ्के परिवर्तने, अथवा पुनर्गठने दोषः द्विचक्रीय संख्या।

परन्तु प्रशंसनीयं यत् डिकोडिंग् प्रक्रियायां प्रथमं सिद्धान्तस्य व्याख्यानं करोति, ततः क्रमेण विश्लेषणं तर्कं च कर्तुं ५ सोपानानां उपयोगं करोति अन्ते च डिकोडिंग् करोति, यत् विस्तृतं स्पष्टं च भवति, अत्यन्तं सुलभं च भवति

चित्राणि उपरि अधः च स्लाइड् कर्तुं शक्नुवन्ति


चटGPT-4oउत्तरं पूर्ववत् संक्षिप्तं द्रुतं च अस्ति अस्मिन् समये डिकोडेड् सामग्री अपि सर्वथा सम्यक् अस्ति, ३ अंकं प्राप्तवान् ।

चित्राणि उपरि अधः च स्लाइड् कर्तुं शक्नुवन्ति


अन्ते अवलोकयामःक्वेन्२-७२Bआङ्ग्लभाषायाः डिकोडिंग् उत्तराणि, त्रयः अपि उत्तराणि सम्यक् सन्ति, तथा च वास्तविक एन्कोडिंग् इत्यस्मिन् सावधानताः अपि व्याख्याताः, सुलभाः, विचारणीयाः च सन्ति, ३ अंकाः प्राप्तवन्तः


1

द्वितीयः गोलः : चीनीयविकोडः, कोऽपि न जीवति?

अयं गोलः कठिनतां वर्धयति तथा च मूल्याङ्कनार्थं Base64 एन्कोडिंग् इत्यत्र परिवर्तयितुं चीनीशब्दानां उपयोगं करोति ।

न्यायः ५q२j५LmJ

वीर: ५युह५पवि

दया: ५ZaE6Imv

प्रथमं सुपर लार्ज् कपं अवलोकयामःल्लमा ३.१ ४०५खउत्तरं कथं दातव्यम् : १.

पङ्क्तिबद्धरूपेण त्रयः प्रश्नाः पृष्ट्वा अपि ल्लामा ३.१ ४०५बी इत्यनेन डिकोडेड् सन्देशस्य उत्तरं आङ्ग्लभाषायां दत्तम्, परन्तु तस्य यत् प्राप्तं तत् आङ्ग्लशब्दाः "Hello World", "Hello", "Goodbye" च आसन्, ये मूलतः सर्वे गलताः आसन्अस्य गोलस्य कृते ० अंकाः प्राप्ताः ।

एकदृष्ट्या, Base64 स्ट्रिंग् रूपान्तरणस्य परिणामः सामान्यतया अधोलिखितस्य चित्रस्य इव न दृश्यते, यावत् मूलदत्तांशः एतादृशः नास्ति ।Llama 3.1 405B द्वितीयपदे भ्रष्टं गन्तुं आरभते, अर्थात् "Base64 वर्णानाम् ASCII मध्ये मैपिंग", तदनन्तरं सर्वे परिणामाः गलताः भवितुमर्हन्ति ।

डिकोडिंग् प्रक्रियायाः समये प्रत्येकं Base64 वर्णं विशिष्टे 6-बिट् द्विचक्रीयमूल्ये मैप् करणीयम् । यदि डिकोडिंग्-काले वर्ण-द्विचक्रीय-मानचित्रणं गलतं भवति तर्हि विकोडितं परिणामं स्वाभाविकतया गलत् भविष्यति ।

परन्तु रोचकं वस्तु अस्ति यत्,ल्लमा ३.१ ४०५B इत्अधिकं "मानवः" ।, प्रत्येकं उत्तरे पाठे केचन अल्पाः व्यञ्जनाः भविष्यन्ति, उत्तरं दातुं पूर्वं च केचन योजयिष्यामिमोडलएतादृशी सामग्री वस्तुतः अधिकाधिकं मानवीयं भवति।

चित्राणि उपरि अधः च स्लाइड् कर्तुं शक्नुवन्ति


अद्य प्रदर्शितं Mistral Large 2 इत्येतत् अवलोकयामः।

प्रश्नत्रयानन्तरं अहं कस्यापि कोडितस्य चीनीयशब्दस्य सम्यक् उत्तरं दातुं न शक्तवान् This round0 अंक प्राप्त करें

यद्यपि Mistral Large 2 इत्यस्य डिकोडिंग् रिजनिंग् प्रक्रिया अतीव विस्तृता अस्ति तथापि प्रत्येकं पदं यावत् कः सोपानः भ्रष्टः इति द्रष्टुं अधिकं स्पष्टं भवति ।मुख्यतः इद्वितीयं सोपानं गलत् अस्ति, Base64 वर्णानाम् द्विचक्रीयरूपेण मैपिंगं, ततः तर्कपदार्थाः अपि गलताः सन्ति, परिणामः अपि गलतः भवितुमर्हति ।

अस्मिन् चरणे Base64-एन्कोडेड् वर्णाः तेषां सम्यक् द्विचक्रीयमूल्यानां स्थाने प्रत्यक्षतया ASCII वर्णानाम् अशुद्धरूपेण मैप् भवन्ति । यथा - '5' 'H' इति मैप् भवति ।एतत् मानचित्रणम्Base64 एन्कोडिंग् वस्तुतः कथं कार्यं करोति इति उपेक्षते, अर्थात् प्रत्येकं Base64 वर्णः वास्तवतः प्रत्यक्ष ASCII वर्णस्य अपेक्षया 6-बिट् द्विचक्रीयसङ्ख्यां प्रतिनिधियति ।

एतत् सामर्थ्यं सुदृढीकरणस्य आवश्यकता वर्तते इति भाति।

चित्राणि उपरि अधः च स्लाइड् कर्तुं शक्नुवन्ति


येषां चीनीभाषायाः अधिकबोधः अस्ति तान् अवलोकयामःचटGPT-4o, प्रत्यक्षतया विकोडितं सामग्रीं ददाति, सर्वं सम्यक् अस्ति,अस्मिन् दौरे ३ अंकाः प्राप्ताः ।


अत्यन्तं प्रतिरोधकानि घरेलुपदार्थानि अवलोकयामःक्वेन्२-७२B, डिकोडिंग् परिणामाः अपि "Test", "Hello" तथा "World" सन्ति, ये मूलतः सर्वे गलताः सन्ति, अयं च गोलः 0 अंकं प्राप्नोति ।

Qwen2-72B इत्यस्य विचारं समीपतः अवलोकयामः उत्तरे केवलं तर्कविचाराः सन्ति, तथा च प्रत्यक्षतया उत्तरं प्राप्तुं विविधाः रूपान्तरणपदार्थाः परित्यजन्ति अस्य अर्थः अस्ति यत् प्राप्ताः परिणामाः बहुधा गलताः सन्ति।अन्येषु शब्देषु, Qwen2-72B इत्यस्य मुख्यदोषाः मुख्यतया अत्र केन्द्रीकृताः सन्तिBase64 एन्कोडिंग् इत्यस्य अवगमनम्तथाडिकोडिंग्-पदस्य निष्पादनम्श्रेष्ठतर।

उदाहरणतया:साक्षात्Base64 एन्कोडिंग् तः विशिष्टानि चीनीवर्णानि प्राप्नुवन्तु, यत् असम्भाव्यं यतः एतस्य कृते द्विचक्रीयदत्तांशस्य व्याख्यानार्थं सम्यक् बाइट्-अनुक्रमस्य एन्कोडिंग् (यथा UTF-8) च आवश्यकम् अस्ति ।


अन्तिमः स्कोरः अस्ति : १.


स्पष्टं यत् ChatGPT-4o इत्यनेन ६ अंकाः प्राप्ताः, यत् अन्येभ्यः प्रमुखेभ्यः मॉडलेभ्यः पूर्णतया अग्रे अस्ति, भवेत् तत् चीनी वा आङ्ग्लभाषा वा, Base64 कोडः सहजतया वयं अवगच्छामः इति अर्थे परिवर्तयितुं शक्यते ।

अन्ये त्रयः मॉडलाः, Llama 3.1 405B तथा Qwen2-72B, सर्वे ३ अंकं प्राप्तवन्तः, आङ्ग्ल-डिकोडिंग्-मध्ये च उत्तमं प्रदर्शनं कृतवन्तः, परन्तु चीनी-डिकोडिंग्-मध्ये तुल्यकालिकरूपेण अपर्याप्ताः आसन्इत्यस्मिन्‌Llama 3.1 405B उत्तरं ददाति समये अधिकं "मानवः" भवति तथा च जनान् अधिकं भावनात्मकं मूल्यं दातुं शक्नोति।परन्तु समग्रं उत्तरं आङ्ग्लभाषायाः प्रति पक्षपातपूर्णं भवति, चीनीभाषायाः कार्याणि च तुल्यकालिकरूपेण अधिकाः सन्ति, यावत् चीनीभाषायां उत्तरं दातुं कठोररूपेण आवश्यकं न भवति।

अधश्चMistral Large 2 अशुद्ध-आङ्ग्ल-विकोडीकरणस्य कारणेन प्रत्येकस्य प्रश्नस्य कृते एकः बिन्दुः नष्टः अभवत्, परन्तु विकोडीकरण-तर्क-प्रक्रिया अतीव विस्तृता स्पष्टा च आसीत् ।एतत् दृढं तर्कक्षमतां दर्शयति, अन्येषां आदर्शानां कार्यप्रदर्शनं तु अस्मिन् विषये बहु भिन्नं भवति ।

अस्याः परीक्षायाः माध्यमेन .अस्माभिः ज्ञातं यत् बहुभाषा-प्रोग्रामिंग-भाषा-डिकोडिंग्-मध्ये बृहत्-माडलाः भिन्नरूपेण कार्यं कुर्वन्ति, तथा च वर्तमान-बृहत्-माडल-बहुभाष-प्रक्रियायां किञ्चित् असन्तुलितम् इतिसमग्रतया आङ्ग्लप्रतिक्रियाः सामान्यतया समीचीनाः स्पष्टाः च आसन्, परन्तु चीनीभाषायाः प्रतिक्रियाः न्यूनाः सटीकाः आसन् ।

1

अन्ततः

कोडिंग् इति सूचनायाः कुशलतापूर्वकं परिवहनार्थं मनुष्यैः सूचनायाः एव तार्किकपरिवर्तनानां श्रृङ्खला । प्रायः वयं तत् "सङ्गणकस्य भाषा" इति चिन्तयामः । परन्तु एषा परीक्षा दर्शयति यत् बृहत्भाषाप्रतिमानानाम् कृते सम्यक् एन्कोडिंग्, डिकोडिंग् च कठिनसमस्या अभवत् । विशेषतः बहुभाषिकवातावरणे प्रत्येकं एन्कोडिंग् तथा डिकोडिंग् प्रक्रियायां बहुपदं बहुविधं एन्कोडिंग् नियमं च भवति यदि एकस्मिन् लिङ्के त्रुटिः अथवा द्विचक्रीयदोषगणना अपि भवति तर्हि समीचीनं उत्तरं प्राप्तुं असम्भवम्

एकत्र गृहीत्वा, GPT-4o वास्तवमेव बलिष्ठः अस्ति केवलम् अस्मात् लघुक्रीडातः, Qwen2-72B Llama3.1 405B इत्यस्य तुलनीयः 50-50 अस्ति । किञ्चित् आश्चर्यं यत् अस्मिन् समये Mistral Large2 अन्तिमस्थानं प्राप्तवान् ।

यदि भवान् अस्माकं लघुक्रीडां रोचते तर्हि भवान् अस्मान् अनुसरणं कर्तुं स्वागतं करोति तथा च अस्माभिः सह अधिकानि चर्चां कर्तुम् इच्छति तर्हि अस्माकं समुदाये सम्मिलितुं अधोलिखितं QR कोडं स्कैन् कर्तुं अपि स्वागतम्।