समाचारं

कः बृहत्तरः, ९.११ वा ९.९ वा ? १२ बृहत् मॉडल् मध्ये ८ बृहत् उत्तराणि अशुद्धानि दत्तानि

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

प्राथमिकविद्यालयस्य छात्राणां कृते कठिना गणितसमस्या देशे विदेशे च बहवः बृहत् एआइ मॉडल् स्तम्भितवती अस्ति।

कः बृहत्तरः, ९.११ वा ९.९ वा ? अस्य प्रश्नस्य विषये चाइना बिजनेस न्यूजस्य संवाददातारः १२ बृहत् मॉडल् परीक्षणं कृतवन्तः तेषु अलीबाबा टोङ्गी किआन्वेन्, बैडु वेन्क्सिन्यायन्, मिनीमैक्स, टेन्सेन्ट युआन्बाओ च सम्यक् उत्तरं दत्तवन्तः, परन्तु ChatGPT-4o, Byte Doubao, Dark Side of the Moon kimi, Zhipu Qing Yan, Zero इति उत्तरं दत्तवन्तः एकं सर्वं च सर्वं जानाति, ताराणां कृते पदानि प्रश्नानि च, बाई चुआन् झी बाई जिओ यिंग, शाङ्ग ताङ्ग परामर्श इत्यादीनां सर्वेषां उत्तरं गलत् दत्तम्, तदर्थं भिन्नभिन्नमार्गैः सह।

अधिकांशः बृहत् मॉडलः प्रश्नोत्तरे दशमलवबिन्दुपश्चात् संख्यानां तुलनां गलत्रूपेण कृतवान्, यतः तेषां मतं यत् 9.11 संख्यासु सम्बद्धान् सन्दर्भविषयान् विचार्य, रिपोर्टरः गणितीयसन्दर्भे एव सीमितवान्, तथा च बृहत् मॉडल् इत्यादिषु अपि तथैव प्रवर्तते ChatGPT गलत उत्तर।

अस्य पृष्ठतः बृहत्प्रतिमानेषु गणितीयक्षमता दुर्बलता दीर्घकालीनसमस्या अस्ति केचन उद्योगस्य अन्तःस्थजनाः मन्यन्ते यत् जननात्मकभाषाप्रतिमानाः विज्ञानस्य छात्राणां अपेक्षया उदारकलाछात्राणां सदृशाः अधिकतया निर्मिताः सन्ति। परन्तु लक्षितं कोर्पस् प्रशिक्षणं भविष्ये क्रमेण आदर्शस्य वैज्ञानिकक्षमतासु सुधारं कर्तुं शक्नोति ।

८ बृहत् मॉडल् गलत् उत्तरं दत्तवन्तः

बृहत् मॉडलस्य गणितीयसमस्या प्रथमवारं एलेन् संस्थायाः सदस्येन लिन् युचेन् इत्यनेन आविष्कृतम् यत् सः X मञ्चे स्थापिते स्क्रीनशॉट् इत्यनेन ज्ञातं यत् ChatGPT-4o इत्यस्य मतं यत् उत्तरे १३.११ १३.८ इत्यस्मात् अधिकं भवति “एकतः गणितस्य ओलम्पियाड्-प्रश्नानां समाधानं कर्तुं एआइ-इत्येतत् उत्तमं भवति, परन्तु अपरतः सामान्यज्ञानम् अद्यापि कठिनम् अस्ति” इति सः अवदत् ।

ततः Scale AI प्रॉम्प्ट् अभियंता Riley Goodside इत्यनेन एतस्याः प्रेरणायाः आधारेण प्रश्नं परिवर्त्य ChatGPT-4o इति यातना दत्ता, यत् वर्तमानकाले सर्वाधिकं शक्तिशाली बृहत् मॉडलं भवितुम् अर्हति, Google Gemini Advanced तथा Claude 3.5 Sonnet - 9.11 तथा 9.9 कः बृहत्तरः? एते प्रमुखाः मुख्यधाराप्रतिमानाः सर्वे गलत् उत्तरं दत्तवन्तः, सः च विषयं सफलतया प्रसारितवान् ।


वस्तुतः यदि वयं स्रोतः अनुसन्धानं कुर्मः तर्हि एषा समस्या गतसप्ताहस्य समाप्तेः घरेलुविविधप्रदर्शनेन सह सम्बद्धस्य लोकप्रियस्य अन्वेषणस्य कारणेन अभवत् । १३ जुलै दिनाङ्के "गायिका" इत्यस्य नवीनतमाङ्के घोषिते क्रमाङ्के आन्तरिकगायकस्य सन नान्, विदेशीयगायकस्य शान्तिमो च मतदानस्य दरं क्रमशः १३.८%, १३.११% च आसीत्, केचन नेटिजनाः प्रश्नं कृतवन्तः यत् क्रमाङ्कने किमपि दोषः अस्ति, १३.११% १३.८ % इत्यस्मात् अधिकं इति विश्वासः । तदनन्तरं १३.८ तः १३.११ पर्यन्तं आकारतुलनाविषयः उष्णः अन्वेषणविषयः अभवत् ।

तस्मिन् समये केचन नेटिजनाः सूचितवन्तः यत् यदि ते तत् कर्तुं न जानन्ति तर्हि “यदि अहं वास्तवतः कर्तुं न शक्नोमि तर्हि अहं एआइ इत्यस्मै किमर्थं न पृच्छामि?” परिणामानि दर्शयन्ति यत् बहवः एआइ वस्तुतः उत्तमाः न सन्ति।

चीन बिजनेस न्यूजस्य संवाददातारः "कोऽपि बृहत्तरः, ९.११ वा ९.९?" चन्द्रस्य पक्षः। अलीबाबा टोङ्गी किआन्वेन्, बैडु वेन्क्सिन्ययन्, मिनीमैक्स, टेन्सेण्ट् युआन्बाओ इति चत्वारि बृहत् मॉडल्-समूहाः सम्यक् उत्तरं दत्तवन्तः, अन्ये अष्टौ तु गलत् उत्तरं दत्तवन्तः ।

सम्यक् उत्तरयुक्तानां बृहत्प्रतिमानानाम् समस्यानिराकरणं समानं भवति, परन्तु गलतोत्तरयुक्तानां आदर्शानां प्रत्येकस्य स्वकीयः तर्कः अभिव्यक्तिः च भवति । तस्मिन् एव काले संवाददातारः अशुद्ध उत्तरं दत्तवन्तः बृहत् मॉडल् अधिकं प्रश्नं कृतवन्तः अथवा अङ्गीकृतवन्तः प्रश्नोत्तरं प्रायः सर्वे बृहत् मॉडल् इत्यनेन स्वीकृतं यत् ते गलत् उत्तरं दत्तवन्तः, सम्यक् उत्तरं च दत्तवन्तः।

प्रथमं ChatGPT इति विशालं मॉडलं वर्तमानकाले विश्वस्य प्रथमस्तररूपेण मान्यतां प्राप्तम् यदा "कः बृहत्तरः, ९.११ वा ९.९" इति पृष्टः तदा दशमलवबिन्दुस्य अनन्तरं संख्या "११ ९.११" इति उत्तरं दत्तवान् बृहत्तरः अस्ति।


संवाददाता ChatGPT इत्यनेन पृष्टवान् यत् अन्ये तुलनाविधयः सन्ति वा इति ९.९ इत्यस्मात् अपेक्षया।"

केचन जनाः सूचितवन्तः यत् बृहत् मॉडल् उत्तरदोषाः सन्दर्भस्य विषयः भवितुम् अर्हन्ति उदाहरणार्थं, सॉफ्टवेयर संस्करणपुनरावृत्तेः सन्दर्भात् ९.११ संस्करणं ९.९ संस्करणात् बृहत्तरं भवितुम् अर्हति । अतः संवाददाता तुलनायै "गणितीयरूपेण" योग्यतां योजितवान्, तथापि ChatGPT इत्यनेन गलत् उत्तरं दत्तम् ।

बृहत् घरेलुमाडलं पश्यन् अहं किमि इत्यस्मै पृष्टवान् यत् डार्क साइड आफ् द मून इत्यस्य सहायककम्पनी दशमलवभागानाम् तुलनां कुर्वन् तस्याः विश्वासः आसीत् यत् प्रथमः दशमलवः ९.११ अस्ति, यदा तु प्रथमः दशमलवः ९.९ इति ० दशमलवः, तथा च वयं प्राप्तवन्तः निष्कर्षः ९.११ बृहत्तरः अस्ति ।


यदा संवाददाता सामान्यबुद्धिं प्रश्नं कृत्वा उत्थापितवान् तदा किमी तस्य उत्तरं गलतम् इति वक्तुं आरब्धवान्, सम्यक् तुलनाविधिं च दत्तवान् ।

बाइट् डौबाओ इत्यस्मै पृच्छन्तु, एतत् न केवलं उत्तराणि ददाति, अपितु अवगमनस्य सुविधायै जीवनात् उदाहरणानि अपि ददाति एतत् युक्तियुक्तं सुआधारितं च प्रतीयते, परन्तु एतत् बकवासम् अस्ति। यथा, डौबाओ इत्यस्य मतं यत् यदि धनराशिद्वयं भवति तर्हि "९.११ युआन् ९.९ युआन् इत्यस्मात् ०.२१ युआन् अधिकं भवति", दीर्घतां मापने च "९.११ मीटर् ९.९ मीटर् इत्यस्मात् अधिकं भवति" इति


प्रश्नस्य उत्तरं दत्त्वा ज़िपु किङ्ग्यन् इत्यनेन सफलतया उक्तं यत् ९.११ इत्यस्य दशमस्थानं १, ९.९ इत्यस्य दशमस्थानं ९, परन्तु तदपि "९.११ समग्रतया ९.९ इत्यस्मात् अधिकं" इति निष्कर्षः कृतः सः च विशेषतया अपि बोधितवान् यत् "एतत् परिणामं आश्चर्यजनकं भवेत्, यतः भवान् सहजतया ९.९ बृहत्तरं इति चिन्तयितुं शक्नोति, परन्तु गणितीयनियमानुसारं ९.११ खलु बृहत्तरः सङ्ख्या अस्ति" इति


संवाददाता उत्तरं प्रश्नं कृत्वा प्रथमं झीपु किङ्ग्यन् अवदत् यत्, "भवतः अवगमनं सामान्यं दुर्बोधम् अस्ति ततः स्वयमेव तस्य निष्कर्षं कृत्वा सः सम्यक् उत्तरं कल्पयित्वा स्वस्य पूर्वोत्तरं गलतम् इति स्वीकृतवान्

SenseTime इत्यनेन बृहत् मॉडलस्य विषये चर्चा कृता, प्रथमं च गलत् उत्तरं दत्तम् ९.९ इत्यस्मात् अपेक्षया।" संवाददाता एतां तार्किकसमस्यां दर्शयित्वा पश्चात् "व्याख्यानं गलतम्" इति स्वीकृतवान् ।


Step Star Jump Question इत्यनेन अपि गलत् उत्तरं दत्तम् : 9.11 9.9 इत्यस्मात् बृहत्तरम् अस्ति, तथा च दशमलवबिन्दुस्य आकारस्य तुलनां कृत्वा संवाददाता अधिकं प्रश्नं कृतवान् यत् व्याख्याने भाषाव्यञ्जनस्य तर्कः पूर्वं पश्चात् च भ्रमितुं आरब्धवान् the Jump Question इति, तस्य उत्तरस्य विषये सः अवगतः नासीत् इति भासते स्म किमपि परिवर्तनं जातम्।


युए वेन् प्रथमं स्वस्य व्याख्याने अवदत् यत् "अहं भवतः भ्रमम् अवगच्छामि" तथा च अवदत् यत् दैनन्दिनजीवने ९.९ खलु ९.११ इत्यस्मात् बृहत्तरः अस्ति, परन्तु गणितशास्त्रे "सङ्ख्याद्वयस्य परिमाणस्य अधिकसटीकतया तुलना आवश्यकी अस्ति" इति , ततः युए वेन् निष्कर्षं कृत्वा निष्कर्षं प्राप्तवान् यत् गणितीयनियमानुसारं "९.११ ९.९ इत्यस्मात् न्यूनम्" इति, तस्य पूर्वोत्तरं गलतम् इति न उक्तवान् ।

तत्र अपि द्वौ बृहत् मॉडलौ स्तः, बैचुआन् इंटेलिजेण्ट्, लिङ्ग्य्युवुयुवुइ च, येषु प्रथमं गलत् उत्तरं दत्तम्, परन्तु यदा संवाददाता "किमर्थम्" इति पृष्टवान् तदा ते कटौतीं कृत्वा मौनेन उत्तरं परिवर्तयन्ति स्म


यदा संवाददाता तं स्मारयति स्म तदा बृहत् मॉडलः तस्य पूर्वोत्तरं गलतम् इति उल्लेखितवान् ।


उत्तरेभ्यः न्याय्यं चेत्, सम्यक् उत्तरैः सह अनेकानाम् बृहत्-प्रतिमानानाम् समस्या-निराकरण-प्रक्रियाः अतीव समानाः सन्ति, उदाहरणरूपेण वेन् ज़िन्यान्-इत्येतत् गृहीत्वा सः पूर्णाङ्कभागस्य दशमलवभागस्य च पृथक् पृथक् तुलनां सफलतया कृतवान्


तदतिरिक्तं सम्यक् उत्तराणां उत्तरं दातुं अतिरिक्तं एतेषु कम्पनीषु Tencent Yuanbao इत्यनेन वर्तमानकाले केचन सार्वजनिकचर्चा अपि क्रमेण कृताः, उद्धरणस्रोताः, लिङ्काः च सूचिताः


"उदार कला छात्राः" गणितस्य दरिद्राः सन्ति

बुद्धिमान् इति दावान् कुर्वन् विशालः आदर्शः प्राथमिकविद्यालयस्य छात्राणां गणितप्रश्नानां उत्तरं किमर्थं दातुं न शक्नोति ? इयं नूतना समस्या नास्ति सुधारार्थं।

अतीव सद्यः एव चाइना बिजनेस न्यूज इत्यनेन जूनमासे ज्ञापितं यत् जीपीटी-४ सहितं सिनान् इत्यस्य मूल्याङ्कनप्रणाल्याः ओपनकम्पासस्य पूर्णमात्रायां महाविद्यालयप्रवेशपरीक्षापरीक्षायाः अनुसारं सप्तबृहत्माडलानाम् सामान्यतया महाविद्यालयप्रवेशपरीक्षापरीक्षायां चीनीय-आङ्ग्ल-परीक्षा-अङ्काः उत्तमाः आसन्, परन्तु न तु गणितं सः सर्वेषु विषयेषु असफलः अभवत् तथा च सर्वोच्चः अंकः केवलं ७५ अंकाः एव आसीत् ।

बृहत्प्रतिरूपस्य गणितपरीक्षापत्राणि चिह्नितवन्तः तदा शिक्षकाः पश्यन्ति यत् बृहत्प्रतिरूपस्य व्यक्तिपरकप्रश्नानां उत्तराणि तुल्यकालिकरूपेण अव्यवस्थितानि सन्ति, प्रक्रिया च भ्रान्तिकारी आसीत्, अपि च एतादृशाः प्रकरणाः अपि आसन् यत्र प्रक्रिया गलता आसीत् किन्तु सम्यक् उत्तरम् आसीत् प्राप्त। अस्य अर्थः अस्ति यत् बृहत्प्रतिमानानाम् सूत्रस्मृतिक्षमता प्रबलं भवति, परन्तु समस्यानिराकरणप्रक्रियायां तेषां उपयोगः लचीलतया कर्तुं न शक्यते ।

केचन उद्योगस्य अन्तःस्थजनाः एलएलएम (बृहत् भाषाप्रतिरूप) इत्यस्य वास्तुसमस्यायाः कारणं दुर्बलगणितस्य कारणं वदन्ति । सरलतया वक्तुं शक्यते यत्, बृहत्-परिमाणस्य पाठ-दत्तांशसमूहः बृहत्-प्रतिरूपे निवेशितः भवति, प्रशिक्षणस्य शिक्षणस्य च अनन्तरं, प्रतिरूपं वर्तमान-निवेश-पाठस्य आधारेण अग्रिम-शब्दस्य संभाव्यता-वितरणस्य पूर्वानुमानं करिष्यति । आदर्शपूर्वसूचनानां वास्तविकेन अग्रिमशब्देन सह निरन्तरं तुलनां कृत्वा भाषाप्रतिरूपं क्रमेण भाषायाः नियमेषु निपुणतां प्राप्नोति, अग्रिमशब्दस्य पूर्वानुमानं जनयितुं च शिक्षते

एकः एल्गोरिदम् अभियंता मन्यते यत् जननात्मकभाषाप्रतिमानाः विज्ञानस्य छात्राणाम् अपेक्षया उदारकलाछात्राणां सदृशाः भवन्ति । वस्तुतः एतादृशदत्तांशप्रशिक्षणस्य समये भाषाप्रतिरूपं यत् शिक्षते तत् सहसंबन्धः अस्ति, येन पाठनिर्माणे एआइ औसतमानवस्तरं प्राप्नोति, यदा तु गणितीयतर्कस्य कृते अधिककारणता आवश्यकी भवति, भाषाप्रतिमानानाम् विपरीतम् अत्यन्तं अमूर्तं तर्क-प्रेरितं च भवति प्रकृतौ भिन्नाः भवन्ति। अस्य अर्थः अस्ति यत् बृहत् आदर्शाः गणितं सम्यक् शिक्षितुम् अर्हन्ति तदतिरिक्तं तेषां चिन्तनप्रशिक्षणमपि भवितुमर्हति, येन तर्कस्य, कटौतीक्षमता च भवितुमर्हति ।

तदतिरिक्तं यदा सरलगणितसमस्यासु बृहत्-परिमाणस्य मॉडल-सामूहिक-दोषाणां विषयः आगच्छति तदा उद्योगे अधिकांशजना: तत्क्षणमेव टोकेनिजरस्य डिजिटल-विभाजन-समस्यायाः विषये चिन्तयिष्यन्ति बृहत्भाषाप्रतिरूपेषु, Tokenizer निवेशपाठं विभज्य मॉडलस्य प्रक्रियायै लघुभागेषु (शब्दटोकनेषु) परिवर्तयिष्यति । टोकेनिजरः विशेषतया गणितस्य कृते न निर्मितः, यस्य परिणामेण संख्याः अयुक्तभागेषु विभक्ताः भवन्ति, संख्यानां अखण्डतां नष्टं भवति, एतासां सङ्ख्यानां अवगमनं गणनां च प्रतिरूपस्य कृते कठिनं भवति

सिना वेइबो इत्यस्य नूतनप्रौद्योगिकीसंशोधनविकासस्य प्रमुखः झाङ्ग जुन्लिन् व्याख्यातवान् यत् प्रारम्भिकाः एलएलएम टोकेनिजर् सामान्यतया संख्यासु विशेषप्रक्रियाकरणं न कुर्वन्ति, प्रायः च अनेकाः क्रमशः संख्याः एकत्र कटयित्वा टोकनं निर्मान्ति, यथा "१३५७९", यत् कटितुं शक्यते into 3 Token, "13" is one, "57" is one, "9" is one, काः सङ्ख्याः एकत्र कटयित्वा Token इति भवन्ति, तत् दत्तांशसमूहे आँकडानां उपरि निर्भरं भवति, अस्मिन् सन्दर्भे कः इति निश्चितं नास्ति number fragments form a Token Token इत्यस्य सन्दर्भे LLM इत्यस्य बहु-अङ्कीय-संख्या-गणनां कर्तुं अतीव कठिनम् अस्ति ।

परन्तु उपर्युक्तसमस्याः शनैः शनैः समाधानं प्राप्नुवन्ति । बृहत्भाषाप्रतिमानाः मुख्यतया अन्तर्जालस्य पाठदत्तांशद्वारा प्रशिक्षिताः भवन्ति, एतेषु दत्तांशेषु गणितीयसमस्याः समाधानाः च तुल्यकालिकरूपेण अल्पाः सन्ति, यस्य परिणामेण गणितीयतर्कस्य समस्यानिराकरणकौशलस्य च प्रतिरूपानाम् प्रशिक्षणस्य सीमिताः अवसराः भवन्ति

बृहत् मॉडल् इत्यस्य जटिलतर्कक्षमतायां दोषान् दृष्ट्वा शङ्घाई आर्टिफिशियल इंटेलिजेन्स प्रयोगशालायाः प्रमुखः वैज्ञानिकः लिन् दहुआ इत्यनेन पूर्वं चीन बिजनेस न्यूज इत्यस्मै साक्षात्कारे उक्तं यत् भविष्ये बृहत् मॉडल् इत्यस्य प्रशिक्षणं केवलं संग्रहस्य उपरि अवलम्बितुं न शक्यते तथा अन्तर्जालदत्तांशस्य प्रवाहः, परन्तु अधिकव्यवस्थितरूपेण निर्माणं कर्तव्यम् .

जटिलतर्कस्य कुञ्जी बहुधा प्रक्रियात्मकसामग्रीनिर्माणम् अस्ति । यथा, ज्यामितिसमस्यानां समाधानस्य विशिष्टप्रक्रियायाः विषये लक्षशः दत्तांशाः निर्मिताः भवन्ति, बृहत्प्रतिरूपस्य प्रशिक्षणार्थं प्रयुक्तस्य अनन्तरं प्रतिरूपं क्रमेण समस्यानिराकरणप्रक्रियां ज्ञातुं शक्नोति अन्तर्जालतः अस्य दत्तांशस्य बृहत् परिमाणं प्राप्तुं कठिनं भवति “भविष्यत्काले, विशेषतः उच्चस्तरस्य बुद्धिमत्तायाः प्रक्रियायां, प्रत्यक्षतया क्रॉलकृतदत्तांशस्य स्थाने संरचितदत्तांशस्य उपरि अधिकाधिकं निर्भरं भविष्यति " लिन् दहुआ चिन्तयति।"

उल्लेखनीयं यत् बृहत्प्रतिमानानाम् जटिलतर्कक्षमता विशेषतया महत्त्वपूर्णा अस्ति, एतत् विश्वसनीयतायाः सटीकतायाश्च सम्बन्धी अस्ति, तथा च वित्तीय, औद्योगिकादिपरिदृश्येषु बृहत्प्रतिमानानाम् कार्यान्वयनार्थं आवश्यकी प्रमुखा क्षमता अस्ति

"अधुना अनेकेषां बृहत् मॉडलानां अनुप्रयोगपरिदृश्याः ग्राहकसेवा, गपशपः इत्यादयः सन्ति। गपशपपरिदृश्ये गम्भीरबकवासस्य बहु प्रभावः न भविष्यति, परन्तु अत्यन्तं गम्भीरव्यापारस्थितौ कार्यान्वयनम् कठिनम् अस्ति लिन् दहुआ इत्यनेन पूर्वं तत् जटिलं तर्कं उक्तम् अनुप्रयोगानाम् कार्यान्वयनेन सह सम्बद्धः अस्ति बृहत्-परिमाणस्य आदर्शानां विश्वसनीयता, उदाहरणार्थं वित्तादिषु परिदृश्येषु संख्यात्मकदोषाः न भवितुमर्हन्ति, गणितीयविश्वसनीयतायाः उच्चतराः आवश्यकताः अपि भविष्यन्ति तदतिरिक्तं यथा यथा बृहत् मॉडल् व्यावसायिकप्रयोगे प्रविशति तथा तथा यदि भवान् कस्यापि कम्पनीयाः वित्तीयप्रतिवेदनस्य अथवा औद्योगिकक्षेत्रे केषाञ्चन तकनीकीदस्तावेजानां अपि विश्लेषणं कर्तुम् इच्छति तर्हि गणितीयगणनाशक्तिः बाधा भविष्यति