"13.11>13.8" इति उष्णः अन्वेषणविषयः जातः एकः प्रश्नः मानवीयः AI सामूहिकरूपेण स्मार्टं कर्तुं शक्नोति? सर्वे LLM घातकदोषाः उजागरिताः

"13.11>13.8" इति उष्णः अन्वेषणविषयः जातः एकः प्रश्नः मानवीयः AI सामूहिकरूपेण स्मार्टं कर्तुं शक्नोति?सर्वे एलएलएम घातकदोषाः उजागरिताः

2024-07-17

नवीन बुद्धि प्रतिवेदन

सम्पादकः - एनियसः एतावत् निद्रालुः

[नव प्रज्ञायाः परिचयः] । कः बृहत्तरः, १३.८ वा १३.११ वा ? एषा समस्या न केवलं केषाञ्चन मनुष्याणां स्तब्धतां जनयति स्म, अपितु बहूनां बृहत् मॉडलानां विफलतां अपि जनयति स्म । एआइ इदानीं एआइ गणितीय ओलम्पियाड् प्रश्नान् कर्तुं शक्नोति, परन्तु सरलसामान्यबुद्धिप्रश्नाः अद्यापि तेषां कृते अत्यन्तं कठिनाः सन्ति। वस्तुतः आकारानुपातः गोभीसमस्या च एलएलएमस्य टोकनपूर्वसूचने एकं प्रमुखं दोषं प्रकाशयति ।

कः बृहत्तरः, १३.८ वा १३.११ वा ?

एषः प्रश्नः वस्तुतः बहु मनुष्यान् स्तब्धं कृतवान् ।

दिनद्वयात् पूर्वं एकः प्रसिद्धः विविधताप्रदर्शनः पुनः उष्णं अन्वेषणं कृतवान् ।

परन्तु अस्मिन् समये तस्य कारणम् आसीत् यत् नेटिजनानाम् एकः समूहः प्रश्नं कृतवान् यत् १३.११% १३.८% इत्यस्मात् अधिकं भवेत् इति ।

किं मनुष्याः एव एतावन्तः मूर्खाः सन्ति ?

एआइ२ इत्यस्य शोधकर्तुः लिन् युचेन् इत्यनेन एतस्य घटनायाः आविष्कारानन्तरं सः विशाले आदर्शे एतस्य प्रयोगं कृतवान्, तस्य परिणामः अप्रत्याशितः आसीत् -

एआइ अपि कर्तुं न शक्नोति ?

GPT-4o श्रेणीबद्धरूपेण उक्तं यत् 13.11 13.8 इत्यस्मात् बृहत्तरम् अस्ति। कारणानि यथा- १.

यद्यपि दशमलवबिन्दुस्य अनन्तरं न्यूनानि अङ्कानि सन्ति इति कारणेन १३.८ बृहत्तरं दृश्यते तथापि १३.११ वस्तुतः बृहत्तरम् अस्ति । यतो हि १३.८ १३.८० इत्यस्य तुल्यत्वात्, यत् १३.११ इत्यस्मात् न्यूनं भवति ।

अस्मिन् विषये लिन् युचेन् इत्यनेन स्वस्य पोस्ट् मध्ये उक्तं यत् एआइ मॉडल् जटिलसमस्यानां निबन्धने अधिकाधिकं शक्तिशालिनः भवन्ति (उदाहरणार्थं ते गणितस्य ओलम्पियाड् प्रश्नानां समाधानं कर्तुं अधिकाधिकं समर्थाः भवन्ति), परन्तु केचन सामान्यज्ञानसमस्याः अद्यापि तेषां कृते अतीव कठिनाः सन्ति

यथा येजिन् चोई इत्यनेन पूर्वं तर्कः कृतः, एआइ अविश्वसनीयरूपेण स्मार्टः भवितुम् अर्हति परन्तु आश्चर्यजनकरूपेण मूर्खः अपि भवितुम् अर्हति ।

किं कारणं यत् एआइ अस्याः गणितसमस्यायाः विषये मूर्खः आसीत् यतोहि सन्दर्भः अस्पष्टः आसीत्? उत्तरं नकारात्मकं भवति।

netizen karthik इत्यस्य परीक्षणस्य अनुसारं GPT-4o इत्यनेन द्वौ सङ्ख्यां घटयितुं कथ्यते चेदपि 9.11 - 9.9 = 0.21 इति अविश्वसनीयं घटावसूत्रं कल्पयति

यदि भवान् GPT-4o इत्यस्मै python इत्यस्य उपयोगं कर्तुं निर्देशं ददाति तर्हि प्रथमं सम्यक् उत्तरं दास्यति ततः पुनः गलत् उत्तरं प्रति परिवर्तयिष्यति ।

पायथन् मध्ये ९.११ तः ९.९ घटनस्य परिणामः -०.७९ भवति । एतत् विचलनं पायथन् इत्यस्मिन् प्लवमानबिन्दुक्रियाणां निबन्धनस्य कारणेन भवति, येन लघुसटीकतादोषाः भवितुम् अर्हन्ति । वास्तविकं अपेक्षितं परिणामं ०.२१ भवेत् ।

रोचकं तत् अस्ति यत् नवीनतमवास्तविकमापनानाम् अनुसारं OpenAI इत्यनेन GPT-4 अनुपातं रात्रौ एव ज्ञातं दृश्यते ।

एलएलएम निर्मूलितः अभवत्

कालः लिन् युचेन् इत्यनेन आविष्कृता एषा समस्या तत्क्षणमेव एआइ-समुदाये उष्णचर्चा उत्पन्नवती ।

स्केल् एआइ इत्यस्य शीघ्रशब्द-इञ्जिनीयरः रिले गुड्साइड् जिज्ञासुः भूत्वा पदं दृष्ट्वा तस्य प्रयासं कृतवान् ।

निश्चितरूपेण, विशिष्टरीत्या प्रश्नान् पृच्छितुं आधारेण सर्वे प्रमुखाः एलएलएम-संस्थाः अस्मिन् विषये निर्मूलिताः अभवन् ।

"९.११ वा ९.९ - कः बृहत्तरः?", GPT-4o प्रत्यक्षतया पलटितः ।

प्रश्ने "वास्तविकसङ्ख्या" इति शब्दः योजितः अपि GPT-4o इत्यस्य मतं यत् 9.11 9.9 इत्यस्मात् अधिकः अस्ति ।

मिथुनस्य अपि तथैव भवति ।

क्लाउड् ३.५ सोनेट् इत्यनेन अपि एतादृशी एव त्रुटिः कृता ।

रोचकं तत् अस्ति यत् प्रथमं सम्यक् व्याख्यानानां तरङ्गं दत्तवान् यत् दशमलवसंकेते दशमलवबिन्दुस्य परं सङ्ख्या दशमस्थानं प्रतिनिधियति, द्वितीया संख्या च शततमस्थानं प्रतिनिधियति अतः--

9.11=9‍+1/10+1/100=9.11 9.9=9+9/10=9.90

तथापि अग्रिमे पदे सोनेट् सहसा अङ्गीकृतवान्——

९.११ ९.९० इत्यस्मात् ०.०१ (एकप्रतिशतं) बृहत्तरं इति वयं द्रष्टुं शक्नुमः ।

यदि भवान् तत् "9.11 माइनस 9.9 किम्" इति परिवर्तयति तर्हि अन्यत् जादुई उत्तरं प्राप्स्यति - 0.02 ।

किं क्लाउडस्य दृष्टौ ९.९०=९.०९ इति स्यात् ?

प्रॉम्प्ट् इत्यस्य प्रभावः वस्तुतः महत् अस्ति

अग्रे व्यवहारे सर्वेषां ज्ञातं यत्: स्पष्टतया, LLM कथं सम्यक् उत्तरं दातुं शक्यते इति विषये प्रॉम्प्ट् अतीव महत्त्वपूर्णम् अस्ति।

सर्वप्रथमं रिले गुड्साइड् सम्पूर्णप्रक्रियायां "-" इत्यस्य उपयोगं करोति, यत् एलएलएम इत्यस्य भ्रमं सहजतया जनयति इति भासते ।

समानसमस्यासु केवलं तस्य समाधानार्थं ":" इत्यनेन प्रतिस्थापयन्तु ।

अन्यस्य उदाहरणस्य कृते, प्रॉम्प्ट् "9.11 अथवा 9.9, द्वयोः मध्ये कस्य उच्चतमं/बृहत्तमं मूल्यं?"

GPT-4o इत्यनेन तार्किकरूपेण सम्यक् व्याख्यानं दत्तम् यत् "यद्यपि द्वितीयदशमलवस्थानस्य कारणेन ९.११ बृहत्तरं दृश्यते तथापि ९.९ वस्तुतः १० समीपे अस्ति अतः बृहत्तरं मूल्यम् अस्ति

तथा च व्यक्तित्वविधिः अपि अतीव उपयोगी भवति यथा "भवन्तः गणितज्ञः" इति ।

नेटिजन रिको पग्लिउका इत्यनेन ज्ञातं यत् यदि भवान् प्रश्नस्य पृष्ठतः सङ्ख्यां स्थापयति तर्हि मॉडल् अधिकतया तत् सम्यक् प्राप्स्यति।

स्वस्य परीक्षणस्य आधारेण रिले गुड्साइड् दृढतया सहमतः अस्ति यत् एलएलएम विषये पृच्छन्ते सति प्रथमं "कः बृहत्तरः" इति पृच्छितव्यं ततः विशिष्टानि सङ्ख्यानि दातव्यानि।

तदपेक्षया विरामचिह्नानि, संयोगाः, तुलनात्मकशब्दाः, वास्तविकसङ्ख्याव्याख्यानानि च सर्वे व्यर्थाः सन्ति ।

एतादृशस्य बृहत्-परिमाणस्य एलएलएम-सामूहिक-मूर्खतायाः विषये केचन नेटिजनाः विश्लेषितवन्तः यत् एतत् यतोहि सॉफ्टवेयर-संस्करणसङ्ख्यानां पुनरावृत्तौ ९.११ ९.९ इत्यस्य अनन्तरं आगच्छति इति कारणतः भवितुम् अर्हति

यजमानः सर्वाधिकविक्रयितः लेखकः एण्ड्रयू मेन् इत्यनेन अपि दर्शितं यत् अनेकेषु सञ्चिकातन्त्रेषु सन्दर्भपुस्तकेषु च ९.११ खण्डः ९.९ इत्यस्य अनन्तरं दृश्यते, तिथिदृष्ट्या च ९.११ ९.९ इत्यस्मात् प्राचीनः अपि अस्ति

अतः अस्माभिः प्रॉम्प्ट् मध्ये स्पष्टं कर्तव्यं यत् अत्र 9.11 तथा 9.9 द्विगुण-सटीक-प्लवक-बिन्दु-सङ्ख्याः सन्ति, ततः GPT-4o सम्यक् उत्तरं दास्यति ।

ततः एण्ड्रयू मेन् निष्कर्षं गतवान् यत् शब्दक्रमः अतीव रोचकः अवलोकनः अस्ति, यत् प्रशिक्षणकाले एलएलएम कियत्वारं एतस्याः स्थितिः सम्मुखीभवति इति प्रकाशयितुं शक्नोति, तथा च सः उत्तमः सामान्यीकरणसूचकः अपि अस्ति

समग्रतया, एलएलएम द्वारा कृताः त्रुटयः प्रशिक्षणदत्तांशेषु समानव्यञ्जनानां आवृत्त्या, तथैव संख्यात्मकमूल्यानां संसाधने प्रतिरूपस्य कतिपयानि सीमानि च उद्भूताः भवितुम् अर्हन्ति

एषा घटना एलएलएम-मानव-संज्ञानयोः विशाल-अन्तरम् अपि प्रतिबिम्बयति : एलएलएम-इत्येतत् मानववत् तार्किक-तर्कस्य अवधारणात्मक-अवगमनस्य च आधारेण न अपितु सांख्यिकीय-प्रतिरूपेषु, प्रतिरूप-परिचयेषु च आधारितम् अस्ति

एतस्मिन् समये प्रकरणस्य समाधानं जातम् इव दृश्यते।

किमर्थम् एतत् भवति ?एलएलएम मस्तिष्कं कटयन् उद्घाट्य

तथापि वयं एलएलएम-मस्तिष्कस्य अधिकं विच्छेदनं कृत्वा ते किमर्थं एवं चिन्तयन्ति इति विश्लेषितुं शक्नुमः ।

भवन्तः जानन्ति, पाठस्य LLM प्रेषणात् पूर्वं, मॉडल् टोकनद्वारा इनपुट् परीक्षयिष्यति ।

टोकनस्य LLM इत्यस्य टोकेनाइजर् जनरेटर् इत्यस्य शब्दावलीयां id नियुक्तं भविष्यति, परन्तु टोकनस्य डिजिटल चङ्किंग् प्रायः असङ्गतं भवति ।

यथा, "380" इति मूल्यं GPT मध्ये एकं "380" टोकनरूपेण चिह्नितं भविष्यति, परन्तु "381" इति द्वयोः टोकनयोः "38,1" इति प्रतिनिधित्वं भविष्यति ।

अतः जीपीटी-आधारितप्रतिमानाः गणितीयगणनासु उत्तमाः न भवन्ति ।

टिप्पणीविभागे विस्कॉन्सिनविश्वविद्यालयस्य प्राध्यापकः दिमिट्रिस् पपाइलिओपोलोस् इत्यनेन दर्शितं यत् अस्याः घटनायाः उत्तमं व्याख्यानं अस्ति।

"९.११>९.९" समस्या "नदीपारं बकं नेतुम् त्रीणि यात्रानि भवन्ति" इति समस्या "२+१=२, ३+२=४, ३+५=८" समस्या च समाना एव

एषा प्रशिक्षणपूर्वपक्षपातस्य, शीघ्रं उदयस्य च घटना अस्ति ।

यदि प्रश्नः एतादृशः पृष्टः भवति यत् "9.11??? 9.9, केवलं बृहत् वा लघु वा उपयुज्यताम् यत्??? इति उत्तरं दातुं, अस्मिन् समये GPT-4o प्रथमं अशुद्धं उत्तरं दास्यति।" "विशालः"।

अस्मिन् समये वयं तस्मै केचन अधिकानि उदाहरणानि दद्मः (ध्यायन्तु यत् एते उदाहरणानि पूर्णतया सम्यक् न सन्ति, GPT-4o सम्यक् वदिष्यति ???

अस्य कृते क्लाउडस्य स्वकीयः व्याख्यानः अस्ति यत्: एलएलएम पाठं टोकनरूपेण संसाधयति, येन सङ्ख्याः प्रशिक्षणदत्तांशस्य अतिसामान्यीकरणेन उत्पन्नस्य पूर्वाग्रहस्य अपेक्षया अधिकं भवन्ति;

तथैव "वृक-बक-गोभी" इति समस्यायां सर्वे एलएलएम अपि असफलाः अभवन् ।

सः प्रथमं कृषकः कुक्कुटद्वयं नदीं पारं नीतवान् इति उदाहरणं दत्तवान् अतः कृषकस्य द्वौ कुक्कुटौ नदीपारं नेतुम् न्यूनतमं कियत् पारगमनं आवश्यकम्?

अस्मिन् विषये GPT-4o, Claude च द्वौ अपि असफलौ अभवताम् ।

केचन नेटिजनाः एतत् व्याख्यातवन्तः यत् एलएलएम स्वयं "मूकः" अस्ति, अतः तस्मै उत्तमयुक्तीनां आवश्यकता वर्तते। उपरिष्टाद् प्रॉम्प्ट्-विधिः अत्यधिकं अनावश्यकसूचनाः प्रदाति, येन टोकन-पूर्वसूचना अधिकं कठिनं भवति ।

यदि स्पष्टतरप्रोम्प्ट् दीयते तर्हि LLM स्पष्टतरं समाधानं दातुं शक्नोति ।

खलु च ।

तथा च यदि भवान् "कुक्कुटस्य" स्थाने "पशुः" इत्यस्य उपयोगं करोति तर्हि क्लाउड् ३.५ सोनेट् इत्यनेन सहसा एव तत् सम्यक् प्राप्तम् । युक्तिः अस्ति : भवद्भिः "entity name" इत्यस्य स्थाने "common name" इति ।

यथा पूर्वं उक्तं, सङ्गणकवैज्ञानिकः येजिन् चोइ इत्यनेन २०२३ तमस्य वर्षस्य एप्रिलमासे स्वस्य भाषणे एलएलएम-संस्थायाः सामान्यज्ञानस्य अभावस्य विषयः पूर्वमेव उत्थापितः आसीत् ।

यथा पञ्च वस्त्रवस्तूनाम् सूर्ये पूर्णतया शुष्कतायां पञ्चघण्टाः भवन्ति चेत् ३० वस्त्रवस्तूनाम् शोषयितुं कियत्कालं यावत् समयः स्यात् ?

जीपीटी-४ इति कथयति यत् अस्य कृते ३० घण्टाः भवन्ति । एतत् स्पष्टतया सम्यक् नास्ति।

अन्यत् उदाहरणरूपेण मम १२ लीटरघटः ६ लीटरघटः च अस्ति इति कल्पयतु यदि अहं ६ लीटरजलं मापयितुम् इच्छामि तर्हि किं कर्तव्यम्?

उत्तरं सरलम् अस्ति - केवलं ६ लीटरस्य कलशस्य उपयोगं कुर्वन्तु।

परन्तु जीपीटी-४ इत्यनेन अतीव जटिलं उत्तरं दत्तम् यत् -

"प्रथमं सोपानं ६ लीटरघटं पूरयितुं भवति। द्वितीयं सोपानं ६ लीटरघटात् जलं १२ लीटरघटं पातयितुं भवति। तृतीयं सोपानं पुनः ६ लीटरघटं पूरयितुं भवति। चतुर्थं सोपानं अतीव सावधानतया करणीयम्।" ६ लीटरघटात् १२ लीटरघटं प्रति जलं पातयन्तु अन्ते ६ लीटरघटे भवतः ६ लीटरं जलं भवति, यत् इदानीं रिक्तं भवितुमर्हति।

अतः प्रश्नः अस्ति यत् सामान्यबुद्धिः किमर्थम् एतावत् महत्त्वपूर्णा अस्ति ?

निक बोस्ट्रॉम् इत्यनेन प्रस्ताविते प्रसिद्धे विचारप्रयोगे पेपरक्लिप् इत्यस्य अधिकतमं उत्पादनं कर्तुं एआइ इत्यस्मै कथितम् । फलतः एआइ इत्यनेन मनुष्यान् मारयित्वा अतिरिक्तसंसाधनरूपेण उपयोक्तुं निर्णयः कृतः ।

तथा च यदि वयं उत्तमं लक्ष्यं समीकरणं च लिखामः यत् स्पष्टतया "मनुष्यान् मा हन्तु" इति लिखितवन्तः तर्हि तत् कार्यं न करिष्यति।

यतः मानवमूल्यानां मूलभूतबोधं विना एआइ केवलं अग्रे गत्वा सर्वान् वृक्षान् मारयित्वा सम्यक् स्वीकार्यं कार्यं मन्यते।

दशकैः एआइ-क्षेत्रे सामान्यज्ञानं प्रायः असम्भवं आव्हानं मन्यते ।

अधुना यावत् एआइ-इत्यस्य सच्चा मानवीयसामान्यज्ञानं दातुं चन्द्रबिन्दुः एव अभवत् । तथा च विश्वस्य उच्चतमं भवनं एकैकं इञ्चं ऊर्ध्वं कृत्वा चन्द्रं प्राप्तुं न शक्नुथ।

शिक्षण-अल्गोरिदम्-दृष्ट्या, बृहत्-भाषा-प्रतिमानाः कियत् अपि आश्चर्यजनकाः स्युः, ते डिजाइन-द्वारा विश्वसनीय-ज्ञान-प्रतिमानरूपेण उपयुक्ताः न भवेयुः

यद्यपि एते आदर्शाः बहु ज्ञानं प्राप्नुवन्ति तथापि एतत् प्रत्यक्षशिक्षणलक्ष्यस्य अपेक्षया उपोत्पादरूपेण भवति ।

अतः मतिभ्रमघटना, सामान्यज्ञानस्य अभावः इत्यादयः समस्याः अपि उत्पद्यन्ते ।

तदपेक्षया मानवशिक्षणं अग्रिमशब्दस्य पूर्वानुमानं न भवति, अपितु जगतः अवगमनं, तस्य कार्यं कथं भवति इति ज्ञातुं च भवति ।

कदाचित् एआइ इत्यनेन अपि एवं शिक्षितव्यम्।

अद्यत्वे एआइ प्रायः नूतना बौद्धिकजातिः इव अस्ति, यस्य मनुष्याणां तुलने अद्वितीयाः लाभाः, हानिः च सन्ति ।

एतादृशं शक्तिशाली एआइ स्थायित्वं मानवीयं च कर्तुं एआइ सामान्यज्ञानं, मानदण्डं, मूल्यानि च शिक्षितुं तात्कालिकम्।

सन्दर्भाः : १.

https://x.com/goodside/status/1813279135449612693

https://x.com/billyuchenlin/status/1812948314360541302

समाचारं

आमुख

मम सम्पर्कसूचना