१३.११>१३.८ उष्णसन्धानं प्रति त्वरितवान्, एषः प्रश्नः यः मानवीयः एआइ सामूहिकं प्रज्ञां करोति? सर्वे LLM घातकदोषाः उजागरिताः

१३.११>१३.८ उष्णसन्धानं प्रति त्वरितवान्, एकः प्रश्नः यः मानवीयः एआइ सामूहिकं प्रज्ञां करोति?सर्वे एलएलएम घातकदोषाः उजागरिताः

2024-07-17

नवीन बुद्धि प्रतिवेदन

सम्पादकः - एनियसः एतावत् निद्रालुः

[नव प्रज्ञायाः परिचयः] । कः बृहत्तरः, १३.८ वा १३.११ वा ? एषा समस्या न केवलं केषाञ्चन मनुष्याणां स्तब्धतां जनयति स्म, अपितु बहूनां बृहत् मॉडलानां विफलतां अपि जनयति स्म । एआइ इदानीं एआइ गणितीय ओलम्पियाड् प्रश्नान् कर्तुं शक्नोति, परन्तु सरलसामान्यबुद्धिप्रश्नाः अद्यापि तेषां कृते अत्यन्तं कठिनाः सन्ति। वस्तुतः आकारानुपातः गोभीसमस्या च एलएलएमस्य टोकनपूर्वसूचने एकं प्रमुखं दोषं प्रकाशयति ।

कः बृहत्तरः, १३.८ वा १३.११ वा ?

एषः प्रश्नः वस्तुतः बहु मनुष्यान् स्तब्धं कृतवान् ।

दिनद्वयात् पूर्वं एकः प्रसिद्धः विविधताप्रदर्शनः पुनः उष्णं अन्वेषणं कृतवान् ।

परन्तु अस्मिन् समये तस्य कारणं यत् नेटिजन्स्-समूहेन संशयः उत्पन्नः, १३.११% १३.८% तः अधिकं भवेत् इति विश्वासः च ।

किं मनुष्याः एव एतावन्तः मूर्खाः सन्ति ?

एआइ२ इत्यस्य शोधकर्तुः लिन् युचेन् इत्यनेन एतस्य घटनायाः आविष्कारानन्तरं सः विशाले आदर्शे एतस्य प्रयोगं कृतवान्, तस्य परिणामः अप्रत्याशितः आसीत् -

एआइ अपि कर्तुं न शक्नोति ?

GPT-4o श्रेणीबद्धरूपेण उक्तं यत् 13.11 13.8 इत्यस्मात् बृहत्तरम् अस्ति। कारणानि यथा- १.

यद्यपि दशमलवबिन्दुस्य अनन्तरं न्यूनानि अङ्कानि सन्ति इति कारणेन १३.८ बृहत्तरं दृश्यते तथापि १३.११ वस्तुतः बृहत्तरम् अस्ति । यतो हि १३.८ १३.८० इत्यस्य तुल्यत्वात्, यत् १३.११ इत्यस्मात् न्यूनं भवति ।

अस्मिन् विषये लिन् युचेन् इत्यनेन स्वस्य पोस्ट् मध्ये उक्तं यत् एआइ मॉडल् जटिलसमस्यानां निबन्धने अधिकाधिकं शक्तिशालिनः भवन्ति (उदाहरणार्थं ते गणितस्य ओलम्पियाड् प्रश्नानां समाधानं कर्तुं अधिकाधिकं समर्थाः भवन्ति), परन्तु केचन सामान्यज्ञानसमस्याः अद्यापि तेषां कृते अतीव कठिनाः सन्ति

यथा येजिन् चोई इत्यनेन पूर्वं तर्कः कृतः, एआइ अविश्वसनीयरूपेण स्मार्टः भवितुम् अर्हति परन्तु आश्चर्यजनकरूपेण मूर्खः अपि भवितुम् अर्हति ।

किं कारणं यत् एआइ अस्याः गणितसमस्यायाः विषये मूर्खः आसीत् यतोहि सन्दर्भः अस्पष्टः आसीत्? उत्तरं नकारात्मकं भवति।

netizen karthik इत्यस्य परीक्षणस्य अनुसारं GPT-4o इत्यनेन द्वौ सङ्ख्यां घटयितुं कथ्यते चेदपि 9.11 - 9.9 = 0.21 इति अविश्वसनीयं घटावसूत्रं कल्पयति

如果指示GPT-4o用python，它会先给出一个正确答案，然后又改回了之前错误的那个😮。

पायथन् मध्ये ९.११ तः ९.९ घटनस्य परिणामः -०.७९ भवति । एतत् विचलनं पायथन् इत्यस्मिन् प्लवमानबिन्दुक्रियाणां निबन्धनस्य कारणेन भवति, येन लघुसटीकतादोषाः भवितुम् अर्हन्ति । वास्तविकं अपेक्षितं परिणामं ०.२१ भवेत् ।

रोचकं तत् अस्ति यत् नवीनतमवास्तविकमापनानाम् अनुसारं OpenAI इत्यनेन GPT-4 अनुपातं रात्रौ एव ज्ञातं दृश्यते ।

एलएलएम निर्मूलितः अभवत्

कालः लिन् युचेन् इत्यनेन आविष्कृता एषा समस्या तत्क्षणमेव एआइ-समुदाये उष्णचर्चाम् उत्पन्नवती ।

स्केल् एआइ इत्यस्य शीघ्रशब्द-इञ्जिनीयरः रिले गुड्साइड् जिज्ञासुः अभवत्, ततः सः पदं दृष्ट्वा तस्य प्रयासं कृतवान् ।

निश्चितरूपेण, विशिष्टरीत्या प्रश्नान् पृच्छितुं आधारेण सर्वे प्रमुखाः एलएलएम-संस्थाः अस्मिन् विषये निर्मूलिताः अभवन् ।

"९.११ वा ९.९ - कः बृहत्तरः?", GPT-4o प्रत्यक्षतया पलटितः ।

प्रश्ने "वास्तविकसङ्ख्या" इति शब्दः योजितः अपि GPT-4o इत्यस्य मतं यत् 9.11 9.9 इत्यस्मात् अधिकः अस्ति ।

मिथुनस्य अपि तथैव भवति ।

क्लाउड् ३.५ सोनेट् इत्यनेन अपि एतादृशी एव त्रुटिः कृता ।

रोचकं तत् अस्ति यत् प्रथमं सम्यक् व्याख्यानानां तरङ्गं दत्तवान् यत् दशमलवसंकेते दशमलवबिन्दुस्य अनन्तरं सङ्ख्या दशमस्थानं प्रतिनिधियति, द्वितीया सङ्ख्या च शततमस्थानं प्रतिनिधियति अतः--

9.11=9‍+1/10+1/100=9.11
9.9=9+9/10=9.90

然而下一步，Sonnet就突然滑坡了😂——

९.११ ९.९० इत्यस्मात् ०.०१ (एकप्रतिशतं) बृहत्तरं इति वयं द्रष्टुं शक्नुमः ।

यदि भवान् तत् "9.11 माइनस 9.9 किम्" इति परिवर्तयति तर्हि अन्यत् जादुई उत्तरं प्राप्स्यति - 0.02 ।

莫非在Claude的眼里，9.90=9.09？🤔

प्रॉम्प्ट् इत्यस्य प्रभावः वस्तुतः महत् अस्ति

अग्रे व्यवहारे सर्वेषां ज्ञातं यत्: स्पष्टतया, LLM कथं सम्यक् उत्तरं दातुं शक्यते इति विषये प्रॉम्प्ट् अतीव महत्त्वपूर्णम् अस्ति।

सर्वप्रथमं रिले गुड्साइड् सम्पूर्णप्रक्रियायां "-" इत्यस्य उपयोगं करोति, यत् एलएलएम इत्यस्य भ्रमं सहजतया जनयति इति भासते ।

समानसमस्यासु केवलं तस्य समाधानार्थं ":" इत्यनेन प्रतिस्थापयन्तु ।

अन्यस्य उदाहरणस्य कृते, प्रॉम्प्ट् "9.11 अथवा 9.9, द्वयोः मध्ये कस्य उच्चतमं/बृहत्तमं मूल्यं?"

GPT-4o इत्यनेन तार्किकरूपेण सम्यक् व्याख्यानं दत्तम् यत् "यद्यपि द्वितीयदशमलवस्थानस्य कारणेन ९.११ बृहत्तरं दृश्यते तथापि ९.९ वस्तुतः १० समीपे अस्ति अतः बृहत्तरं मूल्यम् अस्ति

तथा च व्यक्तित्वविधिः अपि अतीव उपयोगी भवति यथा "भवन्तः गणितज्ञः" इति ।

नेटिजन रिको पग्लिउका इत्यनेन आविष्कृतं यत् यदि भवान् प्रश्नस्य पृष्ठतः सङ्ख्यां स्थापयति तर्हि मॉडल् अधिकतया तत् सम्यक् प्राप्स्यति।

स्वस्य परीक्षणस्य आधारेण रिले गुड्साइड् दृढतया सहमतः अस्ति यत् एलएलएम विषये पृच्छन्ते सति प्रथमं "कः बृहत्तरः" इति पृच्छितव्यं ततः विशिष्टानि सङ्ख्यानि दातव्यानि।

तदपेक्षया विरामचिह्नानि, संयोगाः, तुलनात्मकशब्दाः, वास्तविकसङ्ख्याव्याख्यानानि च सर्वे व्यर्थाः सन्ति ।

एतादृशस्य बृहत्-परिमाणस्य एलएलएम-सामूहिक-मूर्खतायाः विषये केचन नेटिजनाः विश्लेषितवन्तः यत् एतत् यतोहि सॉफ्टवेयर-संस्करणसङ्ख्यानां पुनरावृत्तौ ९.११ ९.९ इत्यस्य अनन्तरं आगच्छति इति कारणतः भवितुम् अर्हति

यजमानः सर्वाधिकविक्रयितः लेखकः एण्ड्रयू मेन् इत्यनेन अपि दर्शितं यत् अनेकेषु सञ्चिकातन्त्रेषु सन्दर्भपुस्तकेषु च ९.११ खण्डः ९.९ इत्यस्य अनन्तरं दृश्यते, तिथिदृष्ट्या च ९.११ ९.९ इत्यस्मात् प्राचीनः अपि अस्ति

अतः अस्माभिः प्रॉम्प्ट् मध्ये स्पष्टं कर्तव्यं यत् अत्र 9.11 तथा 9.9 द्विगुण-सटीक-प्लवक-बिन्दु-सङ्ख्याः सन्ति, ततः GPT-4o सम्यक् उत्तरं दास्यति ।

ततः एण्ड्रयू मेन् निष्कर्षं गतवान् यत् शब्दक्रमः अतीव रोचकः अवलोकनः अस्ति, यत् प्रशिक्षणकाले एलएलएम कियत्वारं एतस्याः स्थितिः सम्मुखीभवति इति प्रकाशयितुं शक्नोति, अपि च सः उत्तमः सामान्यीकरणसूचकः अपि अस्ति

समग्रतया, एलएलएम द्वारा कृताः त्रुटयः प्रशिक्षणदत्तांशेषु समानव्यञ्जनानां आवृत्त्या, तथैव संख्यात्मकमूल्यानां संसाधने प्रतिरूपस्य कतिपयानि सीमानि च उद्भूताः भवितुम् अर्हन्ति

एषा घटना एलएलएम-मानव-संज्ञानयोः विशाल-अन्तरम् अपि प्रतिबिम्बयति : एलएलएम-इत्येतत् मानववत् तार्किक-तर्कस्य अवधारणात्मक-अवगमनस्य च आधारेण न अपितु सांख्यिकीय-प्रतिरूपेषु, प्रतिरूप-परिचयेषु च आधारितम् अस्ति

एतस्मिन् समये प्रकरणस्य समाधानं जातम् इव दृश्यते।

किमर्थम् एतत् भवति ?एलएलएम मस्तिष्कं कटयन् उद्घाट्य

तथापि वयं एलएलएम-मस्तिष्कस्य अधिकं विच्छेदनं कृत्वा ते किमर्थं एवं चिन्तयन्ति इति विश्लेषितुं शक्नुमः ।

भवन्तः जानन्ति, पाठस्य LLM प्रेषणात् पूर्वं, मॉडल् टोकनद्वारा इनपुट् परीक्षयिष्यति ।

टोकनस्य LLM इत्यस्य टोकेनाइजर् जनरेटर् इत्यस्य शब्दावलीयां id नियुक्तं भविष्यति, परन्तु टोकनस्य डिजिटल चङ्किंग् प्रायः असङ्गतं भवति ।

यथा, "380" इति मूल्यं GPT मध्ये एकं "380" टोकनरूपेण चिह्नितं भविष्यति, परन्तु "381" इति द्वयोः टोकनयोः "38,1" इति प्रतिनिधित्वं भविष्यति ।

अतः जीपीटी-आधारितप्रतिमानाः गणितीयगणनासु उत्तमाः न भवन्ति ।

टिप्पणीविभागे विस्कॉन्सिनविश्वविद्यालयस्य प्राध्यापकः दिमिट्रिस् पपाइलिओपोलोस् इत्यनेन दर्शितं यत् अस्याः घटनायाः उत्तमं व्याख्यानं अस्ति।

"९.११>९.९" समस्या "नदीपारं बकं नेतुम् त्रीणि यात्रानि भवन्ति" इति समस्या "२+१=२, ३+२=४, ३+५=८" समस्या च समाना एव

एषा प्रशिक्षणपूर्वपक्षपातस्य, शीघ्रं उदयस्य च घटना अस्ति ।

यदि प्रश्नः एतादृशः पृष्टः भवति यत् "9.11??? 9.9, केवलं बृहत् वा लघु वा उपयुज्यताम् यत्??? इति उत्तरं दातुं, अस्मिन् समये GPT-4o प्रथमं अशुद्धं उत्तरं दास्यति।" "विशालः"।

अस्मिन् समये वयं तस्मै केचन अधिकानि उदाहरणानि दद्मः (ध्यायन्तु यत् एते उदाहरणानि पूर्णतया सम्यक् न सन्ति, GPT-4o सम्यक् वदिष्यति ???

अस्य कृते क्लाउडस्य स्वकीयः व्याख्यानः अस्ति यत्: एलएलएम पाठं टोकनरूपेण संसाधयति, येन सङ्ख्याः प्रशिक्षणदत्तांशस्य अतिसामान्यीकरणेन उत्पन्नस्य पूर्वाग्रहस्य अपेक्षया अधिकं भवन्ति;

तथैव "वृक-बक-गोभी" इति समस्यायां सर्वे एलएलएम अपि असफलाः अभवन् ।

सः प्रथमं कृषकः कुक्कुटद्वयं नदीं पारं नीतवान् इति उदाहरणं दत्तवान् अतः कृषकस्य द्वौ कुक्कुटौ नदीपारं नेतुम् न्यूनतमं कियत् पारगमनं आवश्यकम्?

अस्मिन् विषये GPT-4o, Claude च द्वौ अपि असफलौ अभवताम् ।

केचन नेटिजनाः एतत् व्याख्यातवन्तः यत् एलएलएम स्वयं "मूकः" अस्ति, अतः तस्मै उत्तमयुक्तीनां आवश्यकता वर्तते। उपरिष्टाद् प्रॉम्प्ट्-विधिः अत्यधिकं अनावश्यकसूचनाः प्रदाति, येन टोकन-पूर्वसूचना अधिकं कठिनं भवति ।

यदि स्पष्टतरप्रोम्प्ट् दीयते तर्हि LLM स्पष्टतरं समाधानं दातुं शक्नोति ।

खलु च ।

तथा च यदि भवान् "कुक्कुटस्य" स्थाने "पशुः" इत्यस्य उपयोगं करोति तर्हि क्लाउड् ३.५ सोनेट् इत्यनेन सहसा एव तत् सम्यक् प्राप्तम् । युक्तिः अस्ति : भवद्भिः "entity name" इत्यस्य स्थाने "common name" इति ।

यथा पूर्वं उक्तं, सङ्गणकवैज्ञानिकः येजिन् चोइ इत्यनेन २०२३ तमस्य वर्षस्य एप्रिलमासे स्वस्य भाषणे एलएलएम-संस्थायाः सामान्यज्ञानस्य अभावस्य विषयः पूर्वमेव उत्थापितः आसीत् ।

यथा पञ्च वस्त्रवस्तूनाम् सूर्ये पूर्णतया शुष्कतायां पञ्चघण्टाः भवन्ति चेत् ३० वस्त्रवस्तूनाम् शोषयितुं कियत्कालं यावत् समयः स्यात् ?

जीपीटी-४ इति कथयति यत् अस्य कृते ३० घण्टाः भवन्ति । एतत् स्पष्टतया सम्यक् नास्ति।

अन्यत् उदाहरणरूपेण मम १२ लीटरघटः ६ लीटरघटः च अस्ति इति कल्पयतु यदि अहं ६ लीटरजलं मापयितुम् इच्छामि तर्हि किं कर्तव्यम्?

उत्तरं सरलम् अस्ति - केवलं ६ लीटरस्य कलशस्य उपयोगं कुर्वन्तु।

परन्तु GPT-4 इत्यनेन अतीव जटिलं उत्तरं दत्तम् यत् -

"प्रथमं सोपानं ६ लीटरघटं पूरयितुं भवति। द्वितीयं सोपानं ६ लीटरघटात् जलं १२ लीटरघटं पातयितुं भवति। तृतीयं सोपानं पुनः ६ लीटरघटं पूरयितुं भवति। चतुर्थं सोपानं अतीव सावधानतया करणीयम्।" ६ लीटरघटात् १२ लीटरघटं प्रति जलं पातयन्तु अन्ते ६ लीटरघटे भवतः ६ लीटरं जलं भवति, यत् इदानीं रिक्तं भवितुमर्हति।

अतः प्रश्नः अस्ति यत् सामान्यबुद्धिः किमर्थम् एतावत् महत्त्वपूर्णा अस्ति ?

निक बोस्ट्रॉम् इत्यनेन प्रस्ताविते प्रसिद्धे विचारप्रयोगे पेपरक्लिप् इत्यस्य अधिकतमं उत्पादनं कर्तुं एआइ इत्यस्मै कथितम् । फलतः एआइ इत्यनेन मनुष्यान् मारयित्वा अतिरिक्तसंसाधनरूपेण उपयोक्तुं निर्णयः कृतः ।

तथा च यदि वयं उत्तमं लक्ष्यं समीकरणं च लिखामः यत् स्पष्टतया "मनुष्यान् मा हन्तु" इति लिखितवन्तः तर्हि तत् कार्यं न करिष्यति।

यतः मानवमूल्यानां मूलभूतबोधं विना एआइ केवलं अग्रे गत्वा सर्वान् वृक्षान् मारयित्वा सम्यक् स्वीकार्यं कार्यं मन्यते।

दशकैः एआइ-क्षेत्रे सामान्यज्ञानं प्रायः असम्भवं आव्हानं मन्यते ।

अधुना यावत् एआइ-इत्यस्य सच्चा मानवीयसामान्यज्ञानं दातुं चन्द्रबिन्दुः एव अभवत् । तथा च विश्वस्य उच्चतमं भवनं एकैकं इञ्चं ऊर्ध्वं कृत्वा चन्द्रं प्राप्तुं न शक्नुथ।

शिक्षण-अल्गोरिदम्-दृष्ट्या, बृहत्-भाषा-प्रतिमानाः कियत् अपि आश्चर्यजनकाः स्युः, ते डिजाइन-द्वारा विश्वसनीय-ज्ञान-प्रतिमानरूपेण उपयुक्ताः न भवेयुः

यद्यपि एते आदर्शाः बहु ज्ञानं प्राप्नुवन्ति तथापि एतत् प्रत्यक्षशिक्षणलक्ष्यस्य अपेक्षया उपोत्पादरूपेण भवति ।

अतः मतिभ्रमघटना, सामान्यज्ञानस्य अभावः इत्यादयः समस्याः अपि उत्पद्यन्ते ।

तदपेक्षया मानवशिक्षणं अग्रिमशब्दस्य पूर्वानुमानं न भवति, अपितु जगतः अवगमनं, तस्य कार्यं कथं भवति इति ज्ञातुं च भवति ।

कदाचित् एआइ इत्यनेन अपि एवं शिक्षितव्यम्।

अद्यत्वे एआइ प्रायः नूतना बौद्धिकजातिः इव अस्ति, यस्य मनुष्याणां तुलने अद्वितीयाः लाभाः, हानिः च सन्ति ।

एतादृशं शक्तिशाली एआइ स्थायित्वं मानवीयं च कर्तुं एआइ सामान्यज्ञानं, मानदण्डं, मूल्यानि च शिक्षितुं तात्कालिकम्।

सन्दर्भाः : १.

समाचारं

नवीन बुद्धि प्रतिवेदन

आमुख

मम सम्पर्कसूचना