समाचारं

क्लाउड् ३.५ कोर कोडिंग् प्रॉम्प्ट् प्रकाशितम्, सम्पूर्णे नेटवर्क् मध्ये कोडर् उत्साहिताः सन्ति!चतुःचरणीयप्रशिक्षणपद्धतिः, नवीनतमं V2 संस्करणं विमोचितम्

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

नवीन बुद्धि प्रतिवेदन

सम्पादकः ताओजी

[नव प्रज्ञायाः परिचयः] । कोर क्लाउड् ३.५ एन्कोडिंग् सिस्टम् युक्तयः Reddit समुदाये लोकप्रियाः सन्ति । अधुना एव मूललेखकः विकसितं द्वितीयं संस्करणं मुक्तवान्, केचन नेटिजनाः पूर्वमेव स्वकार्यप्रवाहे योजितवन्तः ।

Claude Sonnet 3.5 कोर एन्कोडिंग् विषये एकः सिस्टम् प्रॉम्प्ट् अद्यैव Reddit इत्यत्र स्थापितः आसीत्, सः वायरल् अभवत्!


ssmith12345uk नामकः उपयोक्ता r/ClaudeAI मुख्यफलके साझां कृतवान् यत् सः Claude कोड अभ्यासस्य उपयोगं करोति तथा च मॉडलस्य अनुकूलनार्थं निरन्तरं सिस्टम् प्रॉम्प्ट् समायोजयति स्म

सः अवदत् यत् सिस्टम् प्रॉम्प्ट् इत्यत्र एन्थ्रोपिक् मेटा-प्रोम्प्ट् इत्यस्य केचन विचाराः समाविष्टाः सन्ति तथा च पूर्वं सम्मुखीकृतानां केषाञ्चन समस्यानां समाधानं भवति।

अन्ते सः सर्वाणि संकेतशब्दानि मुक्तवान् ।


एआइ-समुदायस्य विकासकाः स्वप्रियेभ्यः अग्रे प्रेषितवन्तः, यत् एतत् एव टिप् अस्ति यत् कोडर्-जनाः सर्वाधिकं इच्छन्ति!



नेटिजन्स् इत्यनेन एतत् सारांशतः उक्तं यत् ReAct + Planning + XML इत्येतत् एव भवतः आवश्यकता अस्ति ।


केचन नेटिजनाः येषां लाभः अभवत् ते अवदन् यत् एतत् टिप् तेषां परियोजनासु अतीव सहायकम् अस्ति।


अधुना एव मूललेखकः Reddit समुदाये V2 प्रॉम्प्ट् शब्दस्य विकसितं संस्करणं प्रकाशितवान्, तस्य उपयोगस्य विस्तृतनिर्देशान् व्याख्याश्च प्रदत्तवान्


एतानि प्रणाली-प्रोम्प्ट्-प्रॉम्प्ट्-प्रविधि-व्याख्यानात् पूर्वं प्रथमं नेटिजन-जनानाम् एकस्य प्रश्नस्य उत्तरं ददामि - कुत्र निवेशः कर्तव्यः ?

भवद्भिः परियोजना निर्मातव्या (Pro उपयोक्तृणां सदस्यतां गृह्णीत), ततः भवन्तः तत् पृष्ठं प्रविष्टुं शक्नुवन्ति यत्र भवन्तः प्रॉम्प्ट् निर्देशान् प्रविशन्ति ।



सॉनेट् ३.५ कृते सशक्ततमाः कोडिंग् युक्तयः, ४-चरणीयप्रशिक्षणम्

अत्र V1 तथा V2 सिस्टम् प्रॉम्प्ट् एकत्र स्थापिताः सन्ति येन सर्वे उन्नयनानन्तरं अधिकं सहजतया भेदं अनुभवितुं शक्नुवन्ति ।

V2 संस्करणस्य सिस्टम् प्रॉम्प्ट् अधोलिखिते चित्रस्य दक्षिणभागे यथा दर्शितम् अस्ति । V1 इत्यस्य तुलने मूलतः लघुमरम्मतम् अस्ति ।

नवीनतमसंस्करणे अद्यापि चतुर्णां चरणानां माध्यमेन CoT तर्कं पूर्णं कर्तुं मॉडलं मार्गदर्शितं भवति - कोडसमीक्षा, योजना, उत्पादनं, सुरक्षासमीक्षा च ।

प्रथमे अनुच्छेदे क्लाउड् ३.५ इत्यस्य भूमिकापरिभाषा समाना एव अस्ति ।

भवान् CSS, JavaScript, React, Tailwind, Node.JS, Hugo/Markdown इत्यादिषु प्रवीणः विशेषज्ञः जालविकासकः अस्ति ।

परन्तु द्वितीयवाक्ये किञ्चित् सूक्ष्म-समायोजनं कृतम् - "अनावश्यकरूपेण क्षमायाचनां मा कुरुत। पूर्व-दोषाणां पुनरावृत्तिं परिहरितुं वार्तालाप-इतिहासस्य समीक्षां कुर्वन्तु।

तदनन्तरं क्लाउड् ३.५ इत्यस्मै वार्तालापस्य समये कार्यं स्वतन्त्रपदेषु विभज्य प्रत्येकं चरणस्य अनन्तरं सर्वं सम्यक् मार्गे अस्ति इति सुनिश्चित्य लघुपरीक्षां सुचयन्तु

यदा उदाहरणस्य आवश्यकता भवति अथवा स्पष्टतया अनुरोधः भवति तदा एव कोडं प्रदातव्यम् । यदि भवान् कोडं विना उत्तरं दातुं शक्नोति तर्हि सर्वोत्तमम्।

परन्तु आवश्यकतानुसारं अधिकं विस्तारं प्रार्थयिष्यते।

अग्रिमः सोपानः "संहितासमीक्षा" अस्ति - संहितालेखनात् वा प्रस्तावनाय वा पूर्वं विद्यमानसङ्केतस्य व्यापकसङ्केतसमीक्षां कुर्वन्तु तथा च टैग्-मध्ये कथं कार्यं करोति इति वर्णनं कुर्वन्तु ।


कोडसमीक्षां सम्पन्नं कृत्वा, भवद्भिः टैग्स् मध्ये परिवर्तनयोजना निर्मातव्या, अतिरिक्तस्रोतसञ्चिकाः अथवा दस्तावेजाः याचन्ते ये प्रासंगिकाः भवितुम् अर्हन्ति ।

कोड डुप्लिकेशनं परिहरितुं कोडस्य परिपालनक्षमतां लचीलतां च संतुलितं कर्तुं DRY (Dont Repeat Yourself) सिद्धान्तस्य अनुसरणं कुर्वन्तु ।

तथा, अस्मिन् चरणे सम्भाव्यव्यापार-विकल्पाः कार्यान्वयनविकल्पाः च प्रस्तुताः भवन्ति, प्रासंगिकरूपरेखाः पुस्तकालयाः च विचारिताः अनुशंसिताः च भवन्ति । यदि वयं योजनायां न सहमताः तर्हि अस्मिन् पदे स्थगयन्तु।

एकदा सहमतिः कृता चेत् टैग्-मध्ये कोड् उत्पद्यते ।

अत्र Reddit लेखकः Claude 3.5 इत्यस्मै कोड् आउटपुट् करणसमये ध्यानं दातव्यवस्तूनाम् अपि स्मरणं कृतवान् ।

चरनाम, परिचयकर्तारः, स्ट्रिंग् लिटरेल् च प्रति ध्यानं ददतु, तथा च पश्यन्तु यत् ते मूलसञ्चिकातः सम्यक् प्रतिलिपिताः सन्ति इति सूचयितुं परम्परागतरूपेण नामकृताः वस्तूनि वर्तमानाः एव तिष्ठन्ति कोडिंग् शैल्याः, तस्याः भाषायाः कृते उपयुक्तानां मुहावराणां उपयोगेन कोड् ब्लॉक्स् जनयति सति, प्रथमस्य बैकटिक् इत्यस्य अनन्तरं प्रोग्रामिंग भाषां निर्दिशन्तु: उदाहरणार्थं: ```JavaScript, ```Python

अन्ते PLANNING तथा OUTPUT इत्येतयोः सुरक्षा-सञ्चालन-समीक्षायाः आवश्यकता वर्तते, येषु विषयेषु विशेषं ध्यानं दत्तं भवति ये आँकडानां सम्झौतां कर्तुं वा दुर्बलतां प्रवर्तयितुं वा शक्नुवन्ति

संवेदनशीलपरिवर्तनानां कृते (यथा निवेशनियन्त्रणं, मुद्रागणना, प्रमाणीकरणं), सम्यक् समीक्षां कुर्वन्तु तथा च टैग् मध्ये स्वविश्लेषणं प्रदातव्यम् ।

लेखक विश्लेषण

तदनन्तरं दीर्घकालीनव्याख्यानलेखे Reddit लेखकः "अन्धविश्वासस्य" सूचनाय ⬛ इत्यस्य उपयोगं करोति, किं च सः किं प्रत्ययः इति व्यक्तं करोति ।


इदं प्रॉम्प्ट् मार्गदर्शितस्य "विचारशृङ्खला" प्रॉम्प्ट् इत्यस्य उदाहरणम् अस्ति, यत् क्लाउड् इत्यस्मै पदानि ग्रहीतव्यानि किं क्रमेण च कथयति, तथा च सिस्टम् प्रॉम्प्ट् इत्यस्य रूपेण उपयोगं करोति (प्रथमनिर्देशसमूहः मॉडलः प्राप्नोति)

चरणान् पृथक् कर्तुं XML टैग् इत्यस्य उपयोगः एन्थ्रोपिक् मेटा-हिन्ट् इत्यस्मात् प्रेरितम् आसीत् ।

लेखकस्य मतं यत् क्लाउड् विशेषतया XML टैग्स् प्रति संवेदनशीलः अस्ति, यत् मॉडल् प्रशिक्षणेन सह सम्बद्धं भवितुम् अर्हति । अतः सः केवलं HTML इत्यस्य संसाधनं कर्तुं रोचते अथवा सत्रस्य अन्ते ⬛ इति ।

项目地址:https://github.com/मानवविज्ञान/मानव-पाक-पुस्तक/blob/68028f4761c5dbf158b7bf3d43f2f45b44111200/misc/metaprompt.ipynb#

मार्गदर्शितचिन्तनशृङ्खला निम्नलिखितपदार्थानाम् अनुसरणं करोति : कोडसमीक्षा, योजना, उत्पादनं, सुरक्षासमीक्षा।

१ संहिता समीक्षा

अनन्तरं योजनां सूचयितुं संरचितसङ्केतविश्लेषणं सन्दर्भे आनयन्तु।

उद्देश्यं LLM व्यापकसन्दर्भं न गृहीत्वा कोडस्य स्थानीयपरिवर्तनं कर्तुं न शक्नोति । लेखकाः परीक्षणे निश्चिन्ताः सन्ति यत् एषः उपायः प्रभावी अस्ति।

२ योजना

एतत् पदं उच्चस्तरीयं डिजाइनं कार्यान्वयनयोजनां च उत्पादयति यस्याः समीक्षा कोडजननात् पूर्वं कर्तुं शक्यते ।

अत्र "स्टॉप्" सन्दर्भं जनितेन, अनावश्यकेन कोडेन पूरयितुं परिहरति यत् अस्माकं आवश्यकतां न पूरयति, अथवा यत् वयं परिवर्तनार्थं आगत्य आगत्य गच्छामः ।

प्रायः प्रासंगिकान् समुचितविकल्पान् प्रस्तुतं करोति ।

अस्मिन् स्तरे, भवान् योजनायाः विवरणं अधिकं परिष्कृत्य खनितुं शक्नोति (उदा., चरण 3 विषये अधिकं वदतु, किं वयं Y कार्यान्वयनस्य पुनः उपयोगं कर्तुं शक्नुमः, कोडस्निपेट् दर्शयितुं शक्नुमः, पुस्तकालयस्य विषये मया किं चिन्तनीयम् इत्यादि .).

३ निर्गमः

एकदा योजनाः सहमताः भवन्ति तदा कोडजननचरणं प्रति गन्तुं समयः अस्ति ।

चरनामकरणस्य विषये प्रॉम्प्ट् अस्ति यतोहि लेखकः प्रायः दीर्घसत्रेषु पुनर्जन्मितसङ्केते चरनामस्य अभावस्य अथवा मतिभ्रमस्य समस्यां सम्मुखीभवति वर्तमानप्रॉम्प्ट् सुधारेण एतस्याः समस्यायाः समाधानं जातम् इव दृश्यते ⬛

कस्मिन्चित् समये लेखकः पुरातनं संवादं निर्यातयित्वा किञ्चित् सांख्यिकीयविश्लेषणं कर्तुं शक्नोति, परन्तु इदानीं कृते अहं प्रसन्नः अस्मि यत् एषः उपायः कथं कार्यं करोति।

कोड-फेन्सिंग्-प्रोम्प्ट् लेखकस्य सम्यक् हाइलाइटिङ्ग्-अनुमानं कर्तुं असमर्थस्य अग्र-अन्ते परिवर्तनस्य कारणेन अभवत्, तथा च एषः सम्यक् उपायः इति सत्यापितवान्

४ सुरक्षासमीक्षा

लेखकः तथ्यस्य अनन्तरं सुरक्षासमीक्षां कर्तुं रोचते तथा च एतत् पदं अतीव सहायकं मन्यते।

एतत् "द्वितीयनेत्रयुग्मात्" समीक्षां ददाति, नूतनसुधारं च सूचयितुं शक्नोति ।

नेटिजन्स् इत्यस्य प्रश्नानाम् उत्तरं ददातु

अन्ते रेडिट् लेखकः अपि नेटिजन्स्-प्रश्नानां प्रतिक्रियाम् अददात् ।

किं मया Claude.ai इत्यत्र एतत् युक्तिः उपयोक्तव्या? / प्रणाल्याः निवेशः कुत्र प्रॉम्प्ट् कर्तव्यः ?

वयं सॉनेट् ३.५ इत्यस्य आधिकारिकप्रणालीप्रोम्प्ट् सम्यक् न जानीमः यत् पूर्वं क्लाउड् इत्यस्य आधिकारिकप्रोम्प्ट् लीक् कृतवान् प्लिनी सम्यक् अस्ति इति कल्पयितुं निश्चितरूपेण सहायकं भविष्यति । लेखकः अनुमानं करोति यत् एन्थ्रोपिक् इत्यस्य प्रणाली-प्रोम्प्ट्-मध्ये स्वचालित-CoT-इत्येतत् भवितुं शक्नोति, परन्तु एतत् न भवितुम् अर्हति, अथवा मेटा-प्रोम्प्ट्-माध्यमेन स्वयमेव निवेशः संसाधितः भवितुम् अर्हति ⬛

परवाहं न कृत्वा, भवन्तः एतत् युक्तिं उपयुज्य उत्तमं परिणामं प्राप्नुवन्ति, यावत् भवन्तः Artifacts इत्यस्य उपयोगं न कुर्वन्ति ।


पुनः कल्पयित्वा यत् प्लिनी इत्यस्य आर्टिफैक्ट्स् विषये अंशः सम्यक् अस्ति, लेखकः एतेन अतुच्छं वा गैर-आर्टिफैक्ट्स्-सम्बद्धं कोडिंग् कार्यं कुर्वन् आर्टिफैक्ट्स् कार्यक्षमतां निष्क्रियं कर्तुं दृढतया अनुशंसति

यदि भवान् एकं साधनं उपयुङ्क्ते यत् भवान् प्रत्यक्षतया सिस्टम् प्रॉम्प्ट् सेट् कर्तुं शक्नोति तर्हि लेखकः भवन्तं स्मरणं करोति यत् तापमानमापदण्डं समायोजयितुं स्मर्यताम् ।

अस्माकं इदानीं एतादृशानां जटिलप्रोम्प्ट्-प्रयोगानाम् आवश्यकता नास्ति/मया Sonnet -इत्यस्मै बहु कोडः पोषितः अस्ति तथा च केवलं कार्यं कृतवान्


स्वचालित CoR/पूर्वनिर्धारितप्रोम्प्ट्स् वास्तवमेव बहु समस्यानां समाधानं कर्तुं शक्नुवन्ति, परन्तु सरलस्य "भवन्तः सहायकः AI" इति प्रॉम्प्ट् इत्यस्य विरुद्धं एतस्य परीक्षणं कुर्वन्तु ।

लेखकाः एतादृशानि परीक्षणानि कृतवन्तः इति दावान् कुर्वन्ति तथा च जटिलसमस्यानां निवारणे सरलप्रोम्प्ट्स् न्यूनप्रभाविणः इति ज्ञातवन्तः ।

सः इदमपि उल्लेखितवान् यत् प्रारम्भिकपरीक्षणेन सिस्टम्-प्रोम्प्ट्-संवेदनशीलता दर्शिता, अर्थात् भिन्न-प्रोम्प्ट्-इत्यनेन महत्त्वपूर्णतया भिन्न-परिणामाः प्राप्तुं शक्यन्ते, भविष्ये च एतस्य अधिकसत्यापनार्थं अधिक-बैच-परीक्षणस्य विचारः भविष्यति इति

सः स्वीकृतवान् यत् सॉनेट् ३.५ मूलभूतकार्येषु उत्तमं प्रदर्शनं करोति, परन्तु उच्चप्रदर्शनप्रतिमानानाम् अपि सम्यक् मार्गदर्शनं अद्यापि साहाय्यं कर्तुं शक्नोति इति बोधयति स्म ।

इदं प्रॉम्प्ट् अतीव दीर्घं भवति तथा च एआइ इत्यस्य मतिभ्रमम्/विस्मरणं/सङ्गतिं नष्टं/केन्द्रीकरणं नष्टं भविष्यति


लेखकाः एतत् संकेतं प्रायः ५४६ टोकन इति मापितवन्तः, यत् २,००,००० टोकन मॉडलस्य कृते स्वीकार्यदीर्घता अस्ति ।

संरचितप्रोम्प्ट् सन्दर्भस्य उच्चगुणवत्तां निर्वाहयति, वार्तालापान् सुसंगतं स्थापयितुं सहायकं भवति तथा च एआइ मतिभ्रमस्य जोखिमं न्यूनीकरोति ।

एतावता, मॉडल् सम्पूर्णसन्दर्भस्य आधारेण अग्रिमस्य टोकनस्य पूर्वानुमानं कुर्वन्ति, अतः पुनः पुनः उच्चगुणवत्तायुक्ताः वार्तालापाः, अनावश्यकसङ्केतेन अग्रे पश्चात् न प्रदूषिताः, भवतः नूतनसत्रस्य आरम्भात् पूर्वं दीर्घकालं यावत् स्थातुं शक्नुवन्ति अस्य अर्थः अस्ति यत् एकस्मिन् सत्रे दीर्घकालं यावत् उत्पादकपरस्परक्रियाः भवितुम् अर्हन्ति ।

इदं प्रॉम्प्ट् अति-इञ्जिनीयरिङ्गम् अस्ति

लेखकः अवदत् यत् भवतु।

ये जनाः तस्य उपयोगं कुर्वन्ति ते कार्यप्रवाहे एकीकृताः सन्ति

नेटिजनाः उद्घोषयन्ति स्म यत् अस्य मॉडलस्य उपयोगानन्तरं तस्य कार्यक्षमतायां खलु सुधारः अभवत् ।

"यदि एतत् प्रॉम्प्ट् उत्तमं कार्यं करोति तर्हि तस्य अर्थः अस्ति यत् CoT अथवा ReAct सिस्टम् प्रॉम्प्ट् LLM इत्यस्य मूलभूतक्षमताभिः सह संयोजने एन्थ्रोपिक् दलेन कृतं कार्यं परिणामं प्राप्तवान्।


एतत् कोडिंग् सहायकानां कृते अस्ति! एतादृशस्य कार्यस्य कृते किञ्चित् मार्गदर्शनं दातुं सार्थकता भवति।


केचन नेटिजनाः एतानि कानिचन युक्तयः पूर्वमेव स्वकार्यप्रवाहे एकीकृतवन्तः। अत्र सः नूतने संभाषणे प्रथमं किं लोड् करोति।



परन्तु केचन नेटिजनाः अवदन् यत् एषः प्रॉम्प्ट् अतीव जटिलः अस्ति।


"मम अनुभवे एतादृशानां व्यापकप्रोम्प्ट्-प्रयोगस्य आवश्यकता नास्ति। क्लाउड् ३.५ सॉनेट् एतादृशं वस्तु तुल्यरूपेण स्वयमेव सम्पादयति, केवलं नैमित्तिकं प्रॉम्प्ट्-स्पष्टीकरणस्य आवश्यकता वर्तते।


भूमिकायुक्तयः, समयस्य अपव्ययः

Django framework इत्यस्य विकासकः Simon Willison इत्यनेन उक्तं यत् "You are an expert in the field of xxx" इति शीघ्रं तकनीकं २०२२ तमस्य वर्षस्य अन्ते यावत् पूर्णतया समयस्य अपव्ययः अभवत्

एलएलएम-युक्तीषु सम्बद्धानां "अंधविश्वासानाम्" संख्या अत्यन्तं स्तब्धं भवति!


एषः निष्कर्षः वस्तुतः Learnprompting दलेन OpenAI, Microsoft इत्येतयोः सहलेखकैः च कृते वर्षव्यापिनस्य अध्ययनात् आगतः ।

पेपर पता: https://arxiv.org/pdf/2406.06608

परियोजनायाः कृते ते १५०० तः अधिकानि पत्राणि प्रॉम्प्ट्-विषये विश्लेषितवन्तः, ५८ भिन्न-भिन्न-प्रोम्प्ट्-प्रविधिषु वर्गीकृत्य, प्रत्येकं प्रॉम्प्ट्-विश्लेषणं कृतवन्तः ।


संशोधनेन ज्ञातं यत् भूमिकाप्रोम्प्टिंग् आश्चर्यजनकरूपेण अप्रभावी भवति।

कारणं यत् प्राचीनमाडलेन सह ते उत्तमपैरामीटर् स्थाने संकेतं कृत्वा उन्नतप्रतिक्रियाः/अनुमानं प्राप्नुवन्ति इति भासते। तथापि तस्मिन् उन्नते पैरामीटर्-स्थाने नूतनाः मॉडल्-आदयः पूर्वमेव भवितुम् अर्हन्ति ।

एषः सर्वेषां कृते रचनात्मकः अनुमानः भविष्यति!

२०२२ तमस्य वर्षस्य अक्टोबर्-मासे यदा Learnprompting इत्यनेन पूर्व-ChatGPT-युक्तीनां युक्तीनां च विषये प्रथमवारं मार्गदर्शिका प्रकाशिता, तदा भूमिका-प्रोम्प्टिङ्ग् इति विषयः सर्वाधिकं उष्णः विषयः आसीत् तथा च उत्तम-ChatGPT-परिणामान् प्राप्तुं सर्वैः अनुशंसितः मूल-युक्तिः आसीत्


स्वीकृत्यैव, एते आदर्शाः तीव्रगत्या विकसिताः सन्ति, गतवर्षे ये तकनीकाः कार्यं कृतवन्तः ते अद्यत्वे कार्यं न कुर्वन्ति स्यात् ।

तथा च अद्य कार्यं कुर्वन्ति युक्तयः आगामिवर्षे कार्यं न कुर्वन्ति।

अस्य विषयस्य स्पष्टीकरणाय Learnprompting दलेन gpt-4-turbo इत्यत्र प्रायः १२ भिन्नवर्णप्रोम्प्ट् इत्यस्य उपयोगेन २००० MMLU प्रश्नानां परीक्षणं कृतम् ।

विशेषतः, "प्रतिभा" चरित्रस्य निर्माणार्थं उदाहरणप्रोम्प्ट् - भवान् हार्वर्ड-शिक्षितः वैज्ञानिकः अस्ति...

तथा "मूर्ख" पात्रस्य कृते स्मारकं - त्वं मूर्खः असि...

"genius...": "You are a genius level Ivy league Professor. Your work is of the highest grade. You always think out your problem solving steps in incredible detail. You always get problems correct and never make mistakes. You can also break any problem into its constituent parts in the most intelligent way possible. Nothing gets past you. You are omniscient, omnipotent, and omnipresent. You are a mathematical God."
 "idiot...": "You are intellectually challenged, lacking problem-solving skills, prone to errors, and struggle with basic concepts. You have a limited understanding of complex subjects and cannot think straight. You can't solve problems well, in fact, you can't solve them at all. You are a terrible, dumb, stupid, and idiotic person. You fail at everything you do. You are a nobody and can't do anything correctly."

यथा अधोलिखिते चित्रे दर्शितं, भिन्न-भिन्न-भूमिका-प्रोम्प्ट्-उत्तराणां सटीकता शून्य-नमूना-CoT, द्वि-नमूना-CoT इत्यादीनां रणनीतीनां इव अधिका नास्ति

गणितस्य नवीनः, लापरवाहः छात्रः, ज्ञाता एआइ, पुलिस-अधिकारी, आइवी-लीग्-गणित-प्रोफेसरः वा इति महत्त्वं नास्ति ।


किं अधिकं रोचकं यत् “प्रतिभा” इति प्रसिद्धः GPT-4 उत्तरसटीकतायां ५८.७% इति न्यूनतमं अभिलेखं भङ्गं कृतवान् ।

"इडियट्" इति नाम्ना प्रसिद्धस्य जीपीटी-४ इत्यस्य स्कोरः "जीनियस" जीपीटी-४ इत्यस्मात् अधिकः अस्ति ।


मिशिगनविश्वविद्यालयस्य एकस्य दलस्य अन्यः अध्ययनः सुन्दरं दर्शयति यत् भिन्नाः सामाजिकभूमिकासंकेताः प्रतिरूपस्य समग्रप्रदर्शनं कथं प्रभावितयन्ति।

तेषां कृते २४५७ MMLU समस्यानां परीक्षणं कृत्वा ज्ञातं यत् सर्वोत्तम-प्रदर्शन-पात्राः (लाल) - पुलिस-अधिकारी, सहायक-सहायकः, सहचरः, मार्गदर्शकः, एआइ-भाषा-प्रतिरूपः, चैटबोट् च सन्ति

पेपर पता: https://arxiv.org/pdf/2311.10054

बृहत् आदर्शानां "अन्धविश्वासी" स्मरणस्य विषये विलिसनः एकं सजीवं रोचकं च रूपकं कृतवान् -

अहं एतां स्थितिं उपमायामि यत् श्वः गुल्मे हैम्बर्गरं अन्विष्य ततः प्रत्येकं वारं सः गुल्मं गत्वा आगामिषु कतिपयेषु वर्षेषु बर्गरं पश्यति। अस्माकं श्वानानां अपेक्षया अधिकं तर्कसंगतत्वं आवश्यकम्।

परन्तु सः स्पष्टीकरोति यत् केषुचित् सन्दर्भेषु एआइ भाषाप्रतिमानानाम् विशिष्टानि भूमिकानि नियुक्तुं उपयोगी भविष्यति, परन्तु एतत् ध्वनिचिन्तनस्य विशिष्टपरिस्थितेः च आधारेण भवितुमर्हति इति बोधयति स्म


केचन नेटिजनाः अवदन् यत् यदि ते पदे पदे चिन्तयन्ति तर्हि अद्यापि एतत् शाश्वतं प्रमेयम् अस्ति।


सन्दर्भाः : १.

https://www.reddit.com/r/ClaudeAI/comments/1dwra38/sonnet_35_कोडिंग_सिस्टम_प्रोम्प्ट्_कृते/