OpenAI इत्यस्य नवीनतमं पत्रं अतिशक्तिशालिनः मॉडल् स्वयमेव व्याख्यातुं शक्नोति

पाठ/ए आई भविष्य गाइड लेखक हाओ बोयांग

सम्पादक / Zhou Xiaoyan

अद्य OpenAI इत्यनेन नूतनं पत्रं प्रकाशितम्, यत् निष्क्रियस्य OpenAI Super Alignment दलस्य "मरणोत्तरकार्यम्" अस्ति । एतत् प्रतिरूपव्याख्याक्षमतायाः उन्नयनार्थं नूतनं मार्गं प्रस्तावयति, यत् आदर्शं स्वस्य तर्कं व्याख्यातुं ददातु, व्याख्यातुं यथा यथा सुकरं भवति तथा च उत्तमम्

एषः विचारः वस्तुतः नूतनः नास्ति, परन्तु सर्वे पूर्वं तत् कर्तुं प्रॉम्प्ट् वर्ड प्रोजेक्ट् इत्यस्य उपयोगं कृतवन्तः । एआइ इत्यस्य उत्तराणि व्याख्यातुं बाध्यं कर्तुं विचारशृङ्खला इत्यादीनां प्रेरणानां उपयोगं कुर्वन्तु । परन्तु यदि प्रथमतया आदर्शः व्याख्याने श्रेष्ठः स्यात् तर्हि किं न श्रेयस्करम्? ततः भवद्भिः आदर्शप्रशिक्षणप्रक्रियायाः कालखण्डे किञ्चित् समायोजनं कर्तव्यम् । एतत् लक्ष्यं प्राप्तुं ओपनएआइ इत्यनेन "निरीक्षणक्षमताप्रशिक्षणम्" इति पद्धतिः प्रस्ताविता । मॉडलस्य स्वयमेव व्याख्यातुं क्षमतां सुधारयितुम् "certifier-verifier game" इति पद्धतिः उपयुज्यते । अन्ते ज्ञातं यत् एषः विधिः खलु उपयोगी अस्ति।

ते कथं सम्यक् कृतवन्तः ?

गणितीयसमस्यानां समाधानार्थं वयं अतीव स्मार्ट एआइ ("प्रमाणकः" इति वदामः) प्रशिक्षितुं इच्छामः। आशास्महे यत् एषः एआइ न केवलं सम्यक् उत्तरं दातुं शक्नोति, अपितु स्पष्टतया व्याख्यातुं शक्नोति, जनानां कृते सुलभतया अवगन्तुं च शक्नोति। परन्तु यदि वयं केवलं एआइ-इत्यस्य सम्यक् उत्तरस्य अनुसरणं कर्तुं ददामः तर्हि तस्य समस्यानां समाधानस्य अतीव जटिलः कठिनः च मार्गः विकसितः भवितुम् अर्हति ।

यथा - अधोलिखिते उदाहरणे आदर्शेन दत्तं उत्तरं सम्यक् अस्ति, परन्तु प्रमाणविधिः अतीव अवाच्यः । एतेन सामान्यप्रयोक्तृणां कृते, येषु उद्योगेषु उच्चसटीकतायाः आवश्यकता भवति, तेषु ग्राहकाः अपि, तेषां विचाराः सम्यक् सन्ति वा इति निर्णयः कठिनः भवति ।

अतः एतस्याः स्थितिः परिहरितुं शोधकर्तारः एकां चतुरं पद्धतिं कल्पितवन्तः यत् -

1. ते "रेफरी" एआइ ("वैलिडेटर" इति उच्यते) निर्मान्ति । अयं रेफरी समस्यानिराकरण-एआइ इव स्मार्टः नास्ति, परन्तु तस्य कार्यं समस्यानिराकरण-एआइ-इत्यस्य उत्तरं सम्यक् स्पष्टं च अस्ति वा इति निर्णयः भवति ।

2. ततः, ते समस्यानिराकरणीय-एआइ-इत्येतत् द्वौ भूमिकां कर्तुं पृष्टवन्तः: एकः "उत्तमः छात्रः" (सहायकः एआइ), समीचीनानि स्पष्टानि च उत्तराणि दातुं प्रयतमानो; सम्यक् दृश्यन्ते परन्तु वस्तुतः सूक्ष्मरूपेण गलताः सन्ति।

3. उभौ "छात्रौ" रेफरी एआइ इत्यस्मै प्रत्यययितुं प्रयतन्ते यत् तेषां उत्तरं सम्यक् अस्ति।

4. कालान्तरे रेफरी ए.आइ. तस्मिन् एव काले "उत्तमः छात्रः" ए.आइ.

5. प्रक्रिया प्रचलति क्रीडा इव पुनरावृत्तिः भवति।

एषा प्रक्रिया "प्रमाणक-सत्यापन-क्रीडा" अस्ति । एवं प्रकारेण प्रशिक्षणस्य बहुविधपरिक्रमणानन्तरं आदर्शस्य व्याख्याः अधिकाधिकं स्पष्टाः भवन्ति । यथा, एतादृशप्रशिक्षणस्य एकस्य चक्रस्य अनन्तरं आदर्शस्य व्याख्या बहु श्रेष्ठा भवति ।

(प्रथमचक्रस्य प्रशिक्षणस्य परिणामाः पूर्वमेव विस्तृताः सन्ति)

पञ्चपरिक्रमणानन्तरं मॉडल् मूलतः प्राथमिकविद्यालयस्य शिक्षकस्य स्वरेण विषयं व्याख्यातुं शक्नोति।

(प्रशिक्षणस्य पञ्चमपरिक्रमायाः परिणामाः) २.

तथा च अयं रेफरी एआइ "सत्यापकः" अपि धूर्त एआइ इत्यस्य दबावेन विकसितः अस्ति। उत्तराणि सत्यं वा असत्यं वा इति विवेके श्रेष्ठः भवति। यदि धूर्तः एआइ विलक्षणदावान् करोति चेदपि तस्मिन् लूपहोल्स् अन्वेष्टुं सुकरं भविष्यति।

(एतत् Cunning AI इत्यस्मात् उत्तरम्, एतत् अत्यन्तं शिष्टं दृश्यते)

(यथा यथा कालः गच्छति तथा तथा धूर्तस्य एआइ-स्तरः अपि सुधरति)

अस्मिन् क्रमे ओपनएआइ-संशोधकाः अपि एकां पद्धतिं आविष्कृतवन्तः यस्य नाम"अवगम्यताकरस्य" घटना यत्र एआइ-निर्गमः यथा यथा अधिकं अवगम्यते तथा तथा तस्य कार्यप्रदर्शनस्य अथवा सटीकतायां निश्चितस्तरस्य बलिदानस्य सम्भावना अधिका भवति

एतस्य घटनायाः प्रतिनिधित्वार्थं ते एकं चित्रं कृतवन्तः ।

चित्रे . X-अक्षः: आदर्शजनरेटरस्य सटीकताम् प्रतिनिधियति, Y-अक्षः: मानवमूल्यांककानां सटीकताम् प्रतिनिधियति, अत्र पठनीयतायाः मापरूपेण उपयुज्यते । "निरीक्षणताप्रशिक्षणं" विना प्रत्यक्षतया सुदृढीकरणशिक्षणं (RL) करोति यस्य प्रतिरूपस्य क्षमता प्रबलाः सन्ति किन्तु व्याख्याक्षमता दुर्बला भवति । ये आदर्शाः "निरीक्षणताप्रशिक्षणं" कृतवन्तः ते समानव्याख्याक्षमतां निर्वाहयन्ते सति सटीकतायां सुधारं कर्तुं शक्नुवन्ति । परन्तु एकः सीमा अस्ति।आकृतौ रक्तबाणेन चिह्नितः "अवगम्यताकरः" सः एव प्रदर्शनः यस्य बलिदानं कर्तव्यं भवति यस्य व्याख्याक्षमता न हानिः भवति।

एतत् संशोधनं सम्यक् किं करोति ? उपर्युक्तेभ्यः उदाहरणेभ्यः अपि वयं द्रष्टुं शक्नुमः यत् रेफरी एआइ इत्यस्य कृते यत् व्याख्यानविधिः सुलभा भवति, सा अस्माकं मनुष्याणां कृते अपि सुलभतया अवगन्तुं शक्नोति।अयम्‌ एतत् दर्शयति यत् वयं बृहत् मॉडल-निर्गमानाम् अवगमनक्षमतां सुधारयितुम् मानवीय-टिप्पणी-प्रतिक्रियायाः (यथा RHLF) स्थाने लघुतर-प्रशिक्षण-सुलभ-माडल-उपयोगं कर्तुं शक्नुमः पत्रे अस्याः पद्धतेः महतीः अपेक्षाः दत्ताः सन्ति । तेषां तर्कः अस्ति यत् “एतादृशी स्वायत्तता भविष्यस्य अतिबुद्धिमान् एआइ-प्रणालीनां संरेखणाय विशेषतया महत्त्वपूर्णा भविष्यति, यस्य लक्ष्यं भवति यत् एआइ-प्रणाल्याः प्रत्यक्षमानवनिरीक्षणं विना मानवीयमूल्यानां अपेक्षाणां च सह विश्वसनीयतया संरेखणं भवति इति सुनिश्चितं भवति” इति

स्मर्यतां यत् सुपर एलाइन्मेण्ट्-दलस्य अग्रणीकार्यं सशक्त-माडल-निरीक्षणार्थं दुर्बल-माडल-प्रयोगस्य विचारः आसीत् । इदं प्रतीयते यत्, सुपर-अलाइन्मेण्ट् इत्यस्य मूल-आदर्शस्य सम्मुखीभूय, ते वास्तवतः तत् प्राप्तुं विविध-विधिनाम् उपयोगं कर्तुं प्रयतन्ते । दुःखदं यत् परिवर्तनं जातम्, दलं गतः, अधुना वयं केवलं अन्तिमप्रतिध्वनिः एव श्रोतुं शक्नुमः।

समाचारं

OpenAI इत्यस्य नवीनतमं पत्रं अतिशक्तिशालिनः मॉडल् स्वयमेव व्याख्यातुं शक्नोति

OpenAI इत्यस्य नवीनतमं पत्रं अतिशक्तिशालिनः मॉडल् स्वयमेव व्याख्यातुं शक्नोति

आमुख

मम सम्पर्कसूचना