o1 स्वर्णपदकदलः अद्भुतं क्षणं प्रकाशयति यदा ai मनुष्यान् अतिक्रमयति! २२ मिनिट् यावत् पूर्णः विडियो जनसमुदायस्य

o1 स्वर्णपदकदलः अद्भुतं क्षणं प्रकाशयति यदा ai मनुष्यान् अतिक्रमयति! २२ निमेषात्मकस्य भिडियोस्य पूर्णसंस्करणं अधुना सर्वेषां कृते उद्घाटितम् अस्ति

2024-09-22

नवीन बुद्धि प्रतिवेदन

सम्पादक: ताओ ज़ी किआओ यांग

[नवीन प्रज्ञा परिचय】o1 इत्यस्य जन्म openai दलस्य कृते सर्वाधिकं क्रान्तिकारी क्षणः अस्ति। २२ निमेषात्मके पूर्णसाक्षात्कार-वीडियो-मध्ये ते नूतन-माडलस्य विषये स्वविचारं तस्य पृष्ठतः विकास-कथां च साझां कृतवन्तः ।

openai o1 दलस्य साक्षात्कारस्य पूर्णं विडियो अन्ततः ऑनलाइन अस्ति!

२२ निमेषपर्यन्तं प्रोजेक्ट् बॉब मेक्ग्रेव इत्यनेन आयोजितः o1 r&d दलः एकत्र "अहा" इति क्षणं साझां कृतवान् ।

केचन जनाः उक्तवन्तः यत् नूतनं o1 मॉडलं बहुविधवैद्यानां "संलयनस्य" तुल्यम् अस्ति तथा च प्रायः मनुष्याणाम् अपेक्षया उत्तमं प्रदर्शनं करोति । केचन जनाः अवदन् यत् o1 इत्यस्य विमोचनानन्तरं ते एजीआई इत्यस्य आगमनं स्पष्टतया अनुभवन्ति स्म ।

“यदा गणितं, कोडिंग्, गो, शतरंज इत्यादिषु क्षेत्रेषु आदर्शाः मनुष्याणां कृते अधिकं प्रदर्शनं कुर्वन्ति तदा एजीआई इत्यस्य भविष्यं स्पष्टतरं भवति।”

एलेन् इन्स्टिट्यूट् इत्यस्य वैज्ञानिकः नाथन् लैम्बर्ट् इत्यनेन अस्य विडियोस्य मुख्यविषयाणां सारांशः कृतः ।

कुलम् ८ बिन्दवः सन्ति : १.

१ सुदृढीकरणशिक्षणेन सह o1 नूतनानां cot तर्कपदार्थानाम् आविष्कारे मनुष्याणाम् अपेक्षया श्रेष्ठः अस्ति

२ आत्मसमालोचनस्य उद्भवः o1’s most powerful moment

३ "समयसमाप्ति" इत्यस्मात् पूर्वं o1 उत्तरं समाप्तं भवतु, ततः सहसा "अहा" क्षणः भवतु

4. पैरामीटर् आकारानां स्केलिंगस्य चुनौती, तथा च सुदृढीकरणशिक्षण-एल्गोरिदम् इत्यस्य उन्नतिमार्गे निरन्तरं गमनम्

५ एल्गोरिदम् इत्यस्य तुलने आधारभूतसंरचना कियत् महत्त्वपूर्णा इति बहवः जनाः उक्तवन्तः

६ योजनायाः त्रुटिशुद्धिकरणस्य च माध्यमेन o1 जगति नूतनानां समस्यानां समाधानं कर्तुं शक्नोति

7 नूतनं प्रशिक्षणप्रतिमानं सर्वथा नूतनं दृष्टिकोणं यत् अधिकं कम्प्यूटिंगशक्तिं प्रतिरूपे स्थापयति

8 o1सङ्केतलेखनकाले यदा सः उपयोक्तव्यं कोडं निर्गच्छति तदा तस्य यूनिट् परीक्षणं उत्तीर्णं कर्तव्यम्

तदनन्तरं o1 मॉडल् इत्यस्य पृष्ठतः कथां समीपतः अवलोकयामः ।

सुदृढीकरणं शिक्षणं + चिन्तनं, o1 एकं नूतनं प्रतिमानं उद्घाटयति

openai इत्यस्य नूतना श्रृङ्खलारूपेण o1 तथा gpt मॉडल् इत्येतयोः मध्ये सर्वाधिकं अन्तरं अनुमानं भवति ।

सारतः तर्कस्य आदर्शः अस्ति, यस्य अर्थः अस्ति यत् पूर्वापेक्षया अधिकं "चिन्तयिष्यति" इति ।

ओपनएआइ-संशोधकानां मते "चिन्तनम्" तर्कस्य सर्वाधिकं सहजमार्गः अस्ति ।

कदाचित् इटलीदेशस्य राजधानी का इति पृष्टे वयं प्रायः तत्क्षणमेव उत्तरं कल्पयितुं शक्नुमः, न चिन्तयित्वा अपि । परन्तु कदाचित् व्यापारयोजनानां, उपन्यासलेखनस्य इत्यादीनां विषयेषु दीर्घचिन्तनप्रक्रियायाः आवश्यकता भवति ।

भवन्तः यावत्कालं यावत् चिन्तयन्ति तावत् उत्तमं परिणामः भविष्यति इति वक्तुं नावश्यकता वर्तते।

अतः तर्कः चिन्तनसमयं इष्टफलरूपेण परिवर्तयितुं क्षमता अस्ति ।

मार्क चेन् इत्यस्य वचनेषु तर्कः "आदिमः" अस्ति तथा च कस्यापि विश्वसनीयचिन्तनप्रक्रियायाः प्राप्तेः एकमात्रः उपायः अस्ति ।

अनुमानसंशोधनस्य विषये ओपनएआइ वस्तुतः अतीव प्राक् आरब्धम् । अस्य स्थापनायाः आरम्भिकेषु दिनेषु ते आल्फागो इत्यस्य आरएल-एल्गोरिदम्-माध्यमेन मनुष्यान् पराजयितुं क्षमताम् अवलोक्य बहु शोधं कृतवन्तः ।

यथा, ते २०१६ तमे वर्षे "यूनिवर्स" इति क्रीडापरीक्षणमञ्चं उद्घाटितवन्तः, यत् एआइ इत्यस्य सामान्यबुद्धिस्तरस्य प्रशिक्षणार्थं मुक्तस्रोतमञ्चः अस्ति ।

२०१८ तमे वर्षे openai five इति नामकं गेम ai निर्मितम्, यत् द्विवारं dota2 अन्तर्राष्ट्रीयआमन्त्रणप्रतियोगितायां विश्वविजेता og दलं सफलतया पराजितवान्

तस्मिन् एव काले दत्तांशस्य रोबोटिक्सस्य च क्षेत्रेषु महत्त्वपूर्णा स्केलिंग् प्रगतिः कृता अस्ति ।

openai दलं चिन्तयितुं आरब्धवान् यत् सामान्यक्षेत्रेषु सुदृढीकरणशिक्षणं कथं कार्यान्वितं कृत्वा अतीव शक्तिशाली ai प्राप्तुं शक्यते?

अर्थात् जीपीटी श्रृङ्खलाद्वारा उद्घाटितं नूतनं प्रतिमानम्। अनिरीक्षितशिक्षणस्य स्केलिंग् इत्यत्र अस्य आश्चर्यजनकं परिणामः प्राप्तः अस्ति ।

तथा च, ततः परं शोधकर्तारः एतयोः प्रतिमानयोः संयोजनं कथं करणीयम् इति अन्वेषणं आरब्धवन्तः-सुदृढीकरणशिक्षणं, अनिरीक्षितशिक्षणं च।

कदा प्रयासः आरब्धः इति सम्यक् वक्तुं कठिनं, परन्तु दीर्घकालं यावत् कार्येषु अस्ति इति शोधकर्तारः अवदन्।

"अहा" क्षणः

तस्मिन् भिडियायां कश्चन अवदत् यत् तेषां मनसि संशोधनस्य सर्वाधिकं मस्तं वस्तु "अहा" इति क्षणः एव इति।

कस्मिन्चित् समये संशोधने अप्रत्याशितरूपेण भङ्गः अभवत्, सर्वं च सहसा एपिफेनी इव स्पष्टं जातम् ।

अतः, दलस्य सदस्याः कीदृशाः “अहा” क्षणाः अनुभवन्ति स्म?

कश्चन अवदत् यत् सः अनुभवति यत् मॉडलस्य प्रशिक्षणप्रक्रियायां एकः महत्त्वपूर्णः क्षणः अस्ति, यदा ते पूर्वापेक्षया अधिकं कम्प्यूटिंग्-शक्तिं निवेशयन्ति स्म, प्रथमवारं च अतीव सुसंगतं cot जनयन्ति स्म

अस्मिन् क्षणे सर्वेषां सुखद आश्चर्यम् अभवत् : स्पष्टम् आसीत् यत् एतत् प्रतिरूपं पूर्वस्मात् महत्त्वपूर्णतया भिन्नम् आसीत् ।

अन्ये अवदन् यत् तर्कक्षमतायुक्तस्य प्रतिरूपस्य प्रशिक्षणस्य विचारे प्रथमं मनसि आगच्छति यत् मनुष्याः स्वचिन्तनप्रक्रियाः अभिलेखयितुम् तदनुसारं प्रशिक्षणं च दद्युः

तस्य कृते अहा क्षणः तदा आसीत् यदा सः आविष्कृतवान् यत् cot जनयितुं अनुकूलितुं च सुदृढीकरणशिक्षणस्य माध्यमेन आदर्शस्य प्रशिक्षणं मनुष्यैः लिखितस्य cot इत्यस्मात् अपि उत्तमम् अस्ति।

अयं क्षणः दर्शयति यत् वयम् एवं प्रकारेण आदर्शस्य तर्कक्षमतां विस्तारयितुं अन्वेष्टुं च शक्नुमः।

अयं शोधकः अवदत् यत् सः गणितीयसमस्यानां समाधानार्थं आदर्शस्य क्षमतां वर्धयितुं बहु परिश्रमं कुर्वन् अस्ति।

तस्य कुण्ठायाः कारणं यत्, प्रतिमानं कदापि परिणामं जनयति चेत् किं दुष्कृतं कृतवान् इति प्रश्नं न करोति इव ।

परन्तु प्रारम्भिक o1 मॉडल् मध्ये एकस्य प्रशिक्षणं कुर्वन् ते आश्चर्यचकिताः अभवन् यत् गणितपरीक्षायां मॉडलस्य स्कोरः सहसा महत्त्वपूर्णः सुधारः अभवत्

अपि च, शोधकर्तारः आदर्शस्य शोधप्रक्रियाम् अवलोकयितुं शक्नुवन्ति - सः स्वस्य चिन्तनं कर्तुं आरभते, स्वयमेव प्रश्नं कर्तुं च आरभते।

सः उद्घोषितवान् - अन्ततः वयं किमपि भिन्नं कृतवन्तः!

अयं भावः अत्यन्तं प्रबलः आसीत्, तस्मिन् क्षणे सर्वं एकत्र आगतं इव आसीत् ।

अन्यः शोधकर्त्ता अवदत् यत् यदा भवान् आदर्शं "समयसमाप्तिम्" पूर्वं स्वचिन्तनं सम्पूर्णं कर्तुं पृच्छति तदा प्रक्रिया अतीव रोचकं भवति ।

गणितस्पर्धायां भागं ग्रहीतुं इव किमपि चिन्तनं समयसीमितं भवति।

सः अवदत् यत् एतत् एव मुख्यकारणम् अस्ति यत् सः एआइ-क्षेत्रे प्रवेशं कृतवान्, अधुना तस्य कृते एतत् "क्लोज्ड्-लूप्" क्षणः इति गणयितुं शक्यते ।

तदतिरिक्तं o1 मॉडल् इत्यस्य विषये यत् आश्चर्यं तत् अस्ति यत् वैज्ञानिक-आविष्कारस्य, अभियांत्रिकी-प्रगतेः च प्रवर्धनार्थं महती सहायता भवति ।

अनेकेषां जनानां कृते एजीआई अतीव अमूर्तं दूरगामी च अवधारणा इव दृश्यते यावत् ते एजीआई इत्यस्य कार्याणि कुर्वन्तः न पश्यन्ति येषु मनुष्याः कुशलाः सन्ति तावत् ते एजीआई इत्यस्य आगमने विश्वासं कर्तुं न शक्नुवन्ति।

व्यावसायिकशतरंज-गो-क्रीडकानां कृते ibm-संस्थायाः deep blue-इत्यनेन, तथैव deepmind alphago-alphazero-इत्यनेन च कतिपयवर्षेभ्यः पूर्वं तेषां साक्षात्कारः कृतः ।

openai इत्यस्य वैज्ञानिकसमूहस्य कृते ये गणितं कोडिंग् च कुशलाः सन्ति, o1 मॉडलस्य अपि तथैव अर्थः अस्ति । इतः अपि रोचकं यत् तेषां कार्यं स्वस्य क्षमताम् अभिभूतं कर्तुं शक्नोति इति एआइ-निर्माणस्य तुल्यम् अस्ति ।

परियोजनायाः कालखण्डे भवता काः कष्टानि अभवन् ?

प्रक्रियायां सम्मुखीभूतानां बाधानां विषये शोधकर्तारः प्रत्यक्षतया अवदन् यत् एलएलएम-प्रशिक्षणं मौलिकरूपेण अतीव कठिनम् अस्ति ।

पृथिव्याः चन्द्रं प्रति रॉकेटस्य प्रक्षेपणं इव सफलतायाः संकीर्णमार्गः एव अस्ति, परन्तु असफलतायाः मार्गाः असंख्याः सन्ति यदि कोणात् किञ्चित् अपि व्यभिचरति तर्हि लक्ष्यं प्राप्तुं न शक्नुथ ।

प्रशिक्षणप्रक्रिया सहस्रशः उपायाः सन्ति, अस्य प्रतिभाशालिनः शोधवैज्ञानिकसमूहस्य हस्ते अपि प्रत्येकं प्रशिक्षणपरिक्रमे शतशः समस्याः सम्मुखीभवन्ति स्म

तदतिरिक्तं यथा यथा आदर्शाः अधिकाधिकं बुद्धिमन्तः भवन्ति, यथा o1, यत् अनेकपीएचडी-उपाधियुक्तानां मनुष्याणां समकक्षं भवति, तथैव मूल्याङ्कनं अधिकाधिकं कठिनं भवति

कदाचित्, तेषां कृते दीर्घकालं भवति यत् मॉडलः सम्यक् कार्यं करोति वा इति निर्धारयितुं, अन्ते च बहवः सामान्यतया प्रयुक्ताः उद्योगस्य मापदण्डाः संतृप्ताः भवन्ति, तथा च तेषां o1 इत्यस्य क्षमतायाः अनुकूलानि मापदण्डानि पुनः अन्वेष्टव्यानि भवन्ति

आदर्शविकासप्रक्रियायाः अतिरिक्तं o1 मॉडलस्य कृते तेषां प्रियप्रयोगप्रकरणानाम् विषये अपि शोधकर्तारः पृष्टाः आसन् ।

ह्युङ्ग् वोन् चुङ्ग् इत्यनेन उक्तं यत् o1 उत्तमः कोडिंग् सहायकः भवितुम् अर्हति।

सः प्रायः कार्यं कुर्वन् tdd (test-driven development) विकासपद्धतिं अनुसृत्य o1 इत्यस्य साहाय्येन यूनिट् टेस्ट् लेखनात् स्वं रक्षितुं शक्नोति तस्य स्थाने सः प्रत्यक्षतया आवश्यकताः निर्दिष्टुं शक्नोति तथा च मॉडलं स्वयमेव लिखितुं शक्नोति।

तदतिरिक्तं, सम्मुखीकृतः त्रुटिसन्देशः प्रत्यक्षतया o1 इत्यत्र अपि क्षिप्तुं शक्यते यद्यपि कदाचित् प्रत्यक्षतया समस्यायाः समाधानं कर्तुं न शक्नोति तथापि संकलकात् उत्तमं प्रश्नं पृच्छितुं शक्नोति तथा च त्रुटिसमाधानं कर्तुं भवतः सहायतां कर्तुं शक्नोति

जेसन वेइ इत्यनेन उक्तं यत् सः प्रायः o1 इत्यस्य उपयोगं मस्तिष्कविक्षेपसाझेदाररूपेण करोति, तथा च येषां विषयेषु चर्चा कर्तुं शक्यते, तेषां परिधिः अत्यन्तं विस्तृता अस्ति, यत्र यन्त्रशिक्षणसमस्यायाः समाधानं कथं करणीयम् इति आरभ्य ब्लोग् अथवा ट्वीट् कथं मसौदां करणीयम् इति यावत्।

अस्मिन् वर्षे मेमासे एलएलएम-मूल्यांकनस्य विषये सः लिखितः एकः ब्लोग् o1 इत्यस्य मतानाम् आकर्षणं कृतवान्, यथा लेखस्य संरचना, विभिन्नमूल्यांकनमापदण्डानां लाभहानिः, लेखनशैली च।

openai इत्यत्र कार्यं कीदृशं भवति ?

अस्मिन् विषये बहवः जनाः सर्वेषां बुद्धिः, दलस्य वातावरणस्य सामञ्जस्यस्य च विषये चर्चां कृतवन्तः ।

यथा, अहं सप्ताहं यावत् एकं कोडं त्रुटिनिवारणं कुर्वन् आसीत्, ततः गच्छन् एकः सहकर्मी प्रतिदिनं अत्यन्तं स्मार्टसहकारिभिः सह समयं व्यतीतवान् तत्क्षणमेव तस्य समाधानं कृतवान्;

मार्क चेन् इत्यनेन "स्ट्रॉबेरी" परियोजनायाः वर्णनं अतीव "जैविक" परियोजना इति कृतम्, यतः व्यावसायिकविषयेषु सर्वेषां स्वकीयाः मताः मताः च सन्ति, तेषां सर्वेषां विचाराः सन्ति येषां प्रचारं ते उत्साहेन कर्तुम् इच्छन्ति

यदा एते विचाराः एकत्र आगमिष्यन्ति तदा स्फुलिङ्गाः स्फुटिताः भविष्यन्ति, हिमगदा इव हिमगदाः च भविष्यन्ति ।

तथापि आग्रहीत्वस्य परः पक्षः अस्ति यत् सर्वे स्वमतानाम् आग्रहं कुर्वन्ति, परन्तु ते हठिनः न भवन्ति । तेषां दावानां खण्डनं कुर्वन्तः वस्तुनिष्ठं परिणामं दृष्ट्वा तेषां मनः अपि परिवर्तयिष्यन्ति।

अतः अपि प्रशंसनीयं यत् अत्यन्तं स्मार्टजनानाम् अयं समूहः अपि अतीव सुन्दरः अस्ति तथा च सहकारिणः एकत्र भोजनं कुर्वन्ति, एकत्र आलम्बन्ते च अनुभवः"।

ओ१-मिनी पृष्ठतः कथा

o1-mini इत्यस्य विमोचनस्य प्रेरणा अधिकान् शोधकर्तृभ्यः एतादृशानि आदर्शानि प्रदातुं वर्तते येषां बजटं न्यूनं भवति परन्तु तदपि प्रबलाः अनुमानक्षमताः सन्ति ।

इदं "तर्कविशेषज्ञम्" इति वक्तुं शक्यते, पूर्वं सर्वोत्तम-openai-प्रतिरूपात् चतुरतरम् अस्ति ।

अपि च, व्ययः, विलम्बः च अतीव न्यूनः भवति ।

सम्भवतः, प्रसिद्धं व्यक्तिं जन्मतिथिं यावत् न जानाति इति अनिवार्यं स्यात्, परन्तु तस्य प्रभावीरूपेण तर्कस्य क्षमता, बहु प्रज्ञा च अस्ति

ओपनएआइ-संशोधकाः अवदन् यत् ते एल्गोरिदम् इत्यस्य अधिकं सुधारं करिष्यन्ति येन उत्तम-लघु-माडल-सङ्गतिः भवति ।

तदतिरिक्तं विश्वस्य शोधकर्तारः अधिकगणना-हार्डवेयरयोः निवेशं कुर्वन्ति, येन दीर्घकालं यावत् मॉडल-व्ययस्य घातीयरूपेण न्यूनता अभवत्

एकः दोषः तु अस्ति यत् वयं नूतनमार्गं अन्वेष्टुं अधिकं समयं न व्यतीतवन्तः।

o1 इत्यस्य नूतनं प्रतिमानं अस्माकं आविष्कारः अस्ति - अनुमानमापनम्, यत् गणनाशक्तिदक्षतां अपि अनुकूलितुं शक्नोति ।

किं भवन्तं शोधं कर्तुं प्रेरयति ?

किं कारणं यत् अयं "बुद्धिमस्तिष्कानाम्" समूहः एकत्र आगत्य तेषां संशोधनं कर्तुं प्रेरयितुं शक्नोति?

एकः शोधकः अवदत् यत् सः स्वस्य प्रतिरूपस्य उपयोगेन अनुमानं कर्तुं भिन्न-भिन्न-मार्गेषु चिन्तनं रोमाञ्चकं भवति ।

अन्ये तु अवदन् - "सर्वं भद्रं कठिनसमये आगच्छति" इति ।

o1 एतावत् शीघ्रं उत्तरं दातुं शक्नोति इति तथ्यं प्रथमं सोपानं यत् दीर्घकालं यावत् प्रश्नानां विषये चिन्तयितुं शक्नोति। भविष्ये तस्य अग्रिमयात्रायाः प्रति गन्तुं मासानां वर्षाणां वा संशोधनस्य आवश्यकता भविष्यति ।

"अस्माकं अल्पसंख्यायाः प्रभावः विश्वं परिवर्तयितुं शक्नोति इति चिन्तनं अतीव रोमाञ्चकं सार्थकं च भवति।"

अत्यन्तं आकर्षकं वस्तु अस्ति यत् नूतनं प्रतिमानं तानि कार्याणि अनलॉक् करोति यत् पूर्वं मॉडल् पूर्णं कर्तुं न शक्तवान् एतत् केवलं कतिपयानां प्रश्नानाम् उत्तरं न ददाति, अपितु वास्तवतः योजनायाः माध्यमेन नूतनानां क्षमतानां सामान्यीकरणं, त्रुटिः सम्यक् करोति।

अतः अपि अधिकं o1 नूतनं ज्ञानं जनयितुं शक्नोति, यत् वैज्ञानिक-आविष्कारस्य रोमाञ्चकारीतमः भागः अस्ति ।

शोधकर्तारः वदन्ति यत् अल्पकाले एव एतत् प्रतिरूपं स्वस्य विकासे अधिकाधिकं शक्तिशाली योगदानदाता भविष्यति।

अन्ते यदा o1 इत्यस्य प्रभारी व्यक्तिः पृष्टवान् यत् "किं अन्ये उल्लेखनीयाः अवलोकनानि सन्ति?"

जेसन वेइ साझां कृतवान्, "एकं रोचकं अवलोकनं यत् प्रत्येकं प्रशिक्षितं प्रतिरूपं किञ्चित् भिन्नं भवति तथा च स्वकीयाः विचित्रताः सन्ति, यथा कलाकृतिः। एषा विशिष्टता प्रत्येकस्मिन् प्रतिरूपे व्यक्तित्वस्य स्पर्शं योजयति

भिडियोस्य पूर्णं संस्करणं निम्नलिखितम् अस्ति ।

समाचारं

आमुख

मम सम्पर्कसूचना