openai o1 मॉडलः बहिः आगच्छति, पञ्चस्तरीयः agi पुनः भङ्गं करोति! अत्यन्तं तर्कयुक्तः सुपर डाक्टर्, उत्तरी किङ्ग् राजवंशस्य फुडान विश्वविद्यालयस्य चीनीयः पुण्यकर्माणि

openai o1 मॉडलः बहिः आगच्छति, पञ्चस्तरीयः agi पुनः भङ्गं करोति! तर्कशास्त्रे सुपर-डॉक्टर्-उपाधियुक्तः पुरुषः, उत्तर-किङ्ग्-वंशस्य फुडान-विश्वविद्यालयस्य चीनीयः यः पुण्यकर्माणि कृतवान्

2024-09-13

अधुना एव openai इत्यस्य सर्वाधिकशक्तिशालिनः o1 श्रृङ्खला मॉडल् अचानकं ऑनलाइन आगताः । विना चेतावनीम् openai इत्यनेन एतत् गरजम् क्षिप्तम् ।

सप्ताहद्वये एव ऑनलाइन इति कथ्यमानं स्ट्रॉबेरी-माडलं वस्तुतः दिवसद्वयेन एव आगतं!

अद्य आरभ्य, o1-preview chatgpt इत्यस्मिन् सर्वेभ्यः plus तथा team उपयोक्तृभ्यः, एपिआइ इत्यस्मिन् tier 5 विकासकानां कृते च प्रसारितं भविष्यति ।

तस्मिन् एव काले openai इत्यनेन o1-mini इति अपि विमोचितम् - एकं व्यय-प्रभावी अनुमानं प्रतिरूपं यत् stem, विशेषतः गणितं, कोडिंग् च अतीव उत्तमम् अस्ति ।

o1 मॉडलस्य अद्यापि दोषाः सीमाः च सन्ति, दीर्घकालस्य अपेक्षया प्रथमप्रयोगे अधिकं प्रभावशालिनी भवति ।

जटिलतर्कशास्त्रे नूतनस्य o1 श्रृङ्खलायाः प्रदर्शनं सम्पूर्णतया नूतनस्तरं प्रति उन्नतं कृतम् अस्ति यत् अस्य सत्यानि सार्वभौमिकतर्कक्षमतानि सन्ति इति वक्तुं शक्यते।

बेन्चमार्कपरीक्षाणां श्रृङ्खलायां gpt-4o इत्यस्य तुलने o1 इत्यनेन पुनः विशालः सुधारः कृतः अस्ति यत् एतत् गणितीय ओलम्पियाड् इत्यस्मिन् स्वर्णपदकं जितुम् अस्ति मानवीय पीएचडी स्तर!

ओपनएआइ-संशोधकः जेसन वेइ इत्यनेन उक्तं यत् o1-mini इति गतवर्षे दृष्टं सर्वाधिकं आश्चर्यजनकं शोधपरिणामम् अस्ति । एकः लघुः आदर्शः वस्तुतः एआइएमई गणितस्पर्धायां ६०% अधिकं स्कोरं प्राप्तवान् ।

तथापि openai लेखस्य परिशिष्टात् न्याय्यं चेत्, अस्मिन् समये विमोचितं पूर्वावलोकनं लघु च o1 इत्यस्य केवलं "castrated versions" इति दृश्यते ।

inference scaling एकं नूतनं प्रतिमानं उद्घाटयति

एनवीडिया वरिष्ठवैज्ञानिकः जिम फैन् इत्यनेन o1 मॉडलस्य पृष्ठतः सिद्धान्तानां अधिकं विश्लेषणं कृतम् ।

सः अवदत् यत् अनुमानसमयमापनस्य नूतनप्रतिमानं व्यापकरूपेण लोकप्रियं कृत्वा परिनियोजितं भवति। यथा सटनः "a bitter lesson" इत्यस्मिन् उक्तवान्, केवलं द्वौ प्रौद्योगिकीौ स्तः ये कम्प्यूटिंग् शक्तिं अनन्तरूपेण स्केल कर्तुं शक्नुवन्ति: शिक्षणं अन्वेषणं च ।

अधुना, अस्माकं ध्यानं उत्तरं प्रति प्रेषयितुं समयः अस्ति।

1. अनुमानं कर्तुं भवतः विशालानां आदर्शानां आवश्यकता नास्ति।

2. प्रशिक्षणपूर्व/प्रशिक्षणोत्तरतः अनुमानसेवासु गणनानां बृहत् परिमाणं स्थानान्तरयन्तु

3. openai इत्यनेन तर्क-मापन-नियमस्य आविष्कारः अतीव प्राक् एव कृतः स्यात्, परन्तु शैक्षणिक-समुदायः अधुना एव तस्य आविष्कारं कर्तुं आरब्धवान् ।

4. o1 इत्यस्य व्यावहारिकप्रयोगे स्थापनं शैक्षणिकमापदण्डेषु उत्तमं प्रदर्शनं कर्तुं अपेक्षया बहु कठिनम् अस्ति

5. स्ट्रॉबेरी सहजतया आँकडा उड्डयनचक्रं भवितुम् अर्हति

openai इत्यस्य पूर्ववर्गीकरणात् न्याय्यं चेत् o1 इत्यनेन l2 स्तरस्य तर्कक्षमता प्राप्ता अस्ति ।

कश्चन तस्य परीक्षणं कृत्वा ज्ञातवान् यत् ओ१ सफलतया अतीव कठिनं काव्यं लिखितवान् अस्मिन् क्रमे एतत् कार्यं सफलतया सम्पन्नं कर्तुं आवश्यकं योजना, चिन्तनं च उन्मत्तं आसीत्, तर्कसमयगणना च अतीव शीतला आसीत्

परन्तु एआइ विशेषज्ञः कार्पाथी o1-mini इत्यस्य परीक्षणानन्तरं शिकायतुं प्रवृत्तः यत्, "एतत् मम कृते riemann hypothesis इत्यस्य समाधानं कर्तुं नकारितवान्। मॉडल् आलस्यम् अद्यापि एकः प्रमुखः समस्या अस्ति, यत् वास्तवतः दुःखदम् अस्ति।

nyu सहायकप्रोफेसरः xie saining अपि "को बृहत्तरः, 9.11 वा 9.8?"

"स्ट्रॉबेरीमध्ये कति r's सन्ति" इति शास्त्रीयसमस्या स्वाभाविकतया o1 कृते समस्या नास्ति ।

बिग वी मैथ्यू सबिया इत्यनेन उक्तं यत् सर्वाधिकं भयङ्करं वस्तु अस्ति यत् gpt-5 o1 मॉडल् इत्यस्मात् ६९ गुणाधिकं शक्तिशाली अस्ति । साधारणाः जनाः केवलं गजानां तर्कशक्तिं तार्किकक्षमतां च न अवगच्छन्ति ।

किं मनुष्याः वास्तवमेव सज्जाः सन्ति ?

मनुष्यान् भ्रमितवन्तः तार्किकतर्कसमस्याः o1 इत्यनेन समाधानं प्राप्नुवन्ति

वयं सर्वे जानीमः यत् पूर्वस्य एलएलएम-सम्बद्धानां कृते तार्किकतर्कः पारयितुं कठिनः पर्वतः आसीत् ।

परन्तु अस्मिन् समये o1 मॉडलस्य जटिलतार्किकसमस्यानां समाधानस्य क्षमता आश्चर्यजनकम् अस्ति ।

यथा, निम्नलिखितयुक्तिप्रश्नः - .

राजकुमार्याः वयः भविष्ये कस्मिन्चित् काले राजपुत्रस्य वयसः समं भवति, यदा पूर्वं कस्मिन्चित् काले राजकुमार्याः वयः द्विगुणं भविष्यति, तस्मिन् काले च पुरा राजकुमार्याः वयः अर्धं भविष्यति तेषां वर्तमानयुगस्य योगः। राजपुत्रस्य राजपुत्रस्य च कानि युगानि अधुना । कृपया अस्याः समस्यायाः सर्वाणि समाधानं प्रदातव्यम्।

अयं प्रश्नः अत्यन्तं कठिनः उच्चारणं मनुष्याणां कृते अपि प्रश्नस्य अर्थस्य सम्यक् अनुवादं कर्तुं, अवगन्तुं च बहु परिश्रमः करणीयः स्यात् ।

आश्चर्यजनकं यत् o1 मॉडल् वस्तुतः केषाञ्चन चिन्तनपदानां अनन्तरं सम्यक् उत्तरं दत्तवान्!

चरपरिभाषा, समस्यानां अवगमनं, समीकरणानां समाधानं च इत्यादीनां पदानां माध्यमेन निष्कर्षः भवति यत् राजकुमार्याः आयुः ८k वर्षाणि, राजकुमारस्य आयुः ६k वर्षाणि च अस्ति, यत्र k धनात्मकः पूर्णाङ्कः अस्ति

अन्यस्मिन् प्रदर्शने जेसन वेइ अस्मान् दर्शितवान् यत् o1 इत्यनेन कथं प्रॉम्प्ट्-आधारितं विडियो-क्रीडां प्रोग्रामितम् ।

यथा भवन्तः पश्यन्ति, सः प्रॉम्प्ट् इत्यस्य प्रतिलिपिं o1 मॉडल् मध्ये कृतवान् ।

तदनन्तरं मॉडल् २१ सेकेण्ड् यावत् चिन्तयित्वा सम्पूर्णं चिन्तनपदं प्रदर्शितवान् ।

तदनन्तरं ततः आदर्शाय कोडः दीयते ।

कोडं चालयित्वा अतीव सुचारुः क्रीडा अभवत्!

वयं o1 इत्यस्मै भ्रान्तिकारककोरिया-वाक्यानां समूहम् अपि क्षिप्तवन्तः, तानि आङ्ग्लभाषायां अनुवादयितुं च पृष्टवन्तः, तत् च वस्तुतः तत् कृतवान् ।

यतः यद्यपि वाक्यं व्याकरणदृष्ट्या अस्पष्टं तथापि o1 तदपि पदे पदे विकोडयति ।

अन्ते o1 उत्तरं दत्त्वा हास्येन अवदत् यत् ग्रहे कोऽपि अनुवादकः तत् कर्तुं न शक्नोति, परन्तु कोरियादेशिनः सहजतया तत् चिन्तयितुं शक्नुवन्ति एषा स्वरव्यञ्जनयोः विविधपरिवर्तनद्वारा कोरियाभाषायाः गुप्तीकरणस्य पद्धतिः अस्ति।

तस्य विपरीतम् gpt-4o पूर्णतया भ्रमितः आसीत्, अवगन्तुं असमर्थः च आसीत् ।

o1 इत्यस्य सुपर प्रदर्शनेन तार्किकतर्कः नूतनस्तरं प्रति उन्नतः इति द्रष्टुं शक्यते ।

कथं क्रियते ?

सुदृढीकरणशिक्षणं महतीं उपलब्धयः करोति, बृहत् मॉडलस्य आल्फागो इत्यस्य समयः आगच्छति

o1 श्रृङ्खलायाः आदर्शानां अतीतानां च मध्ये अन्तरं अस्ति यत् प्रश्नस्य उत्तरं दातुं पूर्वं "समस्यायाः विषये चिन्तयन्" अधिकं समयं यापयिष्यति, यथा मनुष्याः

प्रशिक्षणद्वारा ते स्वविचारप्रक्रियाणां परिष्कारं कर्तुं, भिन्नानि रणनीतयः प्रयतन्ते, स्वयमेव दोषान् ज्ञातुं च शिक्षन्ते ।

अस्य पृष्ठतः शक्तिशाली "सुदृढीकरणशिक्षण" एल्गोरिदम् महत् योगदानं दत्तवान् । तदा यदा आल्फागो मानवशतरंजक्रीडकान् पराजितवान् तदा तस्य पृष्ठतः आर एल एल्गोरिदम् इत्यस्य उपयोगः कृतः ।

एतत् उच्चस्तरीयदत्तांशैः सह कुशलं प्रशिक्षणं सम्पन्नं करोति तथा च cot इत्यस्य उपयोगेन उत्पादकरूपेण चिन्तनं कर्तुं llm इत्यस्मै शिक्षयति।

cot तथा openai शोधकर्तुः प्रस्तावस्य पृष्ठतः विकासकः jason wei इत्यनेन उक्तं यत् o1 केवलं संकेतद्वारा cot पूर्णं न करोति, परन्तु अन्ततः श्रृङ्खलाचिन्तनस्य उत्तमं प्रदर्शनार्थं rl प्रशिक्षणप्रतिमानानाम् उपयोगं करोति।

अपि च, openai-दलेन मॉडल् मध्ये scaling law इत्यस्मिन् “नवः नियमः” अपि आविष्कृतः ।

o1 इत्यस्य कार्यप्रदर्शने निरन्तरं सुधारः भवति यतः अधिकं सुदृढीकरणशिक्षणं (प्रशिक्षणसमये गणितं) अधिकं च चिन्तनसमयं (परीक्षासमये गणितं) निवेशितं भवति।

scaling इत्यस्य समये अस्याः पद्धतेः सीमाः llm पूर्वप्रशिक्षणस्य सीमाभ्यः सर्वथा भिन्नाः सन्ति ।

प्रशिक्षणचरणस्य परीक्षणचरणस्य च गणनानां परिमाणस्य वृद्ध्या सह o1 इत्यस्य कार्यप्रदर्शने निरन्तरं सुधारः भवति ।

स्वर्णपदकदलानां सूची

तर्कशास्त्रम् अध्ययनम्

संस्थापकयोगदातृषु इलिया सुत्स्केवरः, यः स्वकार्यं त्यक्त्वा व्यवसायं आरभ्य, सः स्पष्टतया सूचीकृतः अस्ति, परन्तु सः ग्रेग् ब्रॉकमैन इत्यादिभिः सह कार्यकारीनेतृत्वे (कार्यकारीनेतृत्वे) सूचीकृतः नास्ति, तस्य पूर्वसंशोधनकार्यं एव आधारं स्थापितवान् ओ१ कृते ।

इलिया इत्यनेन राजीनामा दत्तस्य अनन्तरं ओपनएआइ इत्यनेन अपि तस्य बहवः पत्राणि खनित्वा तानि प्रकाशयितुं आरब्धानि, यथा जीपीटी-४ मॉडलस्य व्याख्याक्षमतायाः विषये शोधः ।

अधुना सः यत् एस.एस.आइ.

होंगयु रेन

होङ्ग्यु रेन् पेकिङ्ग् विश्वविद्यालयात् सङ्गणकविज्ञाने स्नातकपदवीं प्राप्तवान् तथा च स्टैन्फोर्डतः डॉक्टरेट् उपाधिं प्राप्तवान् सः गतवर्षस्य जुलैमासात् openai इत्यत्र सम्मिलितः अस्ति सः पूर्वं गूगल, एप्पल्, एनवीडिया, माइक्रोसॉफ्ट इत्यादिषु कम्पनीषु कार्यं कृतवान्।

जेसन वेई

जेसन वेइ सम्प्रति ओपनएआइ इत्यत्र शोधकः अस्ति । २०२०-२०२३ मध्ये सः गूगल-ब्रेन्-संस्थायां कार्यं कृतवान्, प्रसिद्धं cot, निर्देश-सूक्ष्म-समायोजनं प्रस्तावितवान्, बृहत्-माडलस्य उद्भव-क्षमतायाः विषये च एकं पत्रं प्रकाशितवान् ।

केविन् यु

केविन् यू सम्प्रति ओपनएआइ इत्यत्र शोधकः अस्ति । सः भौतिकशास्त्रे खगोलभौतिकशास्त्रे च स्नातकोत्तरपदवीं, यूसी बर्कलेतः क्रमशः २०१४ तमे वर्षे २०२१ तमे वर्षे च तंत्रिकाविज्ञानस्य डॉक्टरेट् पदवीं प्राप्तवान् ।

शेङ्गजिया झाओ

शेङ्गजिया झाओ सिङ्घुआ विश्वविद्यालयात् स्नातकपदवीं प्राप्तवान् तथा च स्टैन्फोर्डतः पीएचडी अपि प्राप्तवान् जूनमासे ओपनएआइ तकनीकीदले सम्मिलितवान् सः जीपीटी-४ इत्यस्य लेखकेषु अपि अन्यतमः अस्ति

वेण्डा झोउ

वेण्डा झोउ गतवर्षे ओपनएआइ इत्यत्र सम्मिलितवती। पूर्वं सः न्यूयॉर्कविश्वविद्यालयस्य डाटा साइंस सेण्टर प्रयोगशालायां मूर्-स्लोन् फेलो आसीत् ।

सः २०१५ तमे वर्षे केम्ब्रिजविश्वविद्यालयात् स्नातकोत्तरपदवीं प्राप्तवान्, २०२० तमे वर्षे कोलम्बियाविश्वविद्यालयात् सांख्यिकीविषये पीएचडीपदवीं च प्राप्तवान् ।

फ्रांसिस् गीत

फ्रांसिस् सोङ्ग् इत्यनेन हार्वर्डविश्वविद्यालयात् भौतिकशास्त्रे स्नातकपदवीं, येलविश्वविद्यालयात् भौतिकशास्त्रे पीएच.डी. सः २०२२ तमे वर्षे ओपनएआइ-संस्थायां सम्मिलितः, ततः पूर्वं डीपमाइण्ड्-संस्थायां शोधवैज्ञानिकः, न्यूयॉर्क-विश्वविद्यालये च सहायक-शोध-वैज्ञानिकः इति कार्यं कृतवान् ।

मार्क चेन्

मार्क चेन् २०१८ तमे वर्षे ओपनएआइ इत्यत्र सम्मिलितस्य अनन्तरं फ्रन्टियर रिसर्च इत्यस्य निदेशकरूपेण कार्यं कृतवान्, शोधस्य उपाध्यक्षस्य बॉब मेक्ग्रे इत्यस्य अधीनं कार्यसमूहस्य निरीक्षणं कृतवान् ।

एम.आइ.टी.

सम्प्रति सः अमेरिकन-आइओआइ-प्रशिक्षणदलस्य प्रशिक्षकत्वेन अपि कार्यं करोति ।

एकदा सूचनापत्रेण अनुमानितम् आसीत् यत् भविष्ये मार्क चेन् ओपनएआइ इत्यस्य नेतृत्वस्य सदस्यः भविष्यति इति ।

तदतिरिक्तं नेतृत्वदले इलियातः कार्यभारं स्वीकृतवान् मुख्यवैज्ञानिकः जाकुब् पचोक्की, ओपनएआइ इत्यस्य कतिपयेषु अवशिष्टेषु सहसंस्थापकेषु अन्यतमः वोज्चेच् ज़रेम्बा च सन्ति

तकनीकीसुरक्षाविषये तर्कः

जिएकी यु

जीकी यू फुडान् विश्वविद्यालयात् इलेक्ट्रॉनिक-इञ्जिनीयरिङ्ग-विषये स्नातकपदवीं प्राप्तवती, सा आदान-प्रदानार्थं हाङ्गकाङ्ग-विज्ञान-प्रौद्योगिकी-विश्वविद्यालयं गता, ततः प्रिन्स्टन्-विश्वविद्यालयात् पीएचडी-पदवीं प्राप्तवती । सा १२ वर्षाणि यावत् फेसबुक्-संस्थायां कार्यं कृतवती, सॉफ्टवेयर-इञ्जिनीयरात् सॉफ्टवेयर-इञ्जिनीयरिङ्ग-प्रबन्धकरूपेण संक्रमणं कृतवती, गतवर्षस्य अगस्तमासे च openai-इत्यत्र अभियांत्रिकी-प्रबन्धिकारूपेण सम्मिलितवती

कै जिओ

जिओ काई एमआईटीतः स्नातकपदवीं पीएचडी च स्नातकपदवीं प्राप्तवान् सः स्नातकरूपेण गणितस्य कम्प्यूटरविज्ञानस्य च द्विगुणं उपाधिं प्राप्तवान् सः शैक्षणिकयात्रायै आक्सफोर्डविश्वविद्यालयं गतः, deepmind, microsoft he इत्यादिषु कम्पनीषु प्रशिक्षणस्य अनुभवं च प्राप्तवान् २०२२ तमस्य वर्षस्य सितम्बरमासे openai इत्यत्र सम्मिलितः ।

लिलियन वेङ्ग

लिलियन वेङ्गः सम्प्रति ओपनएआइ सुरक्षाप्रणाल्याः प्रमुखः अस्ति, मुख्यतया यन्त्रशिक्षणं, गहनशिक्षणम् इत्यादिषु शोधकार्य्येषु संलग्नः अस्ति ।

सा पेकिङ्ग् विश्वविद्यालयात् सूचनाप्रणालीषु सङ्गणकशास्त्रेषु च स्नातकपदवीं प्राप्तवती सा अल्पकालिकविनिमयार्थं हाङ्गकाङ्गविश्वविद्यालयं गता, ततः इण्डियानाविश्वविद्यालयात् ब्लूमिङ्गटनतः पीएचडी प्राप्तवती

मार्क चेन् इव लिलियन् अपि ओपनएआइ नेतृत्वे उदयमानः तारा इति मन्यते ।

दलानाम् सम्पूर्णसूची निम्नलिखितरूपेण अस्ति ।

जैव रासायनिक भौतिकी, मानव डॉक्टरेट् स्तरात् परम्

openai द्वारा निर्मितस्य नूतनस्य मॉडलस्य श्रृङ्खलायाः रूपेण o1 इत्यस्य बलं किम्?

प्रतियोगिताप्रोग्रामिंगसमस्यानां शीर्ष ८९% मध्ये स्थानं प्राप्तवान् (codeforces);

सर्वाधिक महत्त्वपूर्णं यत् भौतिकशास्त्रस्य, जीवविज्ञानस्य, रसायनशास्त्रस्य च समस्यानां (gpqa) बेन्चमार्कपरीक्षायां मानवीयपीएचडीस्तरं अतिक्रमति ।

तर्कार्थं math तथा gsm8k इत्यादिषु सामान्यतया प्रयुक्तेषु बेन्चमार्कपरीक्षासु o1 तथा च अनेके हाले अत्याधुनिकप्रतिमानाः संतृप्तप्रदर्शनं प्राप्तवन्तः अतः openai मुख्यतया आदर्शस्य गणितीयतर्कक्षमतायाः मूल्याङ्कनार्थं aime इत्यस्य चयनं करोति, अपि च अन्येषां मानवपरीक्षाणां तथा बेन्चमार्करूपेण।

एआइएमई अमेरिकादेशस्य सर्वोत्तमानां उच्चविद्यालयस्य छात्राणां गणितीयक्षमतां चुनौतीं दातुं विनिर्मितः अस्ति २०२४ तमे वर्षे एआइएमई परीक्षायां gpt-4o इत्यनेन औसतेन केवलं १२% (१.८/१५) प्रश्नानां समाधानं कृतम्।

परन्तु o1 इत्यस्य सुधारः अत्यन्तं महत्त्वपूर्णः अस्ति, समासे ७४% (११.१/१५) प्रश्नानां समाधानं भवति, तथा च ६४ नमूनासु बहुमतमतदानं कृत्वा ८३% (१२.५/१५) यावत् भवति यदि वयं स्कोरिंग् फंक्शन् इत्यस्य उपयोगं कुर्मः तथा च १००० नमूनानां पुनः क्रमं कुर्मः तर्हि सटीकता ९३% (१३.९/१५) अपि प्राप्नोति ।

१३.९ इति स्कोरस्य अर्थः अस्ति यत् o1 इत्यस्य स्तरः देशस्य शीर्ष ५०० छात्राणां मध्ये प्राप्तवान् अस्ति तथा च अमेरिकनगणितीय-ओलम्पियाड्-क्रीडायाः अन्तिम-अङ्कं अतिक्रान्तवान्

codeforces तथा gpqa diamond इत्यादिषु चुनौतीपूर्णकार्येषु o1 gpt-4o इत्यस्मात् दूरं अतिक्रमति ।

o1 चुनौतीपूर्णानुमानमापदण्डे gpt-4o इत्यस्मात् बहु अधिकं प्रदर्शनं करोति

जीपीक्यूए डायमण्ड् रसायनशास्त्रस्य, भौतिकशास्त्रस्य, जीवविज्ञानस्य च क्षेत्रेषु विशेषज्ञतायाः परीक्षणं करोति । मनुष्यैः सह आदर्शस्य तुलनां कर्तुं दलेन स्वप्रश्नानां उत्तरं दातुं पीएचडी-सहिताः विशेषज्ञाः नियुक्ताः ।

फलतः o1 इत्यनेन एतेभ्यः मानवविशेषज्ञाभ्यः (६९.७) (७८.०) अधिकं प्रदर्शनं कृतम्, अस्मिन् मापदण्डे मनुष्यान् अतिक्रान्तं प्रथमं प्रतिरूपं जातम् ।

परन्तु अस्य परिणामस्य अर्थः न भवति यत् o1 सर्वेषु पक्षेषु पीएचडी-युक्तस्य मानवस्य अपेक्षया बलिष्ठः अस्ति, केवलं दर्शयति यत् एतत् अधिककुशलतया केषाञ्चन तत्सम्बद्धानां स्तरस्य समस्यानां समाधानं कर्तुं शक्नोति।

तदतिरिक्तं o1 इत्यनेन math, mmlu, mathvista इत्यादिषु बेन्चमार्कपरीक्षासु sota इत्यपि ताजगीकृतम् ।

दृश्यबोधक्षमतां सक्षमीकरणानन्तरं o1 mmmu इत्यत्र 78.1% स्कोरं प्राप्तवान्, मानवविशेषज्ञैः सह स्पर्धां कर्तुं प्रथमं मॉडलं जातम्, 57 mmlu उपवर्गेषु 54 मध्ये gpt-4o अतिक्रान्तवान्

o1 54/57 mmlu उपवर्गाणां सहितं विस्तृतपरिधिषु मानदण्डेषु gpt-4o इत्यस्मात् अधिकं प्रदर्शनं करोति

विचारशृङ्खला

सुदृढीकरणशिक्षणस्य माध्यमेन o1 स्वकीयानि त्रुटयः ज्ञात्वा सम्पादयितुं च जटिलपदार्थानाम् सरलतरपदेषु विभक्तुं च शिक्षितवान् ।

यदा वर्तमानः कार्यं न करोति तदा भिन्नानि पद्धतीनि अपि प्रयतते । एषा प्रक्रिया आदर्शस्य अनुमानक्षमतासु महत्त्वपूर्णतया सुधारं करोति ।

“क्रिप्टोग्राफी” इत्यस्य उदाहरणं गृह्णामः ।

प्रश्नः अस्ति यत् "पदे पदे चिन्तयतु" इति एन्क्रिप्टेड् अस्ति तथा च "oyfjdnisdr rtqwainr acxz mynzbhhx" इत्यनेन सह सङ्गतम् अस्ति।

एतादृशे समस्यायां gpt-4o सर्वथा असहायः इति द्रष्टुं शक्यते ।

o1 ज्ञातसूचनायाः आधारेण एन्क्रिप्शनगणनाविधिविषये तर्कं कृतवान्, अन्ते च सम्यक् उत्तरं दत्तवान् - there are three r's in strawberry.

gpt-4o

ओ१-पूर्वावलोकनम्

प्रोग्रामिंग

अस्मिन् मूल्याङ्कने openai इत्यनेन o1 इत्यस्य आधारेण प्रोग्रामिंग-वर्धितं प्रतिरूपं अधिकं प्रशिक्षितम् ।

२०२४ तमे वर्षे सूचनाशास्त्रे अन्तर्राष्ट्रीय-ओलम्पियाड् (ioi) इत्यस्मिन् नूतनं मॉडल् २१३ अंकं प्राप्तवान्, ४९% स्थाने च स्थानं प्राप्तवान् ।

पाठ्यक्रमस्य कालखण्डे मॉडल्-मध्ये षट्-चुनौत्य-अल्गोरिदमिक-समस्यानां समाधानार्थं दशघण्टाः भवन्ति, यत्र प्रत्येकस्य समस्यायाः कृते ५० प्रस्तुतीकरणस्य अनुमतिः भवति ।

यदा प्रस्तुतीकरणप्रतिबन्धाः शिथिलाः भवन्ति तदा आदर्शस्य कार्यप्रदर्शने महत्त्वपूर्णः सुधारः कर्तुं शक्यते । प्रतिप्रश्नं १०,००० प्रस्तुतीकरणस्य अनुमतिं दत्त्वा मॉडल् ३६२.१४ इति स्कोरं प्राप्तवान् - स्वर्णपदकस्य सीमां अतिक्रान्तवान् ।

अन्ते openai इत्यनेन codeforces इत्यनेन आयोजितायाः प्रतिस्पर्धात्मकायाः प्रोग्रामिंगप्रतियोगितायाः अपि अनुकरणं कृतम्-नियमानाम् सख्तीपूर्वकं अनुसरणं कृत्वा १० प्रस्तुतीकरणस्य अनुमतिः दत्ता ।

gpt-4o इत्यस्य elo स्कोरः ८०८ अस्ति, मानवक्रीडकानां ११% क्रमाङ्कः । नूतनं मॉडलं gpt-4o तथा o1 इत्येतयोः दूरं अतिक्रान्तवान्, 1807 इति उच्चं स्कोरं प्राप्तवान्, 93% खिलाडयः अतिक्रान्तवान् ।

अग्रे सूक्ष्म-समायोजनेन प्रोग्रामिंग-प्रतियोगितासु o1-सु सुधारः अभवत्: उन्नत-प्रतिरूपस्य सूचना-विज्ञानस्य २०२४ तमे वर्षे अन्तर्राष्ट्रीय-ओलम्पियाड्-मध्ये प्रतियोगिता-नियमानाम् अन्तर्गतं ४९ तमे प्रतिशते स्थानं प्राप्तम्

मानवप्राथमिकतामूल्यांकनम्

परीक्षायाः शैक्षणिकमापदण्डानां च अतिरिक्तं, openai इत्यनेन o1-पूर्वावलोकनस्य विरुद्धं gpt-4o इत्यस्य मानवीयप्राथमिकतानां मूल्याङ्कनं कृतम् यत्, डोमेनानां विस्तृतपरिधिषु चुनौतीपूर्णेषु, मुक्त-अन्त-प्रोम्प्ट्-शब्देषु।

अस्मिन् मूल्याङ्कने मनुष्याः o1-preview तथा gpt-4o इत्यस्मात् प्रॉम्प्ट् शब्दानां कृते अनामप्रतिक्रियाः पश्यन्ति तथा च ते कः प्रतिक्रियाः प्राधान्यं ददति इति मतदानं कुर्वन्ति।

तर्क-भारयुक्तेषु वर्गेषु यथा दत्तांशविश्लेषणं, प्रोग्रामिंग्, गणितं च, जनाः o1-पूर्वावलोकनं चयनं कर्तुं अधिकं सम्भावनाः भवन्ति । परन्तु केषुचित् प्राकृतिकभाषाकार्येषु gpt-4o श्रेष्ठम् अस्ति ।

अन्येषु शब्देषु, o1-पूर्वावलोकनं सम्प्रति सर्वेषां उपयोगपरिदृश्यानां कृते उपयुक्तं नास्ति ।

यत्र तर्कक्षमता अधिका महत्त्वपूर्णा भवति तत्र जनाः o1-पूर्वावलोकनं चयनं कर्तुं अधिकं प्रवृत्ताः भवन्ति

o1-mini अत्यन्तं व्यय-प्रभावी अस्ति

विकासकानां कृते अधिककुशलसमाधानं प्रदातुं openai इत्यनेन o1-mini - द्रुततरं सस्तां च अनुमानप्रतिरूपं विमोचितम् ।

लघुतरमाडलरूपेण o1-mini o1-पूर्वावलोकनात् ८०% सस्ता अस्ति ।

तर्कस्य आवश्यकता भवति परन्तु सामान्यविश्वज्ञानस्य आवश्यकता नास्ति इति अनुप्रयोगानाम् कृते एतत् शक्तिशाली, व्यय-प्रभावी च प्रतिरूपम् अस्ति ।

परन्तु वर्तमान o1 श्रृङ्खला अद्यापि प्रारम्भिकपदे एव अस्ति, तथा च संजालप्लग-इन्, दीर्घदूरसञ्चिकास्थापनं, चित्राणि च इत्यादीनि क्षमतानि अद्यापि एकीकृतानि न सन्ति अल्पकालीनरूपेण gpt-4o अद्यापि सर्वाधिकं बलिष्ठः खिलाडी अस्ति ।

सन्दर्भाः : १.

https://openai.com/index/llms-सह-तर्क-शिक्षण/

समाचारं

आमुख

मम सम्पर्कसूचना