GPT-4o mini बृहत् मॉडल-अखाडस्य शीर्षं प्राप्नोति, Ultraman: द्वयोः मासयोः अन्तः निःशुल्कं सूक्ष्म-समायोजनम्

GPT-4o mini बृहत् मॉडल-अखाडस्य शीर्षं प्राप्नोति, Ultraman: निःशुल्कं सूक्ष्म-ट्यूनिङ्गं मासद्वयस्य अन्तः

2024-07-24

क्रेसी आओफेइ मन्दिरात् आगच्छति
Qubits |.सार्वजनिक खाता QbitAI

अधुना एव GPT-4o लघु संस्करणेन स्वस्य “हाइलाइट् मोमेंट्” प्रारब्धम्——

lmsys विशालं आदर्शक्षेत्रं आरोहितवान्, पूर्णस्वास्थ्यसंस्करणेन सह प्रथमस्थानार्थं बद्धः, क्लाउड् ३.५ च त्यक्त्वा ।

सामान्यदत्तांशसमूहमूल्यांकनात् भिन्नः, विशालः आदर्शक्षेत्रः उपयोक्तृणां स्वकीयप्रश्नान् स्थापयित्वा स्वपदैः मतदानस्य परिणामः अस्ति, अतः "प्रश्नानां ब्रश"द्वारा शॉर्टकट् ग्रहीतुं न शक्यते, अतः इदं अधिकं वास्तविकम् अस्ति

एतत् परिणामं बहिः आगतं एव मुख्यकार्यकारी आल्ट्मैन् अपि उत्साहितः अभवत् :

मूल्याङ्कनपरिणामानां सम्मुखे वयं मूलतः आरक्षिताः भवितुम् प्रयत्नम् अकरोम, परन्तु यदा वयं दृष्टवन्तः यत् GPT-4o mini पूर्णस्वास्थ्यसंस्करणस्य समानं कार्यं करोति, परन्तु मूल्यं केवलं १/२० आसीत्, तदापि वयं बहु उत्साहिताः आसन्

नेटिजनाः तत् दृष्ट्वा ठीकम् इति अवदन्, परन्तु तेषां चिन्ता अधिका आसीत् यत् GPT-4o पत्रकारसम्मेलने प्रदर्शिता "तस्याः" कदा ऑनलाइन भविष्यति इति।

तस्मिन् एव काले OpenAI इत्यनेन अन्यत् सुसमाचारम् अपि प्रेषितम्, यत् विकासकानां कृते लाभं प्रदास्यति——

GPT-4o मिनीक्रमेण सूक्ष्म-समायोजनं उद्घाटितं भविष्यति, वर्तमानकाले टीयर 4 तथा टीयर 5 उपयोक्तृभ्यः उद्घाटितम् अस्ति, तथा च क्रमेण व्याप्तिः विस्तारयिष्यति ।

तथाइतः परं सेप्टेम्बर्-मासस्य २३ दिनाङ्कपर्यन्तं प्रतिदिनं २० लक्षं प्रशिक्षण-टोकनं निःशुल्कं उपयोक्तुं शक्नुवन्ति。

मिनी पूर्णस्वास्थ्यसंस्करणस्य सममूल्यम् अस्ति

80 तः अधिकैः मॉडलैः सह 1v1 प्रतियोगितायाः कोटिकोटिपरिक्रमणानां अनन्तरं lmsys सूचीयां GPT-4o mini इत्यस्य स्कोरः पूर्णस्वास्थ्यसंस्करणात् केवलं 7 अंकाः पृष्ठतः अस्ति

lmsys सूचीयाः व्यवस्थानुसारं एतत् ७-बिन्दु-अन्तरं श्रेणीं न प्रभावितं करोति, तथा च प्रथमस्थानस्य कृते द्वयोः मॉडलयोः बद्धत्वेन गण्यते ।

तस्य निकटतया अनुसरणं कुर्वन्ति क्लाउड् ३.५ तथा मिथुनपरिवाराः, तथैव जीपीटी-४ इत्यस्य अन्यद्वयं संस्करणं च ।

यदि वयं GPT-4o mini इत्यस्य कच्चानि आँकडानि पश्यामः तर्हि वयं पश्यामः यत् तस्य औसतविजयदरः 0.6 पूर्णस्वास्थ्यसंस्करणस्य पश्चात् द्वितीयः अस्ति ।

तयोः एव स्पर्धायाः परिणामं पश्यन् समानरूपेण मेलनं भवति ।

lmsys इत्यस्य प्रदर्शनेन ध्यानं आकर्षितस्य कारणं अस्ति यत् अस्मिन् स्पर्धाविधिनाम् एकः अद्वितीयः समुच्चयः अस्ति——

दत्तांशसमूहस्य उपयोगस्य स्थाने,उपयोक्तारः स्वकीयान् प्रश्नान् कल्पयित्वा 1-on-1 युद्धे यादृच्छिकरूपेण द्वौ मॉडलौ आकर्षयन्तु।, ततः कः मॉडलः उत्तमं कार्यं करोति इति चिनोतु ।

विकल्पं दातुं पूर्वं मॉडल् अनामिकः भवति, उपयोक्ता न जानाति यत् कोऽपि मॉडल् स्पर्धां करोति यदि मॉडल् किमपि लीक् करोति तर्हि मतदानं अमान्यं भविष्यति ।

एवं प्रकारेण प्राप्ताः अंकाः अधिकवास्तविकाः भवन्ति, येन न केवलं "प्रश्नानां निश्चयेन" कृत्रिमरूपेण उच्चाङ्कानां प्राप्तेः सम्भावना परिहृता, अपितु उपयोक्तृ-अनुभवस्य समीपे अपि भवति

एतत् विशालं आदर्शक्षेत्रं, अधुना एवशीर्ष यन्त्रशिक्षणसम्मेलने ICML2024 भागं गृहीतवान्。

अपि च lmsys इत्यस्य मूल्याङ्कनम् अपिOpenAI इत्यनेन सह अतीव लोकप्रियम्, आधिकारिकतया प्रक्षेपणात् पूर्वं GPT-4o mini इत्यस्य प्रारम्भिकं संस्करणं gpt-mini इति छद्मनाम्ना सूचीकृतम् आसीत् ।

तस्मिन् समये पूर्वमेव चतुर्थस्थाने आसीत्, GPT4-Turbo इत्यस्य समानस्तरस्य ।

पूर्वं GPT-4o इत्यस्य ऑनलाइन गमनात् पूर्वं lmsys इत्यत्र gpt2-chatbot इति छद्मनाम्ना अपि परीक्षणं कृतम् आसीत् ।

परन्तु केचन जनाः प्रश्नं कृतवन्तः यत् यद्यपि GPT-4o mini अतीव उत्तमं प्रदर्शनं करोति तथापि क्लाउड् 3.5 सोनेट् अतिक्रमयति इति वक्तुं अतिशयोक्तिः ।

केचन जनाः अपि स्पष्टतया अवदन् यत् lmsys पद्धतेः अखण्डता पतितुं आरब्धा अस्ति, परिवर्तनस्य आवश्यकता अस्ति, अन्यथा इदं पुनः उपयोगी परीक्षणमापदण्डं न भविष्यति

"लघुप्रतिरूपम्" अपि लुठितम् अस्ति

लघुसंस्करणस्य प्रारम्भः व्यय-प्रभावशीलतायाः विषये केन्द्रितः अस्ति ।

प्रति मिलियन इनपुट/आउटपुट टोकन, मूल्यानि क्रमशः १५ सेण्ट् तथा ६० सेण्ट् (प्रायः १.०९/४.३६ आरएमबी) सन्ति, यत् ३.५ टर्बो इत्यस्य आर्धं अपि न भवति

यदि वर्षद्वयात् पूर्वं GPT-3 इत्यस्य text-davinci-003 संस्करणस्य (तत्कालीनस्य सर्वोत्तमस्य मॉडलस्य) तुलने मूल्यं ९९% न्यूनीकृतम् अस्ति ।

उपयोक्तृभ्यः लघुमाडलं उद्घाटयितुं अतिरिक्तं OpenAI इत्यनेन क्रीडनस्य नूतनाः उपायाः अपि कल्पिताः——

"सुपर एलाइन्मेण्ट्" दलस्य मृत्योः अनन्तरं कार्ये बृहत् मॉडलस्य अनुकूलनार्थं बृहत् मॉडलस्य मापदण्डानां सहस्रभागः वा शतभागः वा युक्तस्य लघुप्रतिरूपस्य उपयोगः कृतः

प्रयोगे बृहत्-लघु-माडलयोः परस्परं "खेलः" भवति, बृहत्-माडलस्य निरन्तरं स्वस्य उत्पादनस्य अनुकूलनं समायोजनं च करणीयम् यत् लघु-माडलस्य विश्वासः भवति यत् सः सत्यं वदति ।

अस्य "क्रीडायाः" प्रक्रियायां बृहत्प्रतिरूपस्य क्षमतासु सुधारः अभवत्, तथा च सटीकतायां महत्त्वपूर्णहानिः विना अवगम्यतायाः महती उन्नतिः अभवत्

ओपनएआइ इत्यस्य अतिरिक्तं अन्यकम्पनयः अपि लघुमाडलं प्रारब्धवन्तः ।

यथा, GPT-4o mini इत्यस्मात् पूर्वं गूगलः एन्थ्रोपिक् च क्रमशः जेमिनी फ्लैश, क्लाउड् ३-हाइकु इत्येतयोः प्रारम्भं कृतवन्तौ ।

इदमपि वक्तुं शक्यते यत् GPT-4o mini इति OpenAI इत्यस्य द्वयोः मॉडलयोः विरुद्धं प्रतिहत्या अस्ति, यत् कार्यक्षमतायाः मूल्यस्य च दृष्ट्या एतयोः मॉडलयोः अतिक्रान्तम् अस्ति ।

यस्मिन् सप्ताहे GPT-4o mini इति विमोचनं जातम् तस्मिन् एव सप्ताहे Hugging Face तथा “European OpenAI” Mistral इत्येतयोः द्वयोः अपि लघुमाडलयोः प्रारम्भः अभवत् ।

एप्पल् अपि स्वस्य 7B मॉडल् प्रारब्धवान्, सर्वाणि प्रशिक्षणप्रक्रियाः संसाधनं च एकदा एव मुक्तस्रोतं कृतवान् ।

संक्षेपेण यावत् यावत् उपयोगस्य आवश्यकतानां पूर्तये कार्यप्रदर्शनं पर्याप्तं भवति तावत् लघुप्रतिरूपं निःसंदेहं अधिकं किफायती विकल्पः भवति ।

तत्सह लघुतरपरिमाणस्य अपि अर्थः अस्ति यत् टर्मिनलपक्षे चालयितुं शक्यते, गोपनीयतारक्षणादिपक्षेषु लाभं दर्शयति

एवं प्रकारेण "लघु" आदर्शाः किमर्थं अधिकाधिकं कुञ्चिताः भवन्ति इति अवगन्तुं न कठिनम् ।

सन्दर्भलिङ्कानि : १.
[1]https://x.com/sama/status/1815877987696533897/
[2]https://x.com/OpenAIDevs/status/1815836887631946015

समाचारं

GPT-4o mini बृहत् मॉडल-अखाडस्य शीर्षं प्राप्नोति, Ultraman: निःशुल्कं सूक्ष्म-ट्यूनिङ्गं मासद्वयस्य अन्तः

मिनी पूर्णस्वास्थ्यसंस्करणस्य सममूल्यम् अस्ति

"लघुप्रतिरूपम्" अपि लुठितम् अस्ति

आमुख

मम सम्पर्कसूचना