इदं भयंकरं भवति, GPT-4o Google इत्यस्य नूतनेन मॉडलेन, ChatGPT आधिकारिकलेखेन पराजितः अभवत्: सर्वे गभीरं निःश्वासं गृह्णन्ति

इदं भयंकरं, GPT-4o गूगलस्य नूतनेन मॉडलेन, ChatGPT आधिकारिकखातेन पराजितः अभवत्: सर्वे गभीरं निःश्वासं गृह्णन्ति

2024-08-02

आवाम्, GPT-4o गूगलस्य नूतनेन मॉडलेन अतिक्रान्तम् अस्ति!

सप्ताहे १२,००० तः अधिकाः जनाः अनामरूपेण मतदानं कृतवन्तः ।मिथुन १.५ प्रो (०८०१) २. गूगलस्य प्रतिनिधित्वेन प्रथमवारं lmsys-क्षेत्रे प्रथमस्थानं प्राप्तम् । (चीनीकार्यम् अपि प्रथमस्थानं प्राप्नोति)

तथा च अस्मिन् समये इदं द्विगुणं मुकुटम् अस्ति समग्रक्रमाङ्कनस्य अतिरिक्तं (एकमात्रः स्कोरः १३०० अस्ति), इदृश्य लीडरबोर्डप्रथमाङ्कः अपि अस्ति।

मिथुनपक्षस्य दलस्य प्रमुखः व्यक्तिः सिमोन टोकुमिने इत्यनेन उत्सवस्य कृते सन्देशः स्थापितः यत् -

(इदं नूतनं मॉडलं) अस्माभिः निर्मितं सर्वाधिकं शक्तिशाली चतुरतमः च मिथुनराशिः अस्ति।

एकः Reddit उपयोक्ता अपि अस्य मॉडलस्य "अति उत्तमम्" इति उक्तवान्, तस्य कार्यक्षमतायाः न्यूनीकरणं न भविष्यति इति आशां च प्रकटितवान् ।

अधिकाः नेटिजनाः उत्साहं प्रकटितवन्तः यत् OpenAI इत्यस्मै अन्ततः चुनौतीं प्राप्तम् अस्ति तथा च प्रतियुद्धार्थं नूतनं संस्करणं विमोचयिष्यति!

आधिकारिकं ChatGPT खातं अपि किमपि सूचयितुं बहिः आगतं।

उत्साहस्य मध्ये गूगल एआइ स्टूडियो इत्यस्य उत्पादस्य प्रमुखः घोषितवान् यत् मॉडल्...निःशुल्क परीक्षण चरण：

एआइ स्टूडियो इत्यत्र निःशुल्कं उपलब्धम्

नेटिजनः - गूगलः अन्ततः अत्र अस्ति!

कठोरतापूर्वकं वक्तुं शक्यते यत् जेमिनी १.५ प्रो (०८०१) वस्तुतः नूतनं मॉडलं नास्ति ।

स्यात्‌प्रयोगात्मकं संस्करणम्फरवरीमासे गूगलेन विमोचितस्य जेमिनी १.५ प्रो इत्यस्य आधारेण १.५ श्रृङ्खला पश्चात् सन्दर्भविण्डो २० लक्षं यावत् विस्तारितवती ।

यथा यथा मॉडल् अपडेट् भवति तथा तथा नाम दीर्घतरं दीर्घतरं भवति, येन जनाः अपि शिकायतुं प्रवृत्ताः भवन्ति ।

न, एकः OpenAI कर्मचारी विचित्रं न विस्मरन् तस्मै अभिनन्दितवान्:

अवश्यं यद्यपि नाम स्मर्तुं कठिनं तथापि अस्मिन् समये आधिकारिकक्षेत्रमूल्याङ्कने जेमिनी १.५ प्रो (०८०१) उत्तमं प्रदर्शनं कृतवान् ।

समग्रविजयदरस्य तापनक्शे दर्शयति यत् एतत् GPT-4o इत्यस्मात् ५४% श्रेष्ठम् अस्ति तथा च Claude 3.5 Sonnet इत्यस्मात् ५९% उत्तमम् अस्ति ।

अस्तिबहुभाषिकक्षमताबेन्चमार्कपरीक्षासु चीनीयभाषायां, जापानीभाषायां, जर्मनभाषायां, रूसीभाषायां च प्रथमस्थानं प्राप्नोति ।

परन्तु कोडिंग् तथा हार्ड प्रॉम्प्ट् एरिना इत्यत्र अद्यापि क्लाउड् ३.५ सोनेट्, जीपीटी-४ओ, लामा ४०५बी इत्यादीनां प्रतिद्वन्द्वीनां पराजयं कर्तुं न शक्नोति ।

एतस्य आलोचना अपि नेटिजनैः कृता अस्ति, यस्य अनुवादः अभवत् यत् -

एन्कोडिंग् एव महत्त्वपूर्णं, परन्तु तत्र उत्तमं प्रदर्शनं न करोति ।

परन्तु केचन जनाः Amway Gemini 1.5 Pro (0801) इत्यनेन सह बहिः आगताः सन्ति ।चित्रं तथा PDF निष्कर्षणक्षमता。

DAIR.AI इत्यस्य सहसंस्थापकः एल्विस् इत्यनेन व्यक्तिगतरूपेण तेलपाइपलाइनस्य परीक्षणस्य पूर्णसमूहः कृतः, निष्कर्षः च अभवत् यत् -

दृश्यक्षमता GPT-4o इत्यस्य अतीव समीपे अस्ति。

अपि च, कश्चन Gemini 1.5 Pro (0801) इत्यस्य उपयोगेन तस्य समस्यायाः समाधानं कृतवान् यस्याः उत्तरं Claude 3.5 Sonet इत्यनेन पूर्वं सम्यक् न दत्तम् ।

परिणामेषु ज्ञातं यत् एतत् न केवलं उत्तमं प्रदर्शनं कृतवान्, अपितु स्वस्य लघुमित्रं Gemini 1.5 Flash इत्येतत् अपि पराजितवान् ।

किन्तु, केचनक्लासिक सामान्य ज्ञान परीक्षाअद्यापि तत् चिन्तयितुं न शक्नोति, यथा "सेबैः समाप्ताः दश वाक्यानि लिखत" इति ।

एकं अधिकं वस्तु

इदानीं गूगलस्य Gemma 2 इति श्रृङ्खला नूतनस्य स्वागतं करोति२ अरब पैरामीटर मॉडल。

गेम्मा २ (२ख) २.पेटीतः बहिः सज्जः, Google Colab इत्यस्य निःशुल्क T4 GPU इत्यत्र चालयितुं शक्नोति ।

अखाडायाः लीडरबोर्डे, तत्...सर्वान् GPT-3.5 मॉडल् अतिक्रमति, Mixtral-8x7b अतिक्रम्य अपि।

गूगलस्य नवीनतमस्य नूतनक्रमाङ्कनस्य समुच्चयस्य सम्मुखे एरिना इतिसूचीयाः प्रामाणिकतापुनः सर्वैः पृष्टः।

Nous Research इत्यस्य सहसंस्थापकः Teknium (सूक्ष्म-परिष्कृत-उत्तर-प्रशिक्षणस्य क्षेत्रे प्रसिद्धः खिलाडी) एकं स्मरणं जारीकृतवान् यत् -

यद्यपि एरिना इत्यत्र जेम्मा २ (२बी) इत्यस्य स्कोरः जीपीटी-३.५ टर्बो इत्यस्मात् अधिकं भवति तथापि एमएमएलयू इत्यत्र उत्तरस्य अपेक्षया बहु न्यूनम् अस्ति ।
यदि कश्चन आदर्शप्रदर्शनस्य एकमात्रसूचकरूपेण अखाड़ाक्रमाङ्कनस्य उपयोगं करोति तर्हि एषः विसंगतिः चिन्ताजनकः भविष्यति ।

Abacus.AI इत्यस्य मुख्यकार्यकारी बिन्दु रेड्डी इत्यनेन प्रत्यक्षतया अपि अपीलं कृतम् यत् -

कृपया अस्य मानव-रेटेड् लीडरबोर्डस्य उपयोगं तत्क्षणमेव त्यजन्तु!
क्लाउड् ३.५ सॉनेट् GPT-4o-mini इत्यस्मात् बहु उत्तमम् अस्ति ।
अस्मिन् क्रमाङ्कनसूचौ समानानि मिथुन/मिथुन-अङ्काः एतावत् उच्चाः न भवेयुः ।

अतः, किं भवन्तः मन्यन्ते यत् मनुष्यैः अनामिकमतदानस्य एषा पद्धतिः अद्यापि विश्वसनीयः अस्ति?

समाचारं

इदं भयंकरं, GPT-4o गूगलस्य नूतनेन मॉडलेन, ChatGPT आधिकारिकखातेन पराजितः अभवत्: सर्वे गभीरं निःश्वासं गृह्णन्ति

आमुख

मम सम्पर्कसूचना