2024-08-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
आवाम्, GPT-4o गूगलस्य नूतनेन मॉडलेन अतिक्रान्तम् अस्ति!
सप्ताहे १२,००० तः अधिकाः जनाः अनामरूपेण मतदानं कृतवन्तः ।मिथुन १.५ प्रो (०८०१) २. गूगलस्य प्रतिनिधित्वेन प्रथमवारं lmsys-क्षेत्रे प्रथमस्थानं प्राप्तम् । (चीनीकार्यम् अपि प्रथमस्थानं प्राप्नोति)
तथा च अस्मिन् समये इदं द्विगुणं मुकुटम् अस्ति समग्रक्रमाङ्कनस्य अतिरिक्तं (एकमात्रः स्कोरः १३०० अस्ति), इदृश्य लीडरबोर्डप्रथमाङ्कः अपि अस्ति।
मिथुनपक्षस्य दलस्य प्रमुखः व्यक्तिः सिमोन टोकुमिने इत्यनेन उत्सवस्य कृते सन्देशः स्थापितः यत् -
(इदं नूतनं मॉडलं) अस्माभिः निर्मितं सर्वाधिकं शक्तिशाली चतुरतमः च मिथुनराशिः अस्ति।
एकः Reddit उपयोक्ता अपि अस्य मॉडलस्य "अति उत्तमम्" इति उक्तवान्, तस्य कार्यक्षमतायाः न्यूनीकरणं न भविष्यति इति आशां च प्रकटितवान् ।
अधिकाः नेटिजनाः उत्साहं प्रकटितवन्तः यत् OpenAI इत्यस्मै अन्ततः चुनौतीं प्राप्तम् अस्ति तथा च प्रतियुद्धार्थं नूतनं संस्करणं विमोचयिष्यति!
आधिकारिकं ChatGPT खातं अपि किमपि सूचयितुं बहिः आगतं।
उत्साहस्य मध्ये गूगल एआइ स्टूडियो इत्यस्य उत्पादस्य प्रमुखः घोषितवान् यत् मॉडल्...निःशुल्क परीक्षण चरण:
एआइ स्टूडियो इत्यत्र निःशुल्कं उपलब्धम्
नेटिजनः - गूगलः अन्ततः अत्र अस्ति!
कठोरतापूर्वकं वक्तुं शक्यते यत् जेमिनी १.५ प्रो (०८०१) वस्तुतः नूतनं मॉडलं नास्ति ।
स्यात्प्रयोगात्मकं संस्करणम्फरवरीमासे गूगलेन विमोचितस्य जेमिनी १.५ प्रो इत्यस्य आधारेण १.५ श्रृङ्खला पश्चात् सन्दर्भविण्डो २० लक्षं यावत् विस्तारितवती ।
यथा यथा मॉडल् अपडेट् भवति तथा तथा नाम दीर्घतरं दीर्घतरं भवति, येन जनाः अपि शिकायतुं प्रवृत्ताः भवन्ति ।
न, एकः OpenAI कर्मचारी विचित्रं न विस्मरन् तस्मै अभिनन्दितवान्:
अवश्यं यद्यपि नाम स्मर्तुं कठिनं तथापि अस्मिन् समये आधिकारिकक्षेत्रमूल्याङ्कने जेमिनी १.५ प्रो (०८०१) उत्तमं प्रदर्शनं कृतवान् ।
समग्रविजयदरस्य तापनक्शे दर्शयति यत् एतत् GPT-4o इत्यस्मात् ५४% श्रेष्ठम् अस्ति तथा च Claude 3.5 Sonnet इत्यस्मात् ५९% उत्तमम् अस्ति ।
अस्तिबहुभाषिकक्षमताबेन्चमार्कपरीक्षासु चीनीयभाषायां, जापानीभाषायां, जर्मनभाषायां, रूसीभाषायां च प्रथमस्थानं प्राप्नोति ।
परन्तु कोडिंग् तथा हार्ड प्रॉम्प्ट् एरिना इत्यत्र अद्यापि क्लाउड् ३.५ सोनेट्, जीपीटी-४ओ, लामा ४०५बी इत्यादीनां प्रतिद्वन्द्वीनां पराजयं कर्तुं न शक्नोति ।
एतस्य आलोचना अपि नेटिजनैः कृता अस्ति, यस्य अनुवादः अभवत् यत् -
एन्कोडिंग् एव महत्त्वपूर्णं, परन्तु तत्र उत्तमं प्रदर्शनं न करोति ।
परन्तु केचन जनाः Amway Gemini 1.5 Pro (0801) इत्यनेन सह बहिः आगताः सन्ति ।चित्रं तथा PDF निष्कर्षणक्षमता。
DAIR.AI इत्यस्य सहसंस्थापकः एल्विस् इत्यनेन व्यक्तिगतरूपेण तेलपाइपलाइनस्य परीक्षणस्य पूर्णसमूहः कृतः, निष्कर्षः च अभवत् यत् -
दृश्यक्षमता GPT-4o इत्यस्य अतीव समीपे अस्ति。
अपि च, कश्चन Gemini 1.5 Pro (0801) इत्यस्य उपयोगेन तस्य समस्यायाः समाधानं कृतवान् यस्याः उत्तरं Claude 3.5 Sonet इत्यनेन पूर्वं सम्यक् न दत्तम् ।
परिणामेषु ज्ञातं यत् एतत् न केवलं उत्तमं प्रदर्शनं कृतवान्, अपितु स्वस्य लघुमित्रं Gemini 1.5 Flash इत्येतत् अपि पराजितवान् ।
किन्तु, केचनक्लासिक सामान्य ज्ञान परीक्षाअद्यापि तत् चिन्तयितुं न शक्नोति, यथा "सेबैः समाप्ताः दश वाक्यानि लिखत" इति ।
एकं अधिकं वस्तु
इदानीं गूगलस्य Gemma 2 इति श्रृङ्खला नूतनस्य स्वागतं करोति२ अरब पैरामीटर मॉडल。
गेम्मा २ (२ख) २.पेटीतः बहिः सज्जः, Google Colab इत्यस्य निःशुल्क T4 GPU इत्यत्र चालयितुं शक्नोति ।
अखाडायाः लीडरबोर्डे, तत्...सर्वान् GPT-3.5 मॉडल् अतिक्रमति, Mixtral-8x7b अतिक्रम्य अपि।
गूगलस्य नवीनतमस्य नूतनक्रमाङ्कनस्य समुच्चयस्य सम्मुखे एरिना इतिसूचीयाः प्रामाणिकतापुनः सर्वैः पृष्टः।
Nous Research इत्यस्य सहसंस्थापकः Teknium (सूक्ष्म-परिष्कृत-उत्तर-प्रशिक्षणस्य क्षेत्रे प्रसिद्धः खिलाडी) एकं स्मरणं जारीकृतवान् यत् -
यद्यपि एरिना इत्यत्र जेम्मा २ (२बी) इत्यस्य स्कोरः जीपीटी-३.५ टर्बो इत्यस्मात् अधिकं भवति तथापि एमएमएलयू इत्यत्र उत्तरस्य अपेक्षया बहु न्यूनम् अस्ति ।
यदि कश्चन आदर्शप्रदर्शनस्य एकमात्रसूचकरूपेण अखाड़ाक्रमाङ्कनस्य उपयोगं करोति तर्हि एषः विसंगतिः चिन्ताजनकः भविष्यति ।
Abacus.AI इत्यस्य मुख्यकार्यकारी बिन्दु रेड्डी इत्यनेन प्रत्यक्षतया अपि अपीलं कृतम् यत् -
कृपया अस्य मानव-रेटेड् लीडरबोर्डस्य उपयोगं तत्क्षणमेव त्यजन्तु!
क्लाउड् ३.५ सॉनेट् GPT-4o-mini इत्यस्मात् बहु उत्तमम् अस्ति ।
अस्मिन् क्रमाङ्कनसूचौ समानानि मिथुन/मिथुन-अङ्काः एतावत् उच्चाः न भवेयुः ।
अतः, किं भवन्तः मन्यन्ते यत् मनुष्यैः अनामिकमतदानस्य एषा पद्धतिः अद्यापि विश्वसनीयः अस्ति?