Grok-2 अत्र अस्ति, इदं चित्राणि जनयितुं चित्राणि च ज्ञातुं शक्नोति, तस्य कार्यक्षमता च GPT-4o इत्यनेन सह तुलनीयम् अस्ति: इदं rocket

Grok-2 अत्र अस्ति, इदं चित्राणि जनयितुं चित्राणि च ज्ञातुं शक्नोति, तस्य कार्यक्षमता च GPT-4o इत्यनेन सह तुलनीयम् अस्ति: इदं रॉकेट इव विकसितं भवति

2024-08-14

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

जीपीटी-५ अद्यापि न बहिः अस्ति, ग्रोक् पूर्वमेव गृहीतवान् अस्ति।

यस्मिन् दिने गूगलः ओपनएइ च वार्तानां कृते स्पर्धां कुर्वन्तौ आस्ताम् तस्मिन् दिने मस्कस्य xAI अपि निष्क्रियः नासीत् ।

बुधवासरे अपराह्णे, बीजिंगसमये, xAI आधिकारिकतया नूतनपीढीयाः Grok 2 बृहत् मॉडलं विमोचितवान्।

तृतीयपक्षस्य बृहत् मॉडल् बेन्चमार्क संस्था Chatbot Arena इत्यनेन अपि तत्क्षणमेव LMSYS सूचीयाः स्कोरसूचीं अद्यतनं कृतम् । Grok 2 (sus-column-r) इत्यस्य प्रारम्भिकं मॉडलं GPT-4o (संस्करणं 0513) इत्यस्य पश्चात् चतुर्थस्थानं प्राप्तुं शक्यते, यत् Claude 3.5 Sonnet तथा GPT-4-Turbo इत्येतयोः अपेक्षया अधिकं प्रदर्शनं करोति ।

कोडिंग्, जटिलसमस्या, गणितं च इत्यत्र उत्कृष्टं भवति ।

मस्कः "ग्रोकस्य प्रणोदनवेगः रॉकेट इव अस्ति" इति डींगं मारयितुं न शक्तवान् ।

ध्यानं कुर्वन्तु यत् एतत् केवलं प्रारम्भिकसंस्करणस्य स्कोरः एव अस्ति यत् भविष्ये आधिकारिकसंस्करणस्य परीक्षणं करिष्यति।

मस्कः अवदत् यत् ग्रोक्-२ अत्याधुनिकतर्कक्षमतायुक्तं उन्नतभाषाप्रतिरूपम् अस्ति। नवीनपीढीयां द्वौ संस्करणौ समाविष्टौ स्तः : Grok-2 तथा Grok-2 mini इति । अधुना X मञ्चे Grok उपयोक्तृभ्यः उभयम् अपि मॉडल् विमोचितम् अस्ति । सम्प्रति X Premium तथा Premium+ उपयोक्तारः Grok-2 तथा Grok-2 mini मॉडल् इत्येतयोः पूर्वमेव अनुभवं कर्तुं शक्नुवन्ति ।

पूर्ववर्ती Grok-1.5 इत्यस्य तुलने Grok-2 इत्यस्य प्रारम्भिकपूर्वावलोकनसंस्करणेन महती प्रगतिः प्राप्ता, यत्र गपशप, तर्कः, कोडिंग् इत्यादिषु अग्रणीक्षमताः प्रदर्शिताः xAI इत्यस्य कथनमस्ति यत् Grok-2 तथा Grok-2 mini इत्येतत् सम्प्रति X इत्यत्र बीटा-रूपेण अस्ति तथा च अस्मिन् मासे अन्ते उद्यम-एपिआइ-माध्यमेन उपलभ्यते ।

नूतनस्य मॉडलस्य प्रकाशनस्य अर्धघण्टायाः अपि न्यूनकालानन्तरं एकः नेटिजनः पूर्वमेव परिणामान् दर्शयति स्म सः "अहं मस्कः च हॉट् डॉग्स् खादन्तः" इति चित्रं जनयितुं Grok 2 mini इत्यस्य उपयोगं कृतवान् ।

वाशिङ्गटनस्य चित्रं जनयितुं अन्यं प्रयतस्व।

केचन जनाः उड्डयनबिडालं जनयितुं Grok 2 mini इति अपि प्रयतन्ते स्म ।

अन्यः कश्चन Tesla Model Y इति वाहनं निर्मितवान्, किं तत् समानं दृश्यते?

ग्रोक-२ प्रदर्शन पी.के

यथा xAI इत्यनेन Grok-2 इत्यस्य प्रारम्भिकं संस्करणं "sus-column-r" इति Chatbot Arena इत्यत्र स्थापितं तथा वयं दृष्टवन्तः यत् अन्येभ्यः लोकप्रियेभ्यः मुक्त-बन्द-स्रोत-माडलयोः तुलने तस्य प्रदर्शनं कथं भवति

समग्ररूपेण एलो-स्कोरस्य दृष्ट्या ग्रोक्-२ क्लाउड्-श्रृङ्खलायाः मॉडल्-इत्यस्मात् GPT-4-इत्यस्य अधिकांशसंस्करणात् च उत्तमं प्रदर्शनं करोति । अवश्यं, सूचीयां प्रथमः GPT-4o (संस्करणः अगस्त ८) अस्ति, यत् OpenAI इत्यनेन अद्यैव प्रकाशितम् ।

अधोलिखिते चित्रे Grok-2 इत्यस्य अन्येषां लोकप्रियानाम् मॉडल्-मध्ये Win Rate-तुलना दृश्यते ।

अधोलिखितं चित्रं Grok 1.5 तथा Grok 2 इत्येतयोः संस्करणयोः मध्ये तथ्याधारितं विजयदरस्य तुलनां दर्शयति ।

xAI Grok 2 मॉडलस्य मूल्याङ्कनार्थं एतां प्रक्रियां स्वीकुर्वति, AI Tutors इत्यस्य उपयोगेन विभिन्नकार्येषु मॉडलेन सह यथार्थतया अन्तरक्रियां कर्तुं शक्नोति । प्रत्येकं अन्तरक्रियायाः समये Grok 2 AI Tutors इत्यस्मै प्रतिक्रियाद्वयं प्रदाति, यत् ततः मार्गदर्शिकायां सूचीकृतविशिष्टमापदण्डानाम् आधारेण सर्वोत्तमप्रतिक्रियायाः चयनं करोति ।

xAI द्वयोः प्रमुखक्षेत्रयोः आदर्शप्रदर्शनस्य मूल्याङ्कनं प्रति केन्द्रितः अस्ति: निर्देशस्य अनुसरणं तथा च सटीकं, सत्यं सूचनां प्रदातुं च। परिणामाः पुनः प्राप्तसामग्रीतः तर्कं कर्तुं Grok 2 इत्यस्य क्षमतायां महत्त्वपूर्णं सुधारं दर्शयन्ति तथा च गम्यमानसूचनाः सम्यक् पहिचानं, घटनाक्रमेण तर्कः, अप्रासंगिकपदानां परित्यागः इत्यादीनि साधनानि उपयुज्यन्ते।

बेन्चमार्क स्कोर

xAI इत्यनेन Grok-2 मॉडलस्य मूल्याङ्कनं शैक्षणिकमापदण्डानां श्रेण्यां कृतम्, यत्र तर्कः, पठनबोधः, गणितः, विज्ञानः, कोडिंग् च सन्ति ।

ग्रोक्-२ तथा ग्रोक्-२ मिनी इत्येतयोः द्वयोः अपि पूर्वस्य ग्रोक्-१.५ मॉडलस्य अपेक्षया महत्त्वपूर्णः सुधारः अस्ति । स्नातकस्तरीयवैज्ञानिकज्ञानं (GPQA), सामान्यज्ञानं (MMLU, MMLU-Pro), गणितप्रतियोगितासमस्याः (MATH) इत्यादिषु क्षेत्रेषु अन्यैः अत्याधुनिकप्रतिमानैः सह प्रदर्शनं तुलनीयम् अस्ति

तदतिरिक्तं, Grok-2 दृष्टि-आधारित-कार्ययोः अपि उत्तमं प्रदर्शनं करोति, यत्र दृश्य-गणितीय-तर्कस्य (MathVista) तथा दस्तावेज-आधारित-प्रश्न-उत्तर-प्रदानस्य (DocVQA) च उल्लेखनीयं प्रदर्शनं भवति

Grok 2 अन्तरफलकं कार्याणि च "बृहत् परिवर्तनम्"।

विगतमासेषु xAI x मञ्चे Grok अनुभवं निरन्तरं सुधारयति स्म । अधुना अग्रिमपीढीयाः Grok 2 इत्यस्य प्रक्षेपणेन xAI इत्यनेन अन्तरफलकस्य पुनः परिकल्पना कृता, यथा अधः दर्शितम् अस्ति ।

अवश्यं, xAI इत्यनेन केचन नूतनाः विशेषताः प्रदाति, यथा Conway इत्यस्य "Game of Life" इत्यस्य सरलं कार्यान्वयनम् ।

अन्यत् उदाहरणं बहुविधा अवगमनक्षमता (चित्रं दृष्ट्वा वार्तालापः) अस्ति ।

तेषु Grok-2 xAI इत्यस्य सर्वाधिक उन्नतः AI सहायकः अस्ति, यत्र पाठस्य दृश्यसमझस्य च क्षमता अस्ति तथा च X मञ्चात् एकीकृतवास्तविकसमयसूचना अस्ति, या X अनुप्रयोगे Grok ट्याब् इत्यस्य माध्यमेन प्राप्तुं शक्यते

Grok-2 mini इति लघु किन्तु शक्तिशाली मॉडल् अस्ति यत् गतिः उत्तरगुणवत्तायाः च मध्ये उत्तमं संतुलनं करोति ।

Grok-2 पूर्ववर्ती अपेक्षया अधिकं सहजं, अधिकं नियन्त्रणीयं, अधिकं लचीलं च अस्ति, येन एतत् विविधकार्यस्य कृते उपयुक्तं भवति, भवेत् भवान् उत्तराणि, सहकारिलेखनं, कोडिंग् कार्याणि समाधानं वा अन्विष्यति

तदतिरिक्तं xAI स्टार्टअप Black Forest Labs इत्यनेन सह कार्यं कुर्वन् अस्ति यत् तेषां FLUX.1 मॉडल् इत्यस्य प्रयोगं कृत्वा X इत्यत्र Grok इत्यस्य क्षमतां विस्तारयति ।

अस्मिन् मासे अन्ते xAI नूतन-उद्यम-एपिआइ-मञ्चस्य माध्यमेन विकासकानां कृते Grok-2 तथा Grok-2 mini इत्येतौ अपि विमोचयिष्यति । आगामिः एपिआइ नूतन-कस्टम्-प्रौद्योगिकी-ढेरस्य उपरि निर्मितः अस्ति, यत् वैश्विक-निम्न-विलम्ब-प्रवेशाय बहु-क्षेत्र-अनुमान-नियोजनस्य अनुमतिं ददाति ।

अवश्यं, xAI अपि केचन वर्धिताः सुरक्षाविशेषताः प्रदाति, यथा अनिवार्यबहुकारकप्रमाणीकरणम् (उदा. Yubikey, Apple TouchID अथवा TOTP इत्यस्य उपयोगः) ।

द्रष्टुं शक्यते यत् २०२३ तमस्य वर्षस्य नवम्बरमासे ग्रोक्-१ इत्यस्य प्रक्षेपणात् आरभ्य xAI इत्यनेन एतस्याः मॉडल्-श्रृङ्खलायाः आतङ्कजनक-दरेन उन्नतिः कृता अस्ति । शीघ्रमेव, ते बहुविध-अवगमनेन सह पूर्वावलोकनसंस्करणं विमोचयिष्यन्ति । xAI इत्यस्य अनन्तरं केन्द्रं नूतनगणनासमूहानां माध्यमेन मॉडलस्य मूलतर्कक्षमतासु सुधारः भविष्यति ।

ब्लोग् पता: https://x.ai/blog/grok-2

समाचारं

आमुख

मम सम्पर्कसूचना