2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Zhidongxi News on August 14th, अद्य अपराह्णे बीजिंगसमये, मस्कस्य बृहत्-परिमाणस्य मॉडल् स्टार्टअपxAIद्वितीयपीढीयाः प्रतिरूपस्य प्रारम्भःग्रोक-२ बीटा, ग्रोक्-२ तथा ग्रोक्-२ लघुसंस्करणं सहितम् ।
कस्तूरीस्वस्य सामाजिकमञ्चे भावुकतापूर्वकं पोस्ट् कृतवान्सुस-स्तम्भ-र。
सः Lmsys इत्यस्य ट्वीट् पुनः ट्वीट् कृतवान् यत् "Grok is rocket speed" इति । sus-column-r इत्यनेन क्रमाङ्कनसूचौ १२,००० तः अधिकं मतं प्राप्तम्, तस्य प्रदर्शनं चक्लाउड् ३.५ सॉनेट् तथा जीपीटी-४-टर्बो इत्यस्मात् उत्तमम्, सहGPT-4oतृतीयस्थानस्य कृते बद्धः。
GPQA, MMLU, MMLU-Pro, MATH, MathVista इत्यादिषु अनेकेषु मूल्याङ्कनेषुग्रोक-२स्कोरः GPT-4 Turbo, Claude 3 Opus, Gemini Pro 1.5 इत्यादीनां मुख्यधारा-माडलानाम् अपेक्षया अधिकाः सन्ति, परन्तु अद्यापि GPT-4o इत्यस्मात् न्यूनाः सन्ति ।
सम्प्रति X Premium तथा Premium+ उपयोक्तारः अधुना Grok-2 तथा Grok-2 mini इत्यस्य अनुभवं कर्तुं शक्नुवन्ति, तथा च Zhixixi इत्यनेन प्रथमः वास्तविकपरीक्षणं अनुभवं च कृतवान् ।
किञ्चित् अनुभवानन्तरं ग्रोक्-२ इत्यनेन मम कृते दत्तः स्पष्टतमः भावः अस्ति यत् तस्य तर्कः अतीव स्पष्टः अस्ति । यथा, निम्नलिखित उदाहरणे यद्यपि Grok-2 तथा GPT-4o इत्येतयोः द्वयोः अपि सम्यक् उत्तराणि दत्तानि तथापि पूर्वस्य प्रत्येकस्य सोपानस्य सोपानानि गणनाश्च अतीव स्पष्टाः सुलभाः च सन्ति तदतिरिक्तं, Grok-2 इत्यस्य विन्सेन्टियन-ग्राफिक्स्-क्षमता FLUX.1 इत्यस्य समर्थनेन आकाशगतिम् अवाप्तवती, तथा च, तया स्वस्य सुसंगतं "बोल्ड" शैली अपि स्थापिता अस्ति ।
xAI इत्यस्य योजना अस्ति यत् अस्मिन् मासे अन्ते Grok-2 enterprise API इत्यस्य द्वौ संस्करणौ प्रारम्भं कर्तुं शक्नोति।
अनुभवस्य सम्बोधनम् : १.https://lmarena.ai/?model=सुस-स्तम्भ-र
LMSYS Chatbot Arena इत्यस्मिन् Grok-2 इत्यस्य प्रारम्भिकं संस्करणं sus-column-r इति मूल्याङ्कने भागं गृहीतवान् ।समग्रतया एलो स्कोर प्रदर्शनं क्लाउड् तथा बहु GPT-4 संस्करणं अतिक्रमति。
यथा अधोलिखिते चित्रे दर्शितं, Grok-2 इत्यस्य स्कोरः GPT-4o-mini इत्यस्य जुलै-मासस्य 18-दिनाङ्कस्य संस्करणं GPT-4-Turbo इत्यस्य 9 एप्रिल-दिनाङ्कस्य संस्करणं च अतिक्रान्तवान्, परन्तु स्कोरः अद्यापि 8 अगस्त-दिनाङ्कस्य संस्करणात् न्यूनः आसीत् ChatGPT-4o -GPT-4o इत्यस्य नवीनतमं, मे १५ संस्करणम्।
आन्तरिकरूपेण, xAI-दलः आदर्शानां मूल्याङ्कनार्थं समानप्रक्रियाम् अनुसरति, यत्र मूल्याङ्कनं प्रतिरूपस्य मूलक्षमताद्वये केन्द्रितम् अस्ति: प्रथमं,निर्देशान् सटीकतया अनुसरणं कुर्वन्तु, द्वितीयं सूचनाप्रदानम्सटीकता प्रामाणिकता च。
उल्लेखनीयं यत् ग्रोक्-२ इतिअनुमान विश्लेषण अन्वेषण सामग्रीतथासाधनानां उपयोगं कुर्वन्तुअस्य महती प्रगतिः अभवत्, यथा गम्यमानसूचनाः समीचीनतया चिन्तयितुं, घटनाक्रमद्वारा तार्किकतर्कं कर्तुं, अप्रासंगिकपदानां प्रभावीरूपेण निराकरणस्य क्षमता च
बेन्चमार्कपरीक्षणार्थं दलेन आच्छादनस्य परीक्षणस्य श्रृङ्खलायाः उपयोगः कृतःतर्कः, पठनबोधः, गणितं, विज्ञानं, कोडिंग् चअन्येषु क्षेत्रेषु शैक्षणिकमापदण्डेषु ग्रोक्-२ प्रतिरूपस्य व्यापकं मूल्याङ्कनं कृतम् ।
परिणामानि दर्शयन्ति यत् पूर्वपीढीयाः Grok-1.5 मॉडलस्य तुलने Grok-2 तथा तस्य सरलीकृतसंस्करण Grok-2 mini इत्यस्य महत्त्वपूर्णं सुधारः अस्ति ।
स्नातकस्तरस्यवैज्ञानिकज्ञानम् (यथा जीपीक्यूए), सामान्यज्ञानस्य प्रश्नोत्तरम् (यथा एमएमएलयू, एमएमएलयू-प्रो)अपि चगणितप्रतियोगितायाः प्रश्नाः (यथा MATH) २.अन्येषु क्षेत्रेषु तेषां प्रदर्शनं अन्यैः शीर्षमाडलैः सह स्पर्धां कर्तुं शक्नोति ।
यथा अधोलिखिते चित्रे दर्शितं, एतेषु सर्वेषु परीक्षासु ग्रोक्-२ उत्तमं अंकं प्राप्तवान् ।GPT-4 Turbo, Claude 3 Opus, Gemini Pro 1.5 च अतिक्रान्तवान्, परन्तु तदपि GPT-4o इत्येतत् पराजयितुं न शक्तवान्。
उल्लेखनीयं यत् ग्रोक्-२ इतिदृश्यकार्यम्उत्तमं प्रदर्शनं विशेषतः उपरिदृश्य गणितीय तर्क (MathVista)तथादस्तावेजाधारितप्रश्नोत्तर (DocVQA) 1.1.विशेषतया प्रदर्शनं उत्कृष्टम् अस्ति।
Grok-2 तथा Grok-2 mini इदानीं X ग्राहकानाम् कृते उपलभ्यते, गैर-ग्राहकाः अपि Grok-2 model sus-column-r इत्यस्य प्रारम्भिकसंस्करणस्य अनुभवं Large Model Arena इत्यत्र निःशुल्कं कर्तुं शक्नुवन्ति
बृहत् मॉडलक्षेत्रे कुलम् ६२ मॉडल् उपलभ्यन्ते, यत्र GPT-4o अपि अस्ति तुलनायाः सुविधायै प्रथमं एतस्य प्रारम्भिकस्य मॉडलस्य परीक्षणं कुर्मः ।
प्रथमं आकारानुपातस्य विषयः अस्ति यः किञ्चित्कालपूर्वं बहवः मॉडल्-उपरि पलटितवान्: कः बृहत्तरः, १३.११ वा १३.८ वा । ग्रोक्-२ तथा जीपीटी-४ओ इत्येतयोः द्वयोः अपि समीचीनतया उत्तरं दत्तम्, परन्तु ग्रोक्-२ इत्यस्य चिन्तनप्रक्रिया अधिका स्पष्टा आसीत्, विस्तृतचिन्तनपदार्थाः च सूचीबद्धाः आसन् ।
अन्यस्मिन् क्लासिकप्रश्ने "स्ट्रॉबेरी-मध्ये कति r's सन्ति?", Grok-2 इत्यनेन प्रथमं गलत् उत्तरं दत्तम्, परन्तु ततः GPT-4o इत्यनेन चीनीयभाषायां आङ्ग्लभाषायां च सम्यक् उत्तरं दत्तम् । बृहत् आदर्शेषु अद्यापि भाग्यस्य तत्त्वं भविष्यति इति भाति।
बृहत् मॉडलक्षेत्रे मॉडल् वास्तविकसमये अन्तर्जालसङ्गणकेन सह न सम्बद्धाः यदा अहं पृष्टवान् "अधुना एव गूगलेन विमोचितस्य Pixel 9 इत्यस्य मुख्यविषयाणि कानि सन्ति?", तदा द्वयोः मॉडलयोः उक्तं यत् तेषां समीपे एषा सूचना अद्यापि नास्ति। ततः ग्रोक्-२ इत्यनेन प्रौद्योगिकीविकासप्रवृत्तीनां आधारेण भविष्यवाणीः कृताः तथा च एकः अनुमानः अत्यन्तं विश्वसनीयः आसीत् कैमरा, प्रोसेसर, एआइ इत्यादयः सर्वे गूगलस्य अपडेट् इत्यस्य केन्द्रबिन्दुः अस्ति ।
GPT-4o इत्यनेन पूर्वानुमानं न दत्तम्, परन्तु Pixel-फोनानां पूर्वविषयाणां सारांशः दत्तः ।
कोडिंग् क्षमतायाः दृष्ट्या द्वयोः मॉडलयोः कार्यक्षमता तुलनीयं भवति, आवश्यकतानां कृते विस्तृतसमाधानपदार्थाः पूर्णसङ्केताः च दत्ताः सन्ति
तार्किकतर्कस्य दृष्ट्या ग्रोक्-२ पुनः तर्कस्य स्पष्टतां दर्शयति, तर्कस्य प्रत्येकं सोपानं उपशीर्षकेषु विभक्तम् अस्ति । यद्यपि GPT-4o इत्यनेन अपि सम्यक् उत्तरं दत्तम् तथापि चिन्तनपदार्थाः पर्याप्तं स्पष्टाः न आसन् ।
विन्सेन्ट् ग्राफक्षमता Grok-2 इत्यस्य अस्य अद्यतनस्य प्रमुखं केन्द्रबिन्दुः अस्ति यस्य सह एतत् सम्बद्धं FLUX.1 मॉडल् अद्यतने सशक्तप्रदर्शनस्य कारणेन मुक्तस्रोतसमुदाये अतीव लोकप्रियं जातम् परन्तु बृहत् आदर्शक्षेत्रे चित्रजननक्षमता अनुभवितुं न शक्यते, केवलं X सदस्यतायाः माध्यमेन एव प्राप्तुं शक्यते ।
नेटिजनाः पूर्वमेव Grok-2 Wenshengtu इत्यनेन सह मज्जितवन्तः, यथा Grok-2 इत्यस्य पाठजननक्षमतायाः उपयोगेन Grok-2 इत्यस्य अफलाइन-पत्रकारसम्मेलनस्य आयोजने सहायतां कुर्वन्ति ।
अथवा स्वकल्पनायाः उपयोगं कृत्वा मस्कं मंगलग्रहे कारं चालयितुं ददातु।
ग्रोक् इत्यस्य प्रायः शून्यस्य सेंसरशिप-व्यवस्थायाः आधारेण बहवः नेटिजनाः मजाकं कृतवन्तः, यथा ट्रम्पं गोलीं मारयितुं, जार्ज डब्ल्यू बुशं कोकेन्-इत्यस्य श्वासं ग्रहीतुं च आह...
अथवा ट्रम्पः स्पेसएक्स् रॉकेट् इत्यनेन आकाशं प्रति गच्छतु। तस्यैव अनुरोधस्य सम्मुखे GPT-4o अतीव निर्णायकरूपेण अङ्गीकृतवान् ।
ग्रोक् इत्यस्य सेंसरशिप-व्यवस्था कियत् निर्लज्जा अस्ति?ChatGPT, क्लाउड् प्रत्यक्षतया अङ्गीकृतवान्, मिथुनः च कष्टपूर्णं शिक्षां प्रारब्धवान् ।
समग्रतया, Grok-2 अद्यापि स्वस्य बोल्डशैलीं कार्यान्वितं करोति तस्मिन् एव काले, तस्य मॉडल् प्रदर्शनं GPT-4o इत्यादिभिः हेड मॉडल् इत्यनेन सह तुलनीयम् अस्ति, तस्य तर्कः स्पष्टतरः अस्ति, तस्य बहु-मोडल-क्षमता च FLUX.1 इत्यस्य अपेक्षया अपि उत्तमाः सन्ति .आशीर्वादेन सह ऋजुतया उड्डीयत।
अस्य मासस्य अन्ते xAI नूतनं पारयिष्यतिउद्यम एपिआइ मञ्च, आधिकारिकतया विकासकानां कृते Grok-2 तथा Grok-2 mini इति प्रारब्धवान् ।
एतत् एपिआइ समर्थनार्थं नूतनं अनुकूलितं तकनीकीवास्तुकला स्वीकुर्यात्बहुक्षेत्र अनुमान परिनियोजन,कृतेवैश्विकप्रयोक्तारःन्यूनविलम्बेन सह सुचारुम् अनुभवं प्रदातव्यम्।
तस्मिन् एव काले xAI इत्यनेन सुरक्षाविशेषताः वर्धिताः, यत्र अनिवार्यबहुकारकप्रमाणीकरणं (यथा Yubikey, Apple TouchID अथवा TOTP) सहितं विस्तृतं च प्रदातियातायातस्य आँकडानि तथा उन्नतबिलिंगविश्लेषणसेवाः, दत्तांशनिर्यातस्य समर्थनं करोति ।
तदतिरिक्तं, xAI इत्यनेन विद्यमानानाम् आन्तरिकसाधनानाम् सेवानां च मध्ये दलस्य, उपयोक्तुः, बिलिंग् प्रबन्धनकार्यस्य च निर्बाधसमायोजनस्य समर्थनार्थं प्रबन्धन एपिआइ अपि प्रारब्धम् अस्ति
Grok-2 तथा Grok-2 mini इदानीं X मञ्चे ऑनलाइन सन्ति उदाहरणार्थं, X पोस्ट् इत्यस्य गहनविश्लेषणं, अनुकूलितं उत्तरकार्यं च अत्यन्तं रोमाञ्चकारी अस्ति । शीघ्रमेव xAI स्वस्य बहुविध-अवगमन-क्षमतायाः पूर्वावलोकन-संस्करणमपि प्रकाशयिष्यति ।
नवम्बर २०२३ तमे वर्षे Grok-1 इत्यस्य प्रक्षेपणात् आरभ्य xAI प्रौद्योगिक्यां, उत्पादानाम्, वित्तपोषणस्य च विषये तीव्रगत्या प्रगतिम् अकरोत्, Grok-2 इत्यस्य प्रक्षेपणं च तस्य नूतनं माइलस्टोन् अस्ति एकदा मस्कः ग्रोकस्य बृहत् मॉडलक्षमतां X मञ्चस्य शक्तिशालिनः सामग्री उपयोक्तृपारिस्थितिकीशास्त्रेण सह संयोजयति तदा एकः बन्दः पाशः निर्मितः भविष्यति, यत्र...OpenAIअलीबाबा क्लाउड् सहितं बृहत् मॉडल् स्टार्टअप्स इत्यस्य उपरि दबावः अतः अपि अधिकः अस्ति ।
लेखक |.ली शुइकिंग वेनिला
सम्पादक |