2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
मेङ्गचेन् आओफेइ मन्दिरात् आगच्छति
Qubits |.सार्वजनिक खाता QbitAI
मस्कस्य xAI विशालः मॉडलः द्वितीयपीढौ बहिः अस्ति!
ग्रोक-२बीटा संस्करणं विमोचितम् अस्ति, Xiaobei Grok-2 mini पूर्वमेव मञ्चे ऑनलाइन प्ले कर्तुं शक्यते।
मस्कः अपि तत् रहस्यं प्रकाशितवान् यत् एकमासाधिकं यावत् विशालं मॉडलवृत्तं रिडलररूपेण पीडयति यत् -
एतत् निष्पद्यते यत् Lmsys बृहत् मॉडलक्षेत्रे रहस्यमयः अनामिकः मॉडलःसुस-स्तम्भ-र, सत्यरूपं ग्रोक्-२ ।
sus-column-r इत्यनेन लीडरबोर्डे १०,००० तः अधिकानि मानवमतानि सञ्चितानि सन्ति तथा च...GPT-4o इत्यस्य एपिआइ संस्करणेन सह तृतीयस्थानार्थं बद्धः。
xAI इत्यस्य स्वस्य आन्तरिकपरीक्षणे Grok-2 इत्यनेन सामान्यज्ञान (MMLU, MMLU-Pro), गणितप्रतियोगिताप्रश्नाः (MATH), स्नातकस्तरीयवैज्ञानिकज्ञानं (GPQA) इत्यादिषु क्षेत्रेषु अन्यैः अत्याधुनिकप्रतिमानैः सह स्पर्धा कृता
तदतिरिक्तं ग्रोक्-२ दृष्टि-आधारितकार्य्येषु सर्वोत्तमः अस्ति तथा च दृश्यगणितीयतर्कस्य (MathVista) SOTA -पर्यन्तं गच्छति ।
तथापि अस्य चित्रस्य विन्यासः किञ्चित् कठिनः अस्ति : GPT-4o तथा Claude-3.5-Sonet, येषां स्कोरः सर्वाधिकः अस्ति, ते भवतः दूरं स्थापिताः सन्ति ।
केवलं स्कोरं पश्यन् अद्यापि अमूर्तम् अस्ति, प्रथमहस्तस्य वास्तविकपरीक्षायां प्रविशामः ।
ग्रोक-२ इत्यस्य प्रथमहस्तपरीक्षा
यदि भवान् /Twitter मञ्चस्य सशुल्कः उपयोक्ता अस्ति तर्हि भवान् प्रत्यक्षतया Grok चैनलं प्रविश्य तस्य प्रयोगं कर्तुं शक्नोति। यदि भवान् किमपि धनं न व्यययति तर्हि Lmsys large model arena इत्यत्र अपि गत्वा sus-column-r इति चित्वा तस्य प्रयोगं कर्तुं शक्नोति ।
तथाभुगतानं कुर्वन्तः उपयोक्तारः केवलं Xiaobei mini संस्करणं एव क्रीडितुं शक्नुवन्ति ।, मुक्तप्रयोक्तारः बृहत् कपं क्रीडितुं शक्नुवन्ति, यत् अपि अतीव उदारम् अस्ति ।。
यतः Grok-2 इत्यस्य वास्तविकसमयदत्तांशस्य अभिगमः अस्ति onभवन्तः तस्मै दिवसस्य वार्तानां सारांशं दातुं प्रत्यक्षतया वक्तुं शक्नुवन्ति, यदि भवान् मजेदारं मोडं चालू करोति तर्हि टिप्पणीं अपि दातुं शक्नोति।
सशुल्क संस्करणम् अपिनवीनतमं मुक्तस्रोतस्य AI आलेखप्रतिरूपं Flux.1 इति अभिगमनं कृतवान्, चीनीयप्रॉम्प्ट् शब्दान् अवगमनाय आङ्ग्लभाषायां अनुवादयिष्यति।
मुखपृष्ठे "Amway a Fantasy Game" इति प्रश्नोदाहरणं क्लिक् कुर्वन्तु, ततः भवान् द्रष्टुं शक्नोति यत् एतत् प्रथमं "Baldur's Gate 3" इत्यस्य अनुशंसा करोति तथा च कथानकं, चरित्रानुकूलनम्, क्रीडायान्त्रिकं, विश्वस्य आकारं, हास्यतत्त्वानि, खिलाडीसमुदायः च इत्यादीनां अनेकपक्षेषु चर्चां करोति समीक्षा भिन्नदृष्ट्या कृता अस्ति तथा च क्रीडायाः मुख्यविषयान् अतीव सम्यक् गृह्णाति।
अस्मिन् समये भवान् प्रत्यक्षतया चीनीभाषायां परिवर्त्य प्रश्नान् निरन्तरं पृच्छितुं शक्नोति ।
Grok-2 "Black Myth: Wukong" इति क्रीडायाः विषये अपि जानाति, यत् अद्यापि न प्रकाशितम् अस्ति सः सम्यक् अवदत् यत् विमोचनदिनाङ्कः २० अगस्तः अस्ति, अवास्तविक ५ इञ्जिनस्य उपयोगः कृतः, तथा च नेटिजनानाम् मध्ये चर्चाः सारांशतः उक्ताः
अन्ते नेटिजन्स्-पोष्ट् अपि अन्तर्भवति, यत् भवान् चर्चायां भागं ग्रहीतुं क्लिक् कर्तुं शक्नोति सम्पूर्णेन मञ्चेन सह कार्यात्मकं एकीकरणं पूर्वमेव अस्ति ।
परन्तु यतः मॉडलस्य केवलं लघुसंस्करणं वर्तते, अतः वयं अग्रिमे बलपरीक्षायै बृहत् मॉडलक्षेत्रं प्रति गमिष्यामः, अपि च GPT-4o इत्यनेन सह PK अपि भवितुम् अर्हति ।
अद्यतने लोकप्रियाः बुद्धिपरीक्षणप्रश्नाः"कः बृहत्तरः, ९.९ वा ९.११ वा?"परीक्षणे Grok-2 (sus-column-r) ChatGPT इत्यस्य नवीनतमसंस्करणात् अधिकं कार्यं करोति ।
परन्तु अन्यत् लोकप्रियपरीक्षा"स्ट्रॉबेरीयां कति रः सन्ति"।मुद्दे अद्यापि उभौ असफलौ अभवताम्। (कतिपयवारं प्रयतस्व तर्हि उभयस्य सम्यक् प्राप्तेः अल्पः सम्भावना अस्ति)।
अधिकाः गम्भीराः जालप्रश्नाः"अधोलिखितानां मोमबत्तानां मध्ये कः प्रथमं निष्प्रभः भविष्यति?", Grok-2 ChatGPT इत्यस्मात् किञ्चित् अधिकं उन्नतम् अस्ति ।
परीक्षणबिन्दुः अस्ति यत् मोमबत्तीयाः अवशिष्टः भागः यः प्रथमं उड्डीयते सः दीर्घः भवति (समीचीनम् उत्तरम् ३ ChatGPT तस्य व्याख्यां गलत् करोति यत् The Grok-2 विचारः सम्यक् अस्ति, परन्तु यस्य संख्या एकः दीर्घतमः अस्ति न सम्यक्।
उभौ अपि कथञ्चित् क्लासिकं बृहत् मॉडल् दुर्बलता "विपर्ययस्य शापः" समस्यां अतिक्रान्तौ इति भासते। न केवलं प्रत्यक्षतया उत्तरं दातुं शक्नोति "टॉम क्रूजस्य माता का अस्ति?", अपितु "मैरी ली फीफरस्य पुत्रः टॉम क्रूजः" इति विपरीतप्रश्नस्य उत्तरं दातुं शक्नोति यस्य दत्तांशः न्यूनतया दृश्यते
(अवश्यं, शास्त्रीयसमस्या भवितुं अनन्तरं अधिकं प्रासंगिकं दत्तांशं उपलब्धं भविष्यति इति न निराकर्तुं शक्यते ।)
मस्कस्य विशालस्य मॉडलस्य उन्नयनं टेस्ला इत्यस्य व्ययेन अभवत्
परीक्षणस्य समाप्तिः अभवत्, पूर्वपीढीयाः ग्रोक्-१.५ इत्यस्य तुलने ग्रोक्-२ इत्यनेन महती प्रगतिः कृता इति द्रष्टुं शक्यते ।
पर्दापृष्ठे मस्कः बहु संसाधनं जनशक्तिं च व्ययितवान् ।
यथा, xAI इत्यत्र सम्मिलितः एकः नूतनः शोधकः अवदत् यत् एतस्य उपयोगः कर्तुं शक्यते इतिएकलक्षं कार्डसमूहम्विद्यालये दुर्बलसंसाधनानाम् अपेक्षया शोधं करणं बहु अधिकं आनन्ददायकं भवति।
परन्तु एकः जनानां समूहः सन्तुष्टः नास्ति : टेस्ला-भागधारकाः ।
वालस्ट्रीट् जर्नल्-पत्रिकायाः अनुसारम्,मस्कः टेस्लातः xAI इत्यस्मै प्रतिभां, आँकडा, GPU संसाधनं च स्थानान्तरयति。
एतावता xAI इत्यनेन न्यूनातिन्यूनं ११ कर्मचारीः नियुक्ताः ये टेस्ला-संस्थायां कार्यं कृतवन्तः, येषु षट् प्रत्यक्षतया ऑटोपायलट्-दले कार्यं कृतवन्तः ।
मस्क इत्यनेन एनवीडिया इत्यनेन अपि आह यत् सः मूलतः टेस्ला इत्यस्य कृते आरक्षितानां जीपीयू-आदेशानां कृते xAI इत्यस्य आपूर्तिं प्राथमिकताम् अददात् ।
मस्कः टेस्ला-संस्थायाः संग्रहणस्य विशालमात्रायां दृश्यदत्तांशस्य विषये अपि सार्वजनिकरूपेण उक्तवान्, यस्य उपयोगः xAI-माडलस्य प्रशिक्षणार्थं संसाधनरूपेण कर्तुं शक्यते इति सः वदति ।
अस्मिन् विषये न्यूनातिन्यूनं त्रयः टेस्ला-भागधारकाः मस्क-इत्यस्य विरुद्धं मुकदमान् कृतवन्तः, यत् xAI-इत्यस्मै संसाधनानाम् स्थानान्तरणेन टेस्ला-निवेशकानां हितस्य हानिः अभवत् इति ।
सम्प्रति डेलावेर्-नगरस्य न्यायालये एषः प्रकरणः लम्बितः अस्ति ।