समाचारं

Mistral AI द्वौ क्रमशः विमोचनौ: 7B गणितीयतर्कसमर्पितम्, Mamba2 आर्किटेक्चर कोड बृहत् मॉडल

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

नेटिजनाः जिज्ञासुः सन्ति यत् "को बृहत्तरः, ९.११ वा ९.९ वा" इति समस्यायाः समाधानं कर्तुं मथ्स्ट्राल् कर्तुं शक्नोति वा?

कालः एआइ-वृत्तं एकेन सरलेन प्रश्नेन अभिभूतम् आसीत् यत् "कोऽस्ति बृहत्तरः, ९.११ वा ९.९?"





एतेन वयं द्रष्टुं शक्नुमः यत् बृहत्भाषाप्रतिमानाः केषाञ्चन संख्यात्मकसमस्यानां निवारणे मनुष्याणां इव सम्यक् उत्तराणि अवगन्तुं दातुं च न शक्नुवन्ति ।

संख्यात्मकजटिलगणितीयसमस्यानां कृते विशेषप्रतिमानाः अधिकं विशेषाः भवन्ति ।

अद्य फ्रांसदेशस्य विशालः मॉडलः एकशृङ्गः Mistral AI इत्यनेन क...7B मॉडल "Mathstral" गणितीयतर्कं वैज्ञानिकं आविष्कारं च केन्द्रितम् अस्ति, उन्नतगणितीयसमस्यानां समाधानार्थं येषु जटिलं बहुचरणीयं तार्किकतर्कस्य आवश्यकता भवति ।

इदं प्रतिरूपं Mistral 7B इत्यत्र निर्मितम् अस्ति, 32k इत्यस्य सन्दर्भविण्डोदीर्घतां समर्थयति, तथा च मुक्तस्रोतसमझौते Apache 2.0 अनुज्ञापत्रस्य अनुसरणं करोति ।

Mathstral इत्यस्य निर्माणं उत्तमं प्रदर्शन-गति-व्यापारं मनसि कृत्वा कृतम् आसीत्, एतत् विकास-दर्शनं यत् Mistral AI सक्रियरूपेण प्रवर्तयति, विशेषतः तस्य सूक्ष्म-समायोजन-क्षमतया सह



तस्मिन् एव काले मथस्ट्रल् इति एकः अनिवार्यः प्रतिरूपः अस्ति यस्य उपयोगः वा सूक्ष्मरूपेण वा कर्तुं शक्यते । HuggingFace इत्यत्र मॉडल् वेट् स्थापिताः सन्ति ।

  • मॉडल भार: https://huggingface.co/mistralai/mathstral-7B-v0.1

अधोलिखितः आलेखः विषयानुसारं Mathstral 7B तथा Mistral 7B इत्येतयोः मध्ये MMLU प्रदर्शनान्तरं दर्शयति ।

Mathstral उद्योग-मानक-विविध-मापदण्डेषु स्वस्य स्केल-मध्ये अत्याधुनिक-अनुमान-प्रदर्शनं प्राप्नोति । विशेषतः MATH-दत्तांशसमूहे MMLU इत्यत्र ५६.६% उत्तीर्ण-दरं, ६३.४७% उत्तीर्ण-दरं च प्राप्तवान् ।



तस्मिन् एव काले MATH इत्यत्र Mathstral इत्यस्य उत्तीर्णतायाः दरः (56.6%) Minerva 540B इत्यस्मात् 20% अधिकः अस्ति । तदतिरिक्तं, Mathstral इत्यनेन MATH इत्यत्र 68.4% स्कोरः प्राप्तः यत्र बहुमतं @64, पुरस्कारप्रतिरूपस्य उपयोगेन 74.6% च मतदानं कृतम् ।



एतेन परिणामेन नेटिजनाः अपि जिज्ञासुः अभवन् यत् मथस्ट्रल् "को बृहत्तरः, ९.११ वा ९.९" इति समस्यायाः समाधानं कर्तुं शक्नोति वा?



कोड मम्बा: कोडस्ट्रल मम्बा



  • मॉडल भार: https://huggingface.co/mistralai/mamba-codestral-7B-v0.1

Mathstral 7B इत्यनेन सह विमोचितं, कोड्-जननार्थं विशेषतया उपयुज्यमानं Codestral Mamba मॉडल् अपि अस्ति, यत् Mamba2 आर्किटेक्चरस्य उपयोगं करोति तथा च Apache 2.0 अनुज्ञापत्रस्य मुक्तस्रोतसमझौतेः अनुसरणं करोति इदं ७ अरब-अधिक-मापदण्डैः सह मार्गदर्शन-प्रतिरूपम् अस्ति यस्य उपयोगं शोधकर्तारः निःशुल्कं कर्तुं, परिवर्तनं, वितरणं च कर्तुं शक्नुवन्ति ।

ज्ञातव्यं यत् कोडस्ट्रल् माम्बा इत्यस्य डिजाइनं माम्बा लेखकानां अल्बर्ट् गु, त्रि दाओ इत्येतयोः साहाय्येन कृतम् आसीत् ।

ट्रांसफार्मर आर्किटेक्चर इत्यनेन एआइ क्षेत्रस्य आर्धं समर्थनं सर्वदा कृतम् अस्ति तथापि ट्रांसफॉर्मर इत्यस्य विपरीतम् माम्बा मॉडल् इत्यस्य रेखीयसमयतर्कस्य लाभः अस्ति तथा च सैद्धान्तिकरूपेण अनन्तदीर्घतायाः अनुक्रमस्य प्रतिरूपणं कर्तुं शक्नोति वास्तुकला उपयोक्तारः निवेशदीर्घतायाः सीमां विना मॉडलेन सह व्यापकरूपेण शीघ्रं च अन्तरक्रियां कर्तुं शक्नोति । एषा कार्यक्षमता विशेषतया कोडजननार्थं महत्त्वपूर्णा अस्ति ।

बेन्चमार्कपरीक्षासु Codestral Mamba इत्यनेन HumanEval परीक्षणे प्रतिस्पर्धात्मकानां मुक्तस्रोतमाडलानाम् CodeLlama 7B, CodeGemma-1.17B, DeepSeek इत्येतयोः प्रदर्शनं कृतम् ।



मिस्ट्रल् इत्यनेन अस्य मॉडलस्य परीक्षणं कृतम्, यत् मिस्ट्रल् इत्यस्य la Plateforme API इत्यत्र निःशुल्कं उपलभ्यते, तथा च २५६,००० टोकनपर्यन्तं निवेशं सम्भालितुं शक्नोति - OpenAI इत्यस्य GPT-4o इत्यस्मात् द्विगुणं

Codestral Mamba इत्यस्य विमोचनेन सह केचन नेटिजनाः VSCode इत्यत्र तस्य उपयोगं कृतवन्तः, अतीव सुचारुः च अस्ति ।