समाचारं

nvidia मुक्तस्रोत nemotron-mini-4b-लघुभाषाप्रतिरूपं निर्देशयन्तु

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house news on september 15th, the technology media marktechpost इत्यनेन कालः (14 सितम्बर), 2019 दिनाङ्के एकं ब्लॉग् पोस्ट् प्रकाशितम्।एनवीडिया इत्यनेन नेमोट्रॉन्-मिनी-४बी-इन्स्ट्रक्ट् एआइ मॉडल् मुक्तस्रोतः इति ज्ञातम्, येन एआइ क्षेत्रे कम्पनीयाः नवीनतायाः नूतनः अध्यायः चिह्नितः

लघुभाषाप्रतिमानानाम् महती सम्भावना

नेमोट्रॉन्-मिनी-4बी-इन्स्ट्रक्ट् एआइ मॉडल् भूमिका-निर्वाहः, रिट्रीवल-एग्मेण्ट्ड् जनरेशन (rag), तथा च फंक्शन् कॉलिंग् इत्यादीनां कार्याणां कृते डिजाइनं कृतम् अस्ति एतत् एकं लघुभाषा मॉडल् (slm) अस्ति यत् बृहत्तरेण नेमोट्रॉन् द्वारा आसुतं अनुकूलितं च भवति -४ १५b प्राप्नुत ।

एनवीडिया मॉडलं लघुतरं अधिकं च कुशलं कर्तुं, विशेषतया उपकरणपक्षस्य परिनियोजनाय उपयुक्तं कर्तुं छंटाई, क्वाण्टाइजेशन, आसवन इत्यादीनां उन्नत-एआइ-प्रौद्योगिकीनां उपयोगं करोति

एतत् आकारं न्यूनीकरणं भूमिका-निर्वाहः, कार्य-आह्वानं च इत्यादिषु विशिष्टेषु परिदृश्येषु मॉडलस्य कार्यक्षमतां न प्रभावितं करोति, येन एतत् तेषां अनुप्रयोगानाम् कृते व्यावहारिकं विकल्पं भवति येषां कृते द्रुत-माङ्ग-प्रतिक्रियायाः आवश्यकता भवति

इदं मॉडलं minitron-4b-base मॉडल् इत्यत्र सूक्ष्मतया ट्यून्ड् अस्ति तथा च llm संपीडनप्रौद्योगिक्याः उपयोगं करोति यत् एतत् 4096 सन्दर्भविण्डो टोकनं सम्भालितुं शक्नोति तथा च दीर्घतराणि अधिकानि च सुसंगतानि उत्तराणि जनयितुं शक्नोति

वास्तुकला तथा तकनीकी विनिर्देश

nemotron-mini-4b-instruct इत्यस्य शक्तिशालिनः वास्तुकलानां कृते प्रसिद्धः अस्ति, यत् कार्यक्षमतां मापनीयतां च सुनिश्चितं करोति ।

मॉडलस्य embedding size (यः परिवर्तितस्य सदिशस्य आयामं निर्धारयति) 3072, multi-head attention 32, mlp मध्यवर्ती आयामः 9216. बृहत्-परिमाणस्य निवेश-दत्तांशसमूहानां संसाधनं कुर्वन्, अद्यापि उच्च-सटीकतायाः सह respond कर्तुं शक्नोति तथा च प्रासंगिकता ।

तदतिरिक्तं, पाठस्य संसाधनस्य अवगमनस्य च क्षमतां अधिकं सुधारयितुम्, मॉडल् group query attention (gqa) तथा rotated position embedding (rope) प्रौद्योगिकीनां अपि उपयोगं करोति

इदं प्रतिरूपं transformer decoder architecture इत्यस्य आधारेण अस्ति तथा च autoregressive language model अस्ति । अस्य अर्थः अस्ति यत् पूर्ववर्तीनां टोकनानाम् आधारेण प्रत्येकं टोकं जनयति, येन संवादजननादिकार्यस्य कृते आदर्शः भवति, यत्र संवादस्य सुसंगतः प्रवाहः महत्त्वपूर्णः भवति

भूमिकानिर्वाहः तथा कार्यकॉलिंग् अनुप्रयोगाः

नेमोट्रॉन्-मिनी-4बी-इन्स्ट्रक्ट् भूमिका-निर्वाह-अनुप्रयोगेषु उत्कृष्टतां प्राप्नोति । अस्य विशाल-मार्कअप-क्षमतायाः अनुकूलित-भाषा-जनन-क्षमतायाः च सह, एतत् आभासी-सहायकेषु, वीडियो-क्रीडासु, अथवा अन्येषु कस्मिन् अपि अन्तरक्रियाशील-वातावरणे निहितं कर्तुं शक्यते यत्र महत्त्वपूर्ण-प्रतिक्रियाः जनयितुं एआइ-इत्यस्य आवश्यकता भवति

nvidia एकं विशिष्टं प्रॉम्प्ट् प्रारूपं प्रदाति यत् एतेषु परिदृश्येषु, विशेषतः एकल-अथवा बहु-वार्ता-वार्तालापेषु, मॉडल् सर्वोत्तम-परिणामान् निर्गच्छति इति सुनिश्चितं करोति ।

मॉडल् फंक्शन्-आह्वानस्य कृते अपि अनुकूलितं भवति, यत् तेषु वातावरणेषु महत्त्वपूर्णं भवति यत्र एआइ-प्रणाल्याः एपिआइ-इत्यनेन अन्यैः स्वचालित-प्रक्रियाभिः सह अन्तरक्रियां कर्तव्यम् सटीकं, कार्यात्मकं प्रतिक्रियां जनयितुं क्षमता एतत् प्रतिरूपं rag परिदृश्यानां कृते सुयोग्यं करोति यत्र प्रतिरूपस्य पाठस्य निर्माणस्य आवश्यकता भवति तथा च ज्ञानाधारात् सूचनां पुनः प्राप्तुं प्रदातुं च आवश्यकम् अस्ति