गूगलस्य २ अरब पैरामीटर् Gemma 2 GPT-3.5 इत्यस्य सङ्गतिं करोति तथा च iPhone

गूगलस्य २ अरब पैरामीटर् गेम्मा २ जीपीटी-३.५ इत्यस्य मार्गं गृह्णाति, आईफोन् इत्यत्र अतीव द्रुतगत्या चालयति च

2024-08-02

स्मार्ट वस्तूनि (सार्वजनिकलेखः : १.झीड्क्सकोम्）
संकलनम्वेनिला
सम्पादनली शुइकिंग्

Google DeepMind इत्यस्य मुक्तस्रोतस्य लघुमाडलपरिवारस्य नूतनसदस्यानां स्वागतं भवति!

Zhidongzhi इत्यनेन अगस्तमासस्य प्रथमदिनाङ्के उक्तं यत् अद्य प्रातःकाले Google DeepMind इत्यनेन लघुभारयुक्तस्य मॉडलस्य Gemma 2 2B इत्यस्य स्कोरः GPT-3.5 तथा Llama 2 70B इत्यादिभिः बृहत्तरैः मापदण्डैः सह मॉडल् अतिक्रान्तवान् ।

▲जेम्मा २ २ ख

केवलं २ अरब पैरामीटर् इत्यनेन सह गेम्मा २ २ बी इत्येतत् मोबाईलफोन्, पीसी इत्यादिषु टर्मिनल् उपकरणेषु सहजतया शीघ्रं च चालयितुं शक्नोति । गूगल एआइ स्टूडियो इत्यत्र विकासकानां वास्तविकपरीक्षणस्य अनुसारं अनुमानस्य गतिः ३०~४० टोकन/सेकण्ड् यावत् भवति ।

▲विकासकाः Gemma 2 2B परीक्षणं कुर्वन्ति

Gemma 2 2B इत्यस्य पार्श्वे प्रारब्धाः Gemma Scope इति मॉडलव्याख्याक्षमतां वर्धयितुं साधनं, ShieldGemma इति हानिकारकसामग्रीणां छाननाय सुरक्षावर्गीकरणप्रतिरूपं च

गेम्मा स्कोप् मॉडल् मध्ये विशिष्टबिन्दून् प्रवर्धनार्थं विरल ऑटोएन्कोडर (SAE) इत्यस्य आधारेण भवति तथा च तस्य अनुकूलनार्थं JumpReLU आर्किटेक्चरस्य उपयोगं करोति, तस्मात् मॉडल् मध्ये संसाधितानां सघनानां जटिलानां च सूचनानां विश्लेषणं कर्तुं साहाय्यं करोति, येन शोधकर्तारः मॉडल् इव "द्रष्टुं" शक्नुवन्ति a microscope internal.

ShieldGemma चतुर्णां हानिक्षेत्राणां कृते निर्मितम् अस्ति: द्वेषभाषणं, उत्पीडनं, अश्लीलसामग्री, खतरनाकसामग्री च, प्रतिक्रियापरीक्षासु GPT-4 इत्यादीनां बेन्चमार्कमाडलानाम् अतिक्रमणं करोति

अस्मिन् वर्षे फरवरीमासे प्रारम्भे प्रारब्धा गेम्मा श्रृङ्खला मॉडल् मिथुन मॉडलस्य अनुभवस्य आधारेण गूगल डीपमाइण्ड् इत्यनेन निर्मिताः मुक्तस्रोतमाडलाः सन्ति जूनमासे गूगलेन द्वितीयपीढीयाः मुक्तस्रोतमाडलं Gemma 2 इति प्रक्षेपणं कृतम्, यत्र 9B तथा 27B इत्येतयोः पैरामीटर् आकारद्वयं भवति तेषु 27B मॉडल् LMSYS बृहत् मॉडलक्षेत्रे शीघ्रमेव मुक्तस्रोतमाडलस्य अग्रणीः अभवत्

1. 35 गुणाधिकं मापदण्डैः सह विशालं मॉडलं पराजयन्तु, गेम्मा 2 इत्यस्य तुलने कोऽपि समस्या नास्ति

गेम्मा २ २ बी बृहत्तरमाडलात् परिष्कृतम् अस्ति तथा च २७बी तथा ९बी इत्येतयोः पश्चात् गूगलेन प्रारब्धं तृतीयं गेम्मा २ मॉडल् अस्ति ।

केवलं २ अरब मापदण्डैः सह लघुभारयुक्तस्य मॉडलस्य रूपेण गेम्मा २ २ बी पोर्टेबिलिटी कृते कार्यक्षमतायाः बलिदानं न करोति । LMSYS Large Model Arena (Chatbot Arena) इति क्रमाङ्कने Gemma 2 2B इत्यनेन GPT-3.5 इत्येतत् 1126 अंकैः अतिक्रान्तम्, तथैव तस्य Mixtral 8x7B तथा Llama 2 70B मॉडल् इत्येतौ पैरामीटर् स्केलस्य दर्जनशः गुणान् अपि अतिक्रान्तम्

▲Gemma 2 2B’s परिणामाः बृहत् मॉडलक्षेत्रे

केचन नेटिजनाः Gemma 2 2B "overturning" इत्यस्य 9.9 तथा 9.11 अनुपातसमस्यायाः परीक्षणं अनेकेषु बृहत् मॉडलेषु कृतवन्तः, Gemma 2 2B इत्यनेन शीघ्रमेव सम्यक् उत्तरं दत्तम् ।

▲जेम्मा २ २ख उत्तराणि

लघुभारयुक्तानां मॉडलानां धावनवेगः महत् लाभः अस्ति । कियत् शीघ्रं सम्यक् ? एप्पल् यन्त्रशिक्षणस्य शोधकर्त्री Awni Hannun इत्यनेन स्वस्य iPhone 15 pro इत्यस्मिन् MLX Swift इत्यस्मिन् Gemma 2 2B इत्यस्य परीक्षणं कृतम्, तस्य अनुमानस्य गतिः च दृश्यमानरूपेण द्रुतगतिः आसीत् ।

▲जेम्मा 2 2B धावनवेग

वास्तविकपरीक्षणानन्तरं विकासकः टॉम हुआङ्ग् इत्यनेन उक्तं यत् गूगल एआइ स्टूडियो इत्यत्र तस्य चालनवेगः प्रायः ३०~४० टोकन/सेकण्ड् अस्ति, यत् "एप्पल् इत्यस्य मॉडलात् द्रुततरम्" अस्ति ।

परिनियोजनस्य दृष्ट्या Gemma 2 2B लचीलानि परिनियोजनविधयः प्रदाति तथा च Vertex AI इत्यस्य आधारेण एज उपकरणानि, लैपटॉप्, अथवा क्लाउड् परिनियोजनं सहितं विविधहार्डवेयर् इत्यत्र कुशलतया चालयितुं शक्नोति

विकासकाः Gemma 2 2B इत्यस्य मॉडल् वेट् इत्येतत् Hugging Face तथा Kaggle इत्यादिभ्यः मञ्चेभ्यः अनुसन्धानं व्यावसायिकं च अनुप्रयोगं कर्तुं डाउनलोड् कर्तुं शक्नुवन्ति, अथवा Google AI Studio इत्यत्र तस्य कार्याणि प्रयतितुं शक्नुवन्ति

मुक्तस्रोतसङ्केतः : १.

https://huggingface.co/google/gemma-2-2b

द्वि,चतुर्विधसामग्रीणां कृते वर्गीकारकं निर्मायताम्, यस्य प्रतिक्रियादरः GPT-4 इत्यस्मात् उत्तमः भवति

मॉडलस्य सुरक्षां सुलभतां च सुधारयितुम् गूगलेन ShieldGemma इति Gemma 2 इत्यत्र निर्मितस्य सुरक्षितसामग्रीवर्गीकरणस्य मॉडलस्य समुच्चयः प्रारब्धः, यस्य उपयोगः AI मॉडलस्य इनपुट्-आउटपुट् च छानने भवति गूगलस्य उत्तरदायी AI उपकरणपुस्तिकायां विद्यमानाः आदर्शाः सुरक्षावर्गीकरणसमूहस्य एकः परिवर्तनः ।

▲ShieldGemma कथं कार्यं करोति

ShieldGemma चतुर्णां हानिक्षेत्राणां कृते निर्मितम् अस्ति: द्वेषभाषणं, उत्पीडनं, अश्लीलसामग्री, खतरनाकसामग्री च, तथा च 2B, 9B, 27B च सहितं भिन्न-भिन्न-आवश्यकतानां पूर्तये विविधाः मॉडल-आकाराः प्रदाति तेषु 2B पैरामीटर् मॉडल् ऑनलाइन वर्गीकरणकार्यस्य कृते उपयुक्तं भवति, यदा तु 9B तथा 27B संस्करणस्य उपयोगः अफलाइन अनुप्रयोगानाम् उच्चतरं प्रदर्शनं प्रदातुं भवति

बाह्यदत्तांशसमूहेषु मूल्याङ्कनपरिणामेषु ShieldGemma इत्यनेन OpenAI Mod तथा GPT-4 इत्यादीनां आधाररेखाप्रतिमानानाम् अतिक्रान्तम् ।

▲ShieldGemma मूल्यांकन परिणाम

ShieldGemma इत्यस्य तकनीकीप्रतिवेदनं अपि युगपत् सार्वजनिकं कृतम्, यस्मिन् निर्माणपद्धतिः, आँकडास्रोतः, मॉडलस्य प्रभावशीलता च व्याख्याता आसीत् । चतुर्प्रकारस्य हानिकारकसामग्रीणां प्रतिक्रियापरीक्षायां त्रिषु स्केलेषु ShieldGemma इत्यस्य प्रतिक्रियादरः GPT-4 इत्यस्मात् उत्तमः भवति ।

▲ShieldGemma प्रतिक्रिया परीक्षण

तकनीकी प्रतिवेदन पता : १.

https://storage.googleapis.com/deepmind-media/gemma/shieldgemma-रिपोर्ट.pdf

त्रयः,शून्यसङ्केतेन सह आदर्शव्यवहारस्य विश्लेषणार्थं बृहत्प्रतिमानानाम् अन्तः "सूक्ष्मदर्शकः"

भाषाप्रतिमानानाम् आन्तरिककार्यसिद्धान्तानां अध्ययनार्थं गूगलेन एकं व्यापकं मुक्तं च विरलं स्वयम्-एन्कोडरं गेम्मा स्कोपं प्रारब्धम् । इदं सूक्ष्मदर्शकवत् कार्यं करोति, शोधकर्तृभ्यः आदर्शस्य अन्तः "द्रष्टुं" साहाय्यं करोति यत् ते कथं कार्यं करोति इति अधिकतया अवगन्तुं शक्नुवन्ति ।

गेम्मा स्कोप् स्पर्स ऑटोएन्कोडर्स् (SAEs) इत्यस्य उपयोगेन मॉडल् मध्ये विशिष्टानि बिन्दून् प्रवर्धयति एते SAEs मॉडल् मध्ये संसाधितानां सघनानां जटिलानां च सूचनानां विश्लेषणं कर्तुं सहायं कुर्वन्ति, येन तस्य विस्तारः भवति यत् विश्लेषितुं अवगन्तुं च सुकरं भवति

▲SAE व्याख्यायाः उपयोगेन मॉडलसक्रियीकरणस्य शैलीबद्धं प्रतिनिधित्वम्

एतेषां विस्तारितानां दृष्टिकोणानां अध्ययनेन शोधकर्तारः अवगन्तुं शक्नुवन्ति यत् गेम्मा 2 कथं प्रतिमानं ज्ञायते, सूचनां संसाधयति, अन्ते च भविष्यवाणीं करोति, एआइ-प्रणालीनां निर्माणं कथं करणीयम् इति अन्वेषणं कुर्वन्ति, येषां अवगमनं सुलभं, अधिकविश्वसनीयं, विश्वसनीयं च भवति

पूर्वं एसएई विषये शोधं मुख्यतया लघुप्रतिरूपे अथवा विशाले प्रतिरूपे एकस्य स्तरस्य आन्तरिककार्यस्य अध्ययनं प्रति केन्द्रितम् अस्ति । गेम्मा स्कोप् इत्यस्य सफलता अस्ति यत् गेम्मा २ मॉडलस्य प्रत्येकं लेयर तथा उपस्तरस्य आउटपुट् इत्यत्र SAE इत्यस्य प्रशिक्षणं करोति । अस्मिन् ४०० तः अधिकाः एसएई उत्पन्नाः, ३ कोटिभ्यः अधिकानि विशेषतानि च ज्ञातानि ।

▲Gemma Scope’s SAE discovery feature इत्यस्य उदाहरणं सक्रियीकरणम्

Gemma Scope इत्यनेन प्रशिक्षणार्थं नूतनं JumpReLU SAE आर्किटेक्चर अपि उपयुज्यते । मूल SAE आर्किटेक्चरस्य कृते कति विशेषताः सन्ति इति ज्ञातुं तेषां बलस्य अनुमानं च लक्ष्यद्वयं सन्तुलितं कर्तुं कठिनम् अस्ति । JumpReLU आर्किटेक्चर इत्यनेन एतत् संतुलनं अधिकसुलभतया प्राप्तुं शक्यते, येन त्रुटिः महत्त्वपूर्णतया न्यूनीभवति ।

गेम्मा स्कोप् इत्यनेन कुलम् ४०० तः अधिकाः मुक्ताः एसएई उद्घाटिताः, येषु गेम्मा २ २ बी तथा ९बी इत्येतयोः सर्वान् स्तराः आच्छादिताः सन्ति, तथा च शोधकर्तारः एसएई विशेषतानां अध्ययनं कर्तुं शक्नुवन्ति तथा च कोडं लिखितुं विना मॉडलव्यवहारस्य विश्लेषणं कर्तुं शक्नुवन्ति

▲जेम्मा स्कोप अन्तरक्रियाशील प्रदर्शन

डेमो पता : १.

https://www.neuronpedia.org/gemma-scope इति वृत्तान्तः

तकनीकी प्रतिवेदन पता : १.

https://storage.googleapis.com/जेम्मा-स्कोप/जेम्मा-स्कोप-रिपोर्ट.pdf

अन्वयः - जननात्मकःऐवायुः लघुप्रतिरूपं प्रति प्रवहति तथा...ऐसुरक्षा

जननात्मक-एआइ-विकासात् आरभ्य, आदर्शः "आयतन"-मापदण्डात् "आयतन"-मापदण्डात् अधुना "आयतन"-लघुभारं "आयतन"-सुरक्षां च गतः, यत् प्रतिबिम्बयति यत् प्रौद्योगिकी-कार्यन्वयनस्य प्रक्रियायां, एतत् उपयोक्तृणां समीपे, न्यूनतरम् अस्ति व्ययः, विशिष्टानि आवश्यकतानि पूर्तयितुं च अधिकतया समर्थः भवति।

ए.आइ.पी.सी., ए.आइ.

समाचारं

गूगलस्य २ अरब पैरामीटर् गेम्मा २ जीपीटी-३.५ इत्यस्य मार्गं गृह्णाति, आईफोन् इत्यत्र अतीव द्रुतगत्या चालयति च

आमुख

मम सम्पर्कसूचना