google deepmind genrm प्रौद्योगिकीम् प्रदर्शयति: जननात्मक ai तर्कक्षमतासु सुधारं कर्तुं पुरस्कारप्रतिरूपरूपेण llms सूक्ष्म-समायोजनम्

2024-09-03

आईटी हाउस् इत्यनेन ३ सितम्बर् दिनाङ्के ज्ञापितं यत् गूगल डीपमाइण्ड्-दलेन २७ अगस्त दिनाङ्के arxiv इत्यस्य विषये एकं पत्रं प्रकाशितम्, यत्र genrm जनरेटिव् सत्यापनकर्तायाः परिचयः, प्रदर्शनं च अभवत् तथा च जनरेटिव् एआइ तर्कक्षमतासु सुधारं कर्तुं पुरस्कारप्रतिरूपं रचनात्मकरूपेण प्रस्तावितं

एआइ उद्योगे बृहत्भाषाप्रतिमानानाम् (llms) उन्नयनार्थं वर्तमानः मुख्यधारापद्धतिः best-of-n मोडः अस्ति, अर्थात् llm द्वारा उत्पन्नानि n उम्मीदवारसमाधानाः सत्यापनकर्ताद्वारा क्रमबद्धाः भवन्ति, सर्वोत्तमसमाधानं च चयनं भवति .

एतादृशाः एलएलएम-आधारित-सत्यापकाः प्रायः समाधानं स्कोरं कर्तुं विवेकशील-वर्गीकरणकर्तृत्वेन प्रशिक्षिताः भवन्ति, परन्तु ते पूर्वप्रशिक्षितानां एलएलएम-पाठ-जनन-क्षमतायाः लाभं न ग्रहीतुं शक्नुवन्ति

एतां सीमां दूरीकर्तुं deepmind-दलेन सत्यापनं समाधानजननं च कुर्वन् सत्यापनकर्तारं प्रशिक्षितुं अग्रिम-टोकन-पूर्वसूचना-लक्ष्यस्य उपयोगं कर्तुं प्रयतितम्

deepmind दलस्य जननात्मकसत्यापके (genrm) मुख्यतया पारम्परिकसत्यापकानां तुलने निम्नलिखितलाभाः समाविष्टाः सन्ति ।

आदेशसमायोजनस्य निर्बाधं एकीकरणम्

विचारतर्कस्य श्रृङ्खलायाः समर्थनं कुर्वन्तु

बहुमतमतदानद्वारा अतिरिक्तानुमानसमयगणनानां लाभः

एल्गोरिदमिक तथा प्राथमिकविद्यालयस्य गणितीयतर्ककार्येषु गेम्मा-आधारित-सत्यापकानाम् उपयोगं कुर्वन् genrm विवेकपूर्ण-एलएलएम-एज-ए-जज-सत्यापकानां कृते अधिकं प्रदर्शनं करोति, येन best-of-n 16-64% इत्यस्य उपयोगेन समाधानं कृतानां समस्यानां प्रतिशतं सुधारः भवति

यथा google deepmind इत्यनेन ज्ञापितं, श्रेणीगतपुरस्कारप्रतिमानानाम् उपरि genrm इत्यस्य धारः कृत्रिमबुद्धिपुरस्कारप्रणालीषु महत्त्वपूर्णविकासं चिह्नयति, विशेषतः नूतनप्रतिमानैः ज्ञातं धोखाधड़ीं निवारयितुं तेषां क्षमतायाः दृष्ट्या एषा प्रगतिः सामाजिकदायित्वमानकैः सह एआइ-निष्पादनं संरेखयितुं पुरस्कारप्रतिमानानाम् उन्नयनस्य तत्कालीनावश्यकताम् प्रकाशयति ।

समाचारं

आमुख

मम सम्पर्कसूचना