बृहत् मॉडल निर्देश ट्यूनिङ्ग डाटा सेट् इत्यस्य १०,००० शब्दानां मूल्याङ्कनम्! टेनसेण्ट् तथा शङ्घाई जिओ टोङ्ग विश्वविद्यालयेन संयुक्तरूपेण निर्मितम्
2024-08-15
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
- Tencent Youtu Lab द्वारा योगदान
Qubits |.सार्वजनिक खाता QbitAI
बृहत् मॉडल् इत्यस्य तीव्रविकासेन सह, मॉडल् प्रदर्शनं सामान्यीकरणक्षमता च सुधारयितुम् निर्देश ट्यूनिङ्ग् महत्त्वपूर्णां भूमिकां निर्वहति ।
परन्तु निर्देश-ट्यूनिङ्ग-दत्तांशसमूहानां कृते आँकडा-मूल्यांकन-चयन-विधयः अद्यापि एकीकृत-प्रणालीं न निर्मितवन्तः, तथा च व्यापक-गहन-समीक्षायाः अभावः अस्ति
एतत् अन्तरं पूरयितुं Tencent Youtu Lab इत्यनेन समाधानार्थं सम्पूर्णसमीक्षा प्रकाशिता ।
अस्य दीर्घः १०,००० शब्दाधिकः अस्ति, अत्र ४०० तः अधिकाः दस्तावेजाः सन्ति ।
अस्मिन् अध्ययने गुणवत्ता, विविधता, महत्त्वं च इति मुख्यत्रयपक्षेषु आँकडामूल्यांकनं चयनविधिः च समाविष्टा अस्ति, येषु प्रत्येकं विस्तरेण वर्गीकृतं विस्तृतं च कृतम् अस्ति
तस्मिन् एव काले लेखकः अस्मिन् क्षेत्रे नवीनतमप्रगतेः प्रवृत्तीनां च विषये अपि ध्यानं ददाति, यत्र केचन उदयमानाः प्रौद्योगिकयः पद्धतयः च सन्ति, यथा आँकडास्कोरिंग् कृते GPT इत्यादीनां शक्तिशालिनां भाषाप्रतिमानानाम् उपयोगः, द्विस्तरीय-अनुकूलनस्य आधारेण Coreset-नमूनाकरणम् इत्यादयः .
निर्देश-ट्यूनिंग-दत्तांशसमूहानां व्यापकं मूल्याङ्कनम्
एलएलएमस्य विकासस्य लक्ष्यं प्राकृतिकभाषाप्रक्रियाकरणस्य (NLP) कार्याणां सामान्यीकरणक्षमतां अनलॉक् कर्तुं भवति, यस्मिन् निर्देशस्य ट्यूनिङ्गस्य महत्त्वपूर्णा भूमिका भवति, तथा च निर्देशस्य ट्यूनिङ्गस्य प्रभावाय आँकडागुणवत्ता महत्त्वपूर्णा भवति
लेखकाः विभिन्ननिर्देशानां ट्यूनिङ्गदत्तांशसमूहानां कृते आँकडामूल्यांकनस्य चयनपद्धतीनां च गहनं अध्ययनं कुर्वन्ति, गुणवत्ता, विविधता, महत्त्वं च इति त्रयाणां पक्षेभ्यः वर्गीकरणं विस्तारं च कुर्वन्ति
★गुणवत्ता आकलन एवं चयन
“गुणवत्ता” मुख्यतया आदेशप्रतिसाददत्तांशबिन्दून् पूर्णतां, सटीकताम्, उचिततां च निर्दिशति विद्यमानाः पद्धतयः सामान्यतया एतेषां आयामानां व्यापकविचारार्थं एकीकृतं स्कोरिंगतन्त्रं विकसयन्ति
दत्तांशसमूहस्य गुणवत्तायाः विषये लेखकः मुख्यतया चत्वारि परीक्षणपद्धतीनां सारांशं ददाति ।
- प्रथमं सूचकानाम् डिजाइनं हस्तचलितरूपेण करणीयम्, यथा शब्दावली, वाक्यविन्यासः, शब्दार्थसादृश्यम् इत्यादीनां उपयोगः दत्तांशगुणवत्तायाः मूल्याङ्कनार्थं लाभः अस्ति यत् सूचकगणना स्पष्टा भवति, परन्तु असङ्गतनिर्देश-प्रतिक्रियायुग्मानां अन्वेषणं कर्तुं न शक्नोति
- द्वितीयं मॉडल-आधारित-सूचकानाम् उपयोगः अस्ति एषा पद्धतिः प्रशिक्षणीय-प्रतिरूपस्य (यथा भ्रमस्य, बहु-आयामी-अङ्क-मूल्यांककस्य उपयोगः इत्यादीनां) उपयोगं करोति, यत् बहु-प्रशिक्षण-जागरूक-सूचकानाम् (यथा अनिश्चितता, पुरस्कार-अङ्कस्य) संकर-प्रौद्योगिक्या सह संयुक्तम् अस्ति , इत्यादि).
- तृतीया पद्धतिः प्रत्यक्षतया GPT इत्यस्मै समर्पयितुं OpenAI APIs इत्यस्य आह्वानं कृत्वा स्वयमेव निर्देशस्य ट्यूनिङ्ग् डाटा सेट् इत्यस्य स्कोरं कर्तुं शक्नोति एषा पद्धतिः मानवीयप्राथमिकतानां सह अत्यन्तं संरेखिता अस्ति गुणवत्तामापनस्य कृते व्ययदक्षतायां सुधारं कर्तुं शक्नोति।
- अन्ते, प्राधान्यसंरेखणदत्तांशसमूहानां निर्माणकाले एषा पद्धतिः अनिवार्यः अस्ति तथा च आदर्शप्रशिक्षणार्थं उच्चगुणवत्तायुक्तानि आँकडानि प्रदातुं शक्नोति तथापि विस्तृतमार्गदर्शिकानां निर्माणं करणीयम् अस्ति तथा च अन्यैः उपायैः पूरकं करणीयम् जीपीटी स्कोरिंग इति रूपेण।
★वैविध्यमूल्यांकनं चयनं च
अत्र विविधता निर्देशदत्तांशसमूहस्य व्यक्तिगतवैविध्यं (यथा शब्दावली तथा शब्दार्थसमृद्धिः) तथा समग्रवैविध्यं (यथा दत्तांशवितरणं) निर्दिशति विविधतायुक्तं दत्तांशसमूहं चयनं प्रतिरूपस्य सामान्यीकरणक्षमतां वर्धयितुं शक्नोति
लेखकः दत्तांशसमूहानां विविधतायाः परीक्षणस्य चत्वारि उपायानि अपि सारांशतः वदति ।
- मैन्युअल् रूपेण डिजाइनं कृतं सूचकाः : शाब्दिकवैविध्यं (यथा Type-token ratio, vocd-D, MTLD, HD-D इत्यादयः) तथा च शब्दार्थविविधता (यथा k-NN ग्राफद्वारा दूरस्य गणना, BERT एम्बेडिंग् इत्यस्य उपयोगेन विचरणस्य गणना इत्यादयः सन्ति ), इत्यादि प्रकारस्य सूचकः ।
- मॉडल-आधारित-मापदण्डाः : एन्ट्रोपी-सम्बद्धानां पद्धतीनां (यथा वेनिला एन्ट्रोपी, Rényi एन्ट्रोपी, सिम्पसनस्य सूचकाङ्कः, वेण्डी स्कोरः इत्यादयः), Task2Vec एम्बेडिंग्स्, ओपन-लेबल-विविधता-चिह्नानि इत्यादीनां माध्यमेन विविधतायाः मूल्याङ्कनं कुर्वन्तु
- ज्यामितीयविशेषतानां आधारेण कोरसेट् नमूनाकरणम् : सम्पूर्णदत्तांशसमूहस्य प्रतिनिधित्वार्थं k-center greedy, herding इत्यादीनां पद्धतीनां माध्यमेन सर्वाधिकं सूचनाप्रदं विविधं च उपसमूहं चयनं कुर्वन्तु, येन उपसमूहे मॉडलस्य प्रशिक्षणप्रदर्शनं प्रशिक्षणप्रदर्शनस्य समीपे भवति entire data set. , क्लस्टरिंग् प्रौद्योगिकी दत्तांशसंरचनायाः व्याख्याने भूमिकां निर्वहति ।
- द्वि-स्तरस्य आधारेण कोरसेट् नमूनाकरणम् : कोरसेट् नमूनाकरणं द्वि-स्तरस्य अनुकूलनसमस्यायाः रूपेण व्यवहरन्तु, हार्डमास्क अथवा सॉफ्टवेट् इत्यस्य अनुकूलनं कृत्वा उपसमूहानां चयनं कुर्वन्तु, यस्मिन् मॉडलस्य आन्तरिकमापदण्डानां अनुकूलनं तथा च आँकडाचयनस्य बाह्यपाशः सम्मिलितः भवति by Validation set, gradient matching and optimization techniques इत्यादिभिः दृढतायां दक्षतायां च सुधारं कर्तुं।
★महत्त्वस्य मूल्याङ्कनं चयनं च
महत्त्वं आदर्शप्रशिक्षणार्थं नमूनानां आवश्यकतां निर्दिशति, यत् आदर्शकार्येन सह सम्बद्धं भवति तथा च कार्यप्रदर्शनेन सह अपि सम्बद्धम् अस्ति । सुलभनमूनानां अतिरिक्तट्यूनिङ्गस्य आवश्यकता न भवेत्, यदा तु कठिननमूनानां आदर्शप्रशिक्षणाय महत्त्वपूर्णः भवति ।
महत्त्वस्य आकलनाय अनेके मुख्यसूचकाः पद्धतयः च सन्ति- १.
- हस्तनिर्मितमापदण्डाः : पठनीयतामापदण्डानां (यथा व्याकरणं, शब्दावली, अनुमाननिर्भरता इत्यादीनां) माध्यमेन पाठकठिनतायाः आकलनं कुर्वन्तु, मॉडलस्य दृढतायाः मूल्याङ्कनार्थं चुनौतीपूर्णनमूनानां चयनं कुर्वन्तु तथा च विवेकपूर्णानि एनएलपी-मापदण्डानि निर्मायन्तु।
- आदर्श-आधारित-सूचकाः : अनिश्चितता (यथा शीघ्र-अनिश्चितता), पुरस्कार-अङ्काः (प्रतिरूप-व्यवहारस्य कृते नमूनानां आवश्यकतायाः न्यायार्थं पुरस्कार-प्रतिरूपस्य उपयोगः) तथा च आँकडा-प्रतिरूपाः (यथा आँकडा-प्रतिरूपस्य माध्यमेन आदर्श-व्यवहारस्य उपरि आँकडा-बिन्दु-प्रभावस्य पूर्वानुमानं, वितरणस्य आधारेण DSIR समानता अनुमानस्य महत्त्वस्य स्कोरः, सर्वाधिकं प्रभावी उपसमूहस्य MATES निरन्तरं चयनं, Xie et al.
- हानि-त्रुटि-आधारितं कोरसेट्-नमूनाकरणम् : प्रशिक्षणे नमूनानां दोषाणां अभिलेखनं कृत्वा (यथा स्कोरं विस्मरन्, कण्ठस्थीकरणं, प्रभावं इत्यादीनि), एतादृशानां नमूनानां चयनं कृत्वा, ये नमूनानां चयनं कुर्वन्ति ये हानि-दोषे महतीं योगदानं ददति अथवा दुर्बल-प्रदर्शनं जनयन्ति, केचन अध्ययनाः पुनरावर्तनीय-सन्निकर्षस्य उपयोगं कुर्वन्ति तथा लघु एजेण्ट् आदर्शः सीमान्तप्रभावानाम् गणनां त्वरयति ।
- ढाल-आधारित कोरसेट् नमूनाकरणम् : ढाल-अनुकूलनं प्रत्यक्षतया प्रभावितं कर्तुं ढाल-लक्षणानाम् उपयोगं करोति, ढाल-मेलनस्य (यथा सम्पूर्णस्य आँकडा-समूहस्य ढालस्य अनुमानं करणं) तथा ढाल-आधारित-प्रभावस्य (यथा आदर्श-मापदण्डेषु नमूनानां प्रभावस्य मापनं) माध्यमेन चयनितम् through upper-weighted gradient multiplication) आँकडानां, केचन तकनीकाः (यथा निम्न-पदवी-ढाल-सादृश्य-अन्वेषणं, चलनमूना-सन्निकर्षम् इत्यादयः) गणनानां त्वरिततायै दक्षतां च सुधारयितुम् उपयुज्यन्ते, यदा तु सन्निकर्षस्य सटीकतायां दक्षतायां च विचारः करणीयः
विद्यमानाः आव्हानाः भविष्यस्य दिशाः च
लेखकाः मूल्याङ्कनहानिः बेन्चमार्कप्रदर्शनस्य च मध्ये दुर्बलसहसंबन्धः, परीक्षणसमूहदूषणम् इत्यादयः कारणानि सन्ति
भविष्ये निर्देश-ट्यूनिङ्ग-प्रतिमानानाम् चयनित-दत्तांश-बिन्दुनाञ्च मूल्याङ्कनार्थं, तथा च आँकडा-प्रदूषणस्य प्रभावं बहिष्कृत्य आँकडा-चयनं प्रतिरूप-मूल्यांकनं च वियुग्मनं कर्तुं विशेषमापदण्डानां निर्माणस्य आवश्यकता वर्तते
वर्तमानकाले "उत्तम" "दुष्ट" च निर्देशानां भेदार्थं कोऽपि एकीकृतः मानकः नास्ति आवश्यकताः अधःप्रवाहकार्यस्य आवश्यकताः।
यथा यथा दत्तांशसमूहस्य विस्तारः भवति तथा तथा वर्धितस्य शोरस्य, अतिफिटिंगस्य, विस्मरणस्य च विषयेषु इष्टतमचयनानुपातस्य निर्धारणं कठिनं भवति गुणवत्तामापनयोजनाभिः, विविधतायां बलं दत्त्वा, प्रशिक्षणपूर्वदत्तांशैः सह समानतां विचार्य च उत्तमचयनानुपातस्य निर्धारणं अनुशंसितम् आँकडामूल्यांकनस्य चयनस्य च कृते इष्टतमचयनानुपाताः अनुकूलिताः मापनीयतापाइपलाइनाः च।
आँकडा-समूहानां अतिरिक्तं स्वयं बृहत्-माडलानाम् आकारः अपि वर्धमानः अस्ति, येन आँकडा-मूल्यांकनं चयनं च न्यून-लाभ-प्रभावी भवति, अतः अनुकूलन-तकनीकाः, आयाम-निवृत्ति-विधयः इत्यादीनां पारम्परिक-यन्त्र-शिक्षण-प्रविधिषु पुनर्विचारं कुर्वन् कुशल-प्रतिनिधि-प्रतिरूपस्य विकासस्य आवश्यकता वर्तते
परियोजनायाः मुखपृष्ठम् : १.
https://github.com/yuleiqin/विलक्षण-दत्तांश-इञ्जिनीयरिङ्ग
कागजस्य सम्बोधनम् : १.
https://arxiv.org/abs/2408.02085