चीनस्य विज्ञानप्रौद्योगिकीविश्वविद्यालयः Huawei Noah Entropy Law इत्यनेन सह मिलित्वा बृहत् models_news इत्यस्य प्रदर्शनं तथा च आँकडासंपीडनदरं प्रकाशयति

चीनस्य विज्ञानप्रौद्योगिकीविश्वविद्यालयेन हुवावे नोआ एन्ट्रोपी लॉ इत्यनेन सह मिलित्वा बृहत्माडलानाम् कार्यक्षमतायाः, आँकडासंपीडनदरस्य च प्रकाशनं कृतम्

2024-07-22

AIxiv इति स्तम्भः एकः स्तम्भः अस्ति यत्र मशीन् हार्ट् शैक्षणिकं तकनीकीं च सामग्रीं प्रकाशयति । विगतकेषु वर्षेषु, हार्ट आफ् द मशीन एआइक्सिव् स्तम्भे २००० तः अधिकाः प्रतिवेदनाः प्राप्ताः, येषु विश्वस्य प्रमुखविश्वविद्यालयानाम्, कम्पनीनां च शीर्षप्रयोगशालाः समाविष्टाः सन्ति, येन प्रभावीरूपेण शैक्षणिकविनिमयस्य प्रसारस्य च प्रचारः कृतः यदि भवतां कृते उत्तमं कार्यं अस्ति यत् भवान् साझां कर्तुम् इच्छति तर्हि कृपया निःशङ्कं योगदानं दातुं वा अस्माभिः सह सम्पर्कं कृत्वा प्रतिवेदनार्थम्। प्रस्तुति ईमेल: [email protected];

चीनस्य विज्ञानप्रौद्योगिकीविश्वविद्यालयस्य संज्ञानात्मकबुद्धिविज्ञानस्य राष्ट्रियमुख्यप्रयोगशालायाः, हुवावे-संस्थायाः नूहस्य जहाजप्रयोगशालायाः च आईईईई-सहकारिणः चेन् एन्होङ्गस्य दलेन एतत् कार्यं सम्पन्नम् प्रोफेसर चेन् एन्होङ्ग् इत्यस्य दलं डाटा माइनिंग् तथा मशीन लर्निङ्ग् इत्येतयोः क्षेत्रेषु गभीरं संलग्नम् अस्ति, तथा च शीर्षपत्रेषु सम्मेलनेषु च अनेके पत्राणि प्रकाशितानि सन्ति नूहस्य जहाजप्रयोगशाला कृत्रिमबुद्धेः विषये मूलभूतसंशोधनं कुर्वन्ती हुवावे इत्यस्य प्रयोगशाला अस्ति, सा सैद्धान्तिकसंशोधनस्य अनुप्रयोगनवाचारस्य च समानरूपेण बलस्य अवधारणायाः पालनम् करोति, तथा च कृत्रिमबुद्धेः क्षेत्रे प्रौद्योगिकीनवाचारं विकासं च प्रवर्धयितुं प्रतिबद्धा अस्ति

बृहत्भाषाप्रतिमानानाम् (LLMs) सफलतायाः आधारशिला दत्तांशः अस्ति, परन्तु सर्वे दत्तांशाः आदर्शशिक्षणाय लाभप्रदाः न भवन्ति । सहजतया उच्चगुणवत्तायुक्तानां नमूनानां एलएलएम-शिक्षणे अधिकं कार्यक्षमता अपेक्षिता अस्ति । अतः विद्यमानाः पद्धतयः प्रायः गुणवत्ता-आधारितदत्तांशचयनं प्रति केन्द्रीभवन्ति । परन्तु एतेषु अधिकांशः पद्धतयः नमूनानां मध्ये जटिलसंयोजनप्रभावानाम् अवहेलनां कृत्वा स्वतन्त्रतया भिन्नदत्तांशनमूनानां मूल्याङ्कनं कुर्वन्ति । यथा चित्रे १ दर्शितं यत् प्रत्येकस्य नमूनायाः सम्यक् गुणवत्ता अस्ति चेदपि तेषां परस्परं सूचना-अतिरिक्ततायाः अथवा असङ्गतेः कारणात् तेषां संयोजनं उप-अनुकूलं भवितुम् अर्हति यद्यपि गुणवत्ता-आधारित-उपसमूहः त्रयः अपि गुणवत्ता-नमूनानि सन्ति तथापि तेषां संकेतितं ज्ञानं वस्तुतः अनावश्यकं परस्परविरोधी च भवति । तस्य विपरीतम्, अन्यः आँकडा उपसमूहः यस्मिन् अनेकाः तुल्यकालिकरूपेण न्यूनगुणाः परन्तु विविधाः नमूनाः सन्ति, सः एलएलएम-शिक्षणे अधिकानि सूचनानि प्रसारयितुं शक्नोति । अतः गुणवत्ता-आधारित-दत्तांशचयनं एलएलएम-ज्ञानस्य अधिकतमीकरणस्य लक्ष्येण सह पूर्णतया सङ्गतं नास्ति ।

अस्य लेखस्य उद्देश्यं एलएलएम-प्रदर्शनस्य आँकडाचयनस्य च आन्तरिकसम्बन्धं प्रकाशयितुं वर्तते । एलएलएम सूचनासंपीडनस्य प्रकृत्या प्रेरिताः वयं एन्ट्रोपी-नियमस्य आविष्कारं कृतवन्तः, यः एलएलएम-प्रदर्शनं आँकडा-संपीडन-दरेन सह सम्बध्दयति तथा च मॉडल-प्रशिक्षणस्य पूर्वपदानां हानिम्, यत् क्रमशः आँकडा-समूहस्य सूचना-अतिरिक्ततायाः डिग्रीम्, निहित-प्रभावं च प्रतिबिम्बयति of LLM on the data set ज्ञानस्य निपुणतायाः डिग्री। सैद्धान्तिकव्युत्पन्नतायाः अनुभवजन्यमूल्यांकनस्य च माध्यमेन वयं पश्यामः यत् आदर्शप्रदर्शनं प्रशिक्षणदत्तांशस्य संपीडनानुपातेन सह विपरीतरूपेण सम्बद्धं भवति, यस्य परिणामः सामान्यतया प्रशिक्षणहानिः न्यूना भवति एन्ट्रोपी-नियमस्य निष्कर्षाणाम् आधारेण वयं एलएलएम-प्रशिक्षणार्थं अतीव कुशलं सामान्यं च आँकडाचयनपद्धतिं प्रस्तावयामः, यस्य नाम ZIP इति, यस्य उद्देश्यं न्यूनसंपीडनदरेण सह आँकडा उपसमूहान् प्राथमिकताम् अददात् ZIP लोभेन बहुचरणयोः विविधदत्तांशस्य चयनं करोति, अन्ततः उत्तमविविधतायाः सह आँकडा उपसमूहं प्राप्नोति ।

दलम् : चीनस्य विज्ञानप्रौद्योगिकीविश्वविद्यालये संज्ञानात्मकबुद्धेः राष्ट्रियमुख्यप्रयोगशालायां चेन् एन्होङ्गस्य दलं, हुवावे इत्यस्य नूहस्य जहाजप्रयोगशालायां

पेपर लिङ्कः https://arxiv.org/pdf/2407.06645

कोडलिङ्कः https://github.com/USTC-StarTeam/ZIP

चित्रम् १

एन्ट्रोपी नियम

वयं दत्तांशसंपीडनस्य एलएलएम-प्रदर्शनस्य च सम्बन्धस्य सैद्धान्तिकं विश्लेषणं कुर्मः । सहजतया प्रशिक्षणदत्तांशस्य सम्यक्त्वं विविधता च अन्तिमप्रतिरूपस्य कार्यप्रदर्शनं प्रभावितं करिष्यति। तस्मिन् एव काले एलएलएम-प्रदर्शनं उप-अनुकूलं भवितुम् अर्हति यदि दत्तांशस्य गम्भीराः निहिताः विग्रहाः सन्ति अथवा यदि मॉडलस्य दत्तांशे संकेतितसूचनायाः दुर्बलग्रहणं भवति एतेषां धारणानां आधारेण वयं LLM इत्यस्य कार्यक्षमतां Z इति सूचयामः, यस्य प्रभावः अपेक्षितः अस्ति:

आँकडा संपीडन अनुपात R: सहजतया, न्यूनसंपीडन अनुपातयुक्तः दत्तांशसमूहः अधिकसूचनाघनत्वं सूचयति ।

प्रशिक्षणहानिः L: सूचयति यत् दत्तांशः आदर्शस्य कृते स्मर्तुं कठिनः अस्ति वा। समानाधारप्रतिरूपस्य अन्तर्गतं उच्चप्रशिक्षणहानिः प्रायः दत्तांशसमूहे कोलाहलस्य अथवा असङ्गतसूचनायाः उपस्थितेः कारणेन भवति ।

दत्तांशसङ्गतिः C: दत्तांशसङ्गतिः पूर्वस्थितिं दृष्ट्वा अग्रिमस्य टोकनस्य संभाव्यतायाः एन्ट्रोपीद्वारा प्रतिबिम्बिता भवति । उच्चतरदत्तांशसङ्गतिः प्रायः प्रशिक्षणहानिः न्यूना भवति ।

औसतदत्तांशगुणवत्ता प्रश्नः दत्तांशस्य औसतनमूनास्तरस्य गुणवत्तां प्रतिबिम्बयति, यस्य मापनं विविधवस्तुनिष्ठा व्यक्तिपरकपक्षयोः माध्यमेन कर्तुं शक्यते।

एन्ट्रोपी-नियमस्य आधारेण वयं द्वौ अनुमानौ प्रस्तावयामः-

यदि C नित्यरूपेण व्यवह्रियते तर्हि प्रशिक्षणहानिः संपीडनानुपातेन प्रत्यक्षतया प्रभाविता भवति । अतः मॉडलस्य प्रदर्शनं संपीडन-अनुपातेन नियन्त्रितं भवति : यदि आँकडा-संपीडन-अनुपातः R अधिकः भवति तर्हि Z सामान्यतया दुर्बलतरः भवति, यत् अस्माकं प्रयोगेषु सत्यापितं भविष्यति

तस्मिन् एव संपीडन-अनुपाते अधिक-प्रशिक्षण-हानिः न्यून-दत्तांश-सङ्गतिः इति अर्थः । अतः आदर्शेन ज्ञातं प्रभावी ज्ञानं अधिकं सीमितं भवितुम् अर्हति । एतस्य उपयोगेन समानसंपीडनानुपातेन नमूनागुणवत्तायाः च भिन्नदत्तांशयोः एलएलएम-प्रदर्शनस्य पूर्वानुमानं कर्तुं शक्यते । अस्य तर्कस्य प्रयोगं व्यवहारे पश्चात् दर्शयिष्यामः।

ZIP: अत्यन्तं हल्कं दत्तांशचयन-अल्गोरिदम्

एन्ट्रोपी-कानूनस्य मार्गदर्शनेन अस्माभिः ZIP इति दत्तांशचयनपद्धतिः प्रस्ताविता, या दत्तांशसंपीडनदरेण आँकडानमूनानां चयनं करोति, यस्य उद्देश्यं सीमितप्रशिक्षणदत्तांशबजटस्य अन्तर्गतं प्रभावीसूचनायाः अधिकतमं परिमाणं भवति दक्षताकारणात् वयं अपेक्षाकृतं न्यूनसंपीडनदरेण सह अनुमानितसमाधानं कुशलतया प्राप्तुं पुनरावर्तनीयं बहुचरणीयं लोभीप्रतिमानं स्वीकुर्मः। प्रत्येकस्मिन् पुनरावृत्तौ वयं प्रथमं उच्चसूचनाघनत्वयुक्तानि नमूनानि अन्वेष्टुं न्यूनसंपीडनानुपातयुक्तानां अभ्यर्थीनमूनानां पूलस्य चयनार्थं वैश्विकचयनचरणस्य उपयोगं कुर्मः ततः वयं लघु-नमूनानां समुच्चयस्य चयनार्थं स्थूल-कणिकायुक्तं स्थानीयचयन-चरणं नियोजयामः यस्य चयनित-नमूनानां सह न्यूनतमा अतिरेकता भवति । अन्ते वयं योजनीयानां नमूनानां मध्ये समानतां न्यूनीकर्तुं सूक्ष्मकणिकायुक्तस्य स्थानीयचयनचरणस्य उपयोगं कुर्मः । उपर्युक्ता प्रक्रिया यावत् पर्याप्तं दत्तांशं न प्राप्यते तावत् निरन्तरं भवति विशिष्टः अल्गोरिदम् निम्नलिखितम् अस्ति ।

प्रयोगात्मकाः परिणामाः

1. भिन्न-भिन्न-एलएलएम-कृते तथा च भिन्न-भिन्न-एलएलएम-संरेखण-चरणयोः ZIP-चयन-एल्गोरिदमस्य प्रभावशीलता

भिन्न-भिन्न-SFT-आँकडाचयन-एल्गोरिदम्-तुलनायां, ZIP-चयन-आँकडानां आधारेण प्रशिक्षितः मॉडलः कार्यप्रदर्शने लाभं दर्शयति, दक्षतायां अपि श्रेष्ठः अस्ति विशिष्टपरिणामानां कृते अधोलिखितं सारणीं पश्यन्तु:

ZIP इत्यस्य मॉडल-स्वतन्त्रस्य सामग्री-असंवेदनशीलस्य च लक्षणस्य धन्यवादेन प्राधान्यसंरेखणपदे आँकडाचयनार्थं अपि प्रयोक्तुं शक्यते । जिप् द्वारा चयनितदत्तांशः अपि महत् लाभं दर्शयति । विशिष्टपरिणामानां कृते अधोलिखितं सारणीं पश्यन्तु:

2. एन्ट्रोपी नियमस्य प्रयोगात्मकसत्यापनम्

SFT आँकडाचयनप्रयोगस्य आधारेण वयं प्रशिक्षणस्य पूर्वपदेषु मॉडलप्रभावस्य, आँकडासंपीडनदरस्य, मॉडलस्य हानिस्य च आधारेण बहुविधसम्बन्धवक्रान् समायोजयामः परिणामाः चित्रे २ चित्रे ३ च दर्शिताः, यस्मात् वयं त्रयाणां कारकानाम् निकटसहसम्बन्धं अवलोकयितुं शक्नुमः । सर्वप्रथमं, न्यूनसंपीडनदरदत्तांशैः सामान्यतया उत्तमं मॉडलपरिणामं भवति यतोहि एलएलएमस्य शिक्षणप्रक्रिया सूचनासंपीडनेन सह अत्यन्तं सम्बद्धा अस्ति, अतः न्यूनसंपीडनदरयुक्तदत्तांशस्य अर्थः अधिकमात्रायां भवति ज्ञानं तथा च संपीडकस्य कृते अधिकं मूल्यवान्। तत्सह, एतत् अवलोकयितुं शक्यते यत् न्यूनसंपीडन-अनुपाताः प्रायः उच्चतर-प्रशिक्षण-हानिभिः सह भवन्ति यतो हि संपीडनं कर्तुं कठिनं दत्तांशं अधिकं ज्ञानं वहति, येन एलएलएम-कृते तस्मिन् निहितं ज्ञानं अवशोषयितुं अधिकानि आव्हानानि भवन्ति

चित्र 2 मिस्त्रल-7B

चित्रम् ३ लामा-३-८ख

3.एन्ट्रोपी नियमस्य व्यावहारिकः अनुप्रयोगः

वयं वास्तविकपरिदृश्येषु LLM प्रशिक्षणदत्तांशस्य वृद्धिशील-अद्यतनं मार्गदर्शनार्थं एन्ट्रोपी-नियमस्य अनुप्रयोगं प्रदामः । अस्मिन् कार्यपरिदृश्ये प्रशिक्षणदत्तांशस्य परिमाणं तुल्यकालिकरूपेण स्थिरं भवति, दत्तांशस्य अल्पभागः एव परिवर्तितः भवति ।परिणामाः चित्रे ४ दर्शिताः सन्ति, यत्र...

इदं 5 आँकडासंस्करणं भवति यत् क्रमेण वर्धमानं अद्यतनं भवति गोपनीयतायाः आवश्यकतायाः कारणात् केवलं भिन्नसंपीडनदराणां अन्तर्गतं मॉडलप्रभावानाम् सापेक्षिकसम्बन्धः एव प्रदत्तः भवति । एन्ट्रोपी-नियम-अनुमानानाम् अनुसारं, प्रत्येकस्य वृद्धिशील-अद्यतनस्य अनन्तरं दत्तांश-गुणवत्तायां महती न्यूनता न भवति इति कल्पयित्वा, अपेक्षा कर्तुं शक्यते यत् यथा यथा आँकडा-संपीडन-दरः न्यूनः भवति तथा तथा मॉडल-प्रदर्शने सुधारः भविष्यतिइदं पूर्वानुमानं चित्रे विद्यमानेन दत्तांशसंस्करणेन सह सङ्गतम् अस्ति

परिणामाः सुसंगताः सन्ति।तथापि दत्तांशसंस्करणम्

हानिः तथा च आँकडासंपीडनं असामान्यवृद्धिं प्रदर्शयति, यत् प्रशिक्षणदत्तांशेषु न्यूनीकृतसङ्गठनस्य कारणेन मॉडलप्रदर्शने सम्भाव्यक्षयः सूचयति तदनन्तरं प्रतिरूपप्रदर्शनमूल्यांकनेन एतस्य भविष्यवाणीयाः अधिकं पुष्टिः अभवत् । अतः एन्ट्रोपी-नियमस्य उपयोगः एलएलएम-प्रशिक्षणस्य कृते मार्गदर्शकसिद्धान्तरूपेण कर्तुं शक्यते यत् अभिसरणपर्यन्तं सम्पूर्णदत्तांशसमूहे मॉडलस्य प्रशिक्षणं विना एलएलएम-प्रशिक्षणस्य विफलतायाः सम्भाव्यजोखिमस्य पूर्वानुमानं कर्तुं शक्यते एलएलएम-प्रशिक्षणस्य उच्चव्ययस्य दृष्ट्या एतत् विशेषतया महत्त्वपूर्णम् अस्ति ।

चित्रम् ४

समाचारं

आमुख

मम सम्पर्कसूचना