समाचारं

शोभनम्‌! Phone, iPad, MacBook इत्यादीनि पुरातनयन्त्राणि विषमसमूहं निर्मान्ति, ते च Llama 3 चालयितुं शक्नुवन्ति

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

यदि भवतः समीपे केचन अतिरिक्ताः उपकरणाः सन्ति तर्हि भवन्तः तस्य प्रयोगं कर्तुम् इच्छन्ति।

अस्मिन् समये भवतः हस्ते विद्यमानं हार्डवेयर-उपकरणं एआइ-क्षेत्रे अपि स्वस्य मांसपेशिनां फ्लेक्स् कर्तुं शक्नोति ।

iPhone, iPad, Macbook इत्येतयोः संयोजनेन भवान् "विषमसमूहानुमानसमाधानं" संयोजयितुं शक्नोति ततः Llama3 मॉडलं सुचारुतया चालयितुं शक्नोति ।



ज्ञातव्यं यत् एषः विषमः समूहः विण्डोज-प्रणाली, लिनक्स, अथवा iOS-प्रणाली भवितुम् अर्हति, एण्ड्रॉयड्-प्रणाली च शीघ्रमेव आगमिष्यति ।

विषमसमूहः प्रचलति।



परियोजनालेखकस्य @evilsocket इत्यस्य मते अस्मिन् विषमसमूहे iPhone 15 Pro Max, iPad Pro, MacBook Pro (M1 Max), NVIDIA GeForce 3080, 2x NVIDIA Titan X Pascal च सन्ति सर्वः कोडः GitHub इत्यत्र अपलोड् कृतः अस्ति ।

एतत् दृष्ट्वा नेटिजनाः व्यक्तवन्तः यत् अयं वृद्धः खलु सरलः नास्ति।



परन्तु केचन नेटिजनाः ऊर्जायाः उपभोगस्य चिन्ताम् आरभन्ते वेगं यथापि भवतु, ते विद्युत्बिलं दातुं न शक्नुवन्ति। दत्तांशं अग्रे पश्चात् च चालनेन अत्यधिकं हानिः भवति ।





परियोजना परिचय

उपर्युक्तकार्यस्य कार्यान्वयनम् Cake इति Rust framework इत्यस्मात् अविभाज्यम् अस्ति । केकः बृहत् मॉडल् (यथा Llama3) वितरितं अनुमानं सम्पूर्णं कर्तुं शक्नोति तथा च उपभोक्तृ-श्रेणी-हार्डवेयरं विषम-समूहेषु संयोजयितुं डिजाइनं कृतम् अस्ति, यथा: iOS, Android, macOS, Linux तथा Windows, यथा एआइ अधिकं सुलभं भवति।



परियोजनायाः पताः https://github.com/evilsocket/cake इति

केकस्य मुख्यविचारः अस्ति यत् बहुषु उपकरणेषु ट्रांसफार्मर-खण्डान् विभाजयितुं शक्यते यत् सामान्यतया एकस्य उपकरणस्य GPU-स्मृतौ न उपयुज्यन्ते इति मॉडल्-मध्ये अनुमानं चालयितुं शक्नुवन्ति एकस्मिन् एव श्रमिकसूत्रे क्रमशः ट्रांसफार्मरखण्डेषु अनुमानं बैचरूपेण क्रियते यत् आँकडास्थापनेन उत्पद्यमानं विलम्बं न्यूनीकर्तुं शक्यते ।

वर्तमानकाले केकद्वारा समर्थिताः प्रणाल्याः उपकरणानि च निम्नलिखितरूपेण सन्ति ।



संकलनम्

Rust संस्थापनानन्तरं निम्नलिखितसङ्केतं चालयन्तु ।

माल निर्माण --विमोचन

यदि उपयोक्ता अनुप्रयोगे iOS बन्धनानि जनयितुम् इच्छति तर्हि ते निम्नलिखितम् कर्तुं शक्नुवन्ति ।

make ios

उपयुञ्जताम्‌

वर्कर नोड् चालयन्तु : १.

cake-cli --model /path/to/Meta-Llama-3-8B # model path, श्रमिकाणां कृते मॉडल आकारस्य अनुकूलनं कथं करणीयम् इति विषये अधः पठन्तु

--mode worker # कार्यकर्तारूपेण चालयति

--name worker0 # टोपोलॉजी सञ्चिकायां कार्यकर्तानाम

--टोपोलॉजी टोपोलॉजी.yml # टोपोलॉजी

--पता 0.0.0.0:10128 # पता बन्धन

मास्टर नोड् चालयन्तु : १.

केक-क्लि --प्रतिरूप /मार्ग/मेटा-लामा-३-८B

--टोपोलॉजी टोपोलॉजी.yml

तेषु topology.yml इत्यनेन निर्धारितं भवति यत् केषां श्रमिकाणां कृते केषां स्तरानाम् सेवा भवति:

लिनक्स_सर्वर_१: १.

मेजबानः 'linux_server.host:10128' इति।

description: 'एनवीडिया टाइटन एक्स पास्कल (12GB)'

स्तराः : १.

- 'प्रतिरूप.स्तराः.०-५'.

लिनक्स_सर्वर_2: 1.1.

मेजबानः 'linux_server2.host:10128' इति।

description: 'एनवीडिया जीफोर्स ३०८० (१०जीबी)' इति ।

स्तराः : १.

- 'प्रतिरूप.स्तराः।६-१६' इति ।

iphone: १.

मेजबानः 'iphone.host:10128' इति।

description: 'आइफोन १५ प्रो मैक्स'।

स्तराः : १.

- 'प्रतिरूप.स्तराः.१७' इति ।

ipad: 1।

मेजबानः 'ipad.host:10128' इति।

description: 'आईपैड'।

स्तराः : १.

- 'प्रतिरूप.स्तराः.१८-१९' इति ।

macbook: 1.1.

मेजबानः 'macbook.host:10128' इति।

description: 'M1 Max' इति।

स्तराः : १.

- 'प्रतिरूप.स्तराः.२०-३१'.

स्मृति-डिस्क-स्थान-अनुकूलन-समस्यानां विषये उपयोक्तारः श्रमिकान् केवलं मॉडल्-मध्ये वास्तविक-आवश्यक-दत्तांशं प्रदातुम् इच्छन्ति, न तु सम्पूर्ण-पुटस्य, अस्मिन् सन्दर्भे केक-विभाजन-मॉडेल्-इत्यस्य उपयोगः कर्तुं शक्यते यथा, llama3 safetensors इत्यस्य लघुतरं संस्करणं जनयितुं भवान् निम्नलिखितसङ्केतं उपयोक्तुं शक्नोति ।

cake-split-model --model-path path/to/Meta-Llama-3-8B # विभाजनार्थं स्रोतप्रतिरूपम्

--topology path/to/topology.yml # टोपोलॉजी सञ्चिका

--निर्गम आउटपुट-पुट-नाम

सन्दर्भलिङ्कः https://x.com/tuturetom/status/1812654489972973643