समाचारं

Nvidia इत्यस्य रहस्यपूर्णं video base model “Cosmos” इत्येतत् उजागरितम् अस्ति, तथा च दत्तांशः सर्वः अपहृतः अस्ति

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

अस्य विडियो मॉडलस्य कृते एनवीडिया प्रतिदिनं ८० वर्षाणां विडियो डाटा इत्यस्य समकक्षं उन्मत्तरूपेण क्रॉलं कुर्वन् अस्ति ।

अद्य एनवीडिया इत्यस्य विडियो मॉडल् निर्माणं त्यक्तुं निर्णयस्य विषये एकः वार्ता Reddit इत्यत्र विस्फोटितवान् ।

वार्तानां स्रोतः विदेशीयमाध्यमात् आगच्छति 404 Media Slack chat (Nvidia’s internal chat platform), emails and documents इत्यस्य अनुसारं Nvidia Youtube इत्यस्मात् अन्येभ्यः अनेकेभ्यः स्रोतेभ्यः च विडियो हृत्वा स्वस्य AI उत्पादानाम् प्रशिक्षणदत्तांशं संग्रहयति



404 Media द्वारा समीक्षितानि Nvidia इत्यत्र आन्तरिकवार्तालापानि दर्शयन्ति यत् यदा परियोजनायां सम्बद्धाः कर्मचारिणः "व्यावसायिकरूपेण निषिद्धानां शोधदत्तांशसमूहानां" "YouTube-वीडियो" च उपयोगात् उत्पद्यमानानां सम्भाव्यकानूनीविषयाणां विषये चिन्ताम् उत्थापयन्ति स्म, तदा प्रबन्धकाः तान् अवदन् यत् तेषां उच्चतमस्तरात् अनुमोदनं प्राप्तम् अस्ति the company , यस्य उपयोगः कर्तुं शक्यते।

एनवीडिया इत्यस्य एकः अनामिकः पूर्वकर्मचारिणः अवदत् यत् ओम्निवर्स् 3D विश्वजनरेटर्, स्वयमेव चालयितुं कारप्रणाल्याः, "डिजिटल मानवीय" उत्पादानाम् एआइ मॉडल् प्रशिक्षितुं नेटफ्लिक्स्, यूट्यूब इत्यादिस्रोताभ्यः विडियो स्क्रैप् कर्तुं कर्मचारिभ्यः कथितम्।

आन्तरिकरूपेण कोस्मोस् इति नामकरणं कृतस्य परियोजनायाः (किन्तु कम्पनीयाः विद्यमानस्य कोस्मोस् गहनशिक्षणस्य उत्पादस्य भिन्ना) अद्यापि जनसामान्यं प्रति न प्रकाशितम् । परियोजनायाः नेतृत्वेन कर्मचारिभ्यः प्रेषितस्य ईमेलस्य अनुसारं, कोस्मोस् इत्यस्य लक्ष्यं अत्याधुनिकं विडियो आधारभूतसंरचनाप्रतिरूपं निर्मातुं वर्तते यत् “प्रकाशपरिवहनं, भौतिकशास्त्रं, बुद्धिमान् अनुकरणं च एकस्मिन् स्थाने समाहितं करोति, येन महत्त्वपूर्णाः विविधाः अधःप्रवाहपक्षाः अनलॉक् भवन्ति Nvidia इति अनुप्रयोगः” इति ।

प्रशिक्षणस्य विडियो संग्रहणार्थं NVIDIA कर्मचारिणः "yt-dlp" इति मुक्तस्रोतस्य YouTube विडियो डाउनलोडरस्य उपयोगं कृतवन्तः । ते नेटफ्लिक्स् इत्यादिभ्यः विविधस्रोतेभ्यः पूर्णविडियो डाउनलोड् कर्तुं प्रयतन्ते परन्तु मुख्यतया यूट्यूब-वीडियोषु केन्द्रीभवन्ति । 404 Media इत्यनेन समीक्षितैः ईमेलैः ज्ञायते यत् परियोजनाप्रबन्धकः प्रतिदिनं 80 वर्षाणां मूल्यस्य विडियो डाउनलोड् कर्तुं Amazon Web Services इत्यस्मिन् 20 तः 30 वर्चुअल् मशीन् इत्यस्य उपयोगं कर्तुं चयनं कृतवान्

"वयं v1 डाटा पाइपलाइनं सम्पन्नं कुर्मः तथा च आवश्यकं कम्प्यूटिंग् संसाधनं सुरक्षितं कुर्मः यत् एकं विडियो डाटा फैक्ट्री निर्मातुं शक्नुमः यत् दैनिकं Training data उत्पन्नं कर्तुं शक्नोति यत् जीवनपर्यन्तं मानवीयदृश्यानुभवस्य समकक्षं भवति।”.

यदा एनवीडिया इत्यनेन स्वस्य मॉडल् कृते प्रशिक्षणदत्तांशरूपेण यूट्यूब-वीडियो-उपयोगस्य विषये पृष्टः तदा गूगल-प्रवक्ता ४०४ मीडिया-सञ्चारमाध्यमेन अवदत् यत् कम्पनीयाः "पूर्वस्थितिः वैधः एव अस्ति" इति पूर्वं यूट्यूबस्य मुख्यकार्यकारी नीलमोहनः अवदत् यत् यदि ओपनएइ इत्यनेन स्वस्य एआइ-वीडियो-जनरेटर् सोरा-इत्यस्य उन्नयनार्थं यूट्यूब-वीडियो-प्रयोगः क्रियते तर्हि यूट्यूबस्य उपयोगनियमानां "स्पष्टं उल्लङ्घनम्" भविष्यति

तथैव नेटफ्लिक्स्-प्रवक्ता ४०४ मीडिया-सञ्चारमाध्यमेन अवदत् यत् कम्पनीयाः सामग्री-अधिग्रहणार्थं एनवीडिया-सङ्गठनेन सह सम्झौता नास्ति, तथा च मञ्चस्य सेवा-नियमाः सामग्री-स्क्रेप्-करणस्य अनुमतिं न ददति इति

तथापि एनवीडिया इत्यस्य चिन्ता न दृश्यते। परियोजनायां सम्बद्धैः कर्मचारिभिः उत्थापिताः कानूनीचिन्ताः प्रायः परियोजनाप्रबन्धकैः निरस्ताः भवन्ति स्म ये अवदन् यत् अनुमतिं विना विडियो स्क्रैप् कर्तुं निर्णयः "कार्यकारीनिर्णयः" अस्ति यस्य विषये तेषां चिन्तायाः आवश्यकता नास्ति, तथा च प्रतिलिपिधर्मस्य न्याय्यः नैतिकः च उपयोगः किं भवति इति सामग्री तथा च दत्तांशसमूहस्य शैक्षणिकस्य, अव्यावसायिकस्य उपयोगस्य विषयः "बकाया कानूनी विषयाः" इति मन्यन्ते येषां समाधानं ते भविष्ये करिष्यन्ति।

NVIDIA video model परियोजनायाः आरम्भः अन्तः च

अन्येषां प्रौद्योगिकीदिग्गजानां सदृशं एनविडिया शैक्षणिकपरिणामानां प्रकाशनार्थं शैक्षणिकसंशोधनप्रतिभां नियोजयति, परन्तु 404 मीडिया इत्यनेन प्राप्तानां आन्तरिक-ईमेल-पत्राणां मध्ये द्रष्टुं शक्यते यत् कोस्मोस्-संस्थायाः उपयोगः स्पष्टतया व्यावसायिक-प्रयोजनार्थं भविष्यति

अस्मिन् वर्षे मार्चमासे एनवीडिया-संशोधकः स्लैक् इत्यत्र पोस्ट् कृत्वा सुझावम् अयच्छत् यत् ओपनएआइ सोरा इत्यस्य प्रशिक्षणार्थं "अवतार" अथवा "लॉर्ड आफ् द रिंग्स्" इत्यादीनां हॉलीवुड्-चलच्चित्रस्य उपयोगः अधिकं प्रभावी भवितुम् अर्हति इति

तदनन्तरं तस्य प्रस्तावः कम्पनीयाः अन्तः एव स्वीकृतः, परन्तु सः अपि अवदत् यत् एआइ प्रतिलिपिधर्मस्य उल्लङ्घनस्य सम्भावनायाः विषये हॉलीवुड् विशेषतया संवेदनशीलः अस्ति २०२३ तमस्य वर्षस्य जुलैमासे हॉलीवुड्-नगरस्य १६०,००० सदस्यैः सह त्रयाणां प्रमुखानां श्रमिकसङ्घानाम् एकः SAG-AFTRA इत्यनेन हड़तालस्य घोषणा कृता, यत्र ChatGPT, Stable Diffusion इत्यादीनां जननात्मक-AI-उत्पादानाम् लक्ष्यं कृत्वा अस्य पूर्वं Writers Guild of America इति संस्था हड़तालं कृतवान् आसीत् ७० दिवसाभ्यः अधिकं यावत् । स्थिरप्रसारस्य स्थितिः अस्ति यदि भवान् तत्सम्बद्धं प्रॉम्प्ट् शब्दं न प्रविशति तथा च "Animation style plumber" इत्यादिं अस्पष्टं वर्णनं न प्रविशति तथापि Stable Diffusion प्रत्यक्षतया Mario इत्यस्य क्लासिकं प्रतिबिम्बं जनयिष्यति

अस्य पदस्य अन्तर्गतं "लिउ" (अर्थात् एनवीडिया इत्यस्य अनुसन्धानस्य उपाध्यक्षः मिंग-यु लिउ (लिउ मिंग्यु)) नामकः कर्मचारी उत्तरं दत्तवान् यत् "यदि पत्रं सार्वजनिकरूपेण प्रकाशितं न भवति तर्हि उपर्युक्तानि नकारात्मकानि विषयाणि न जनयिष्यन्ति। अस्माभिः कर्तव्यानि ।" प्रथमं प्रयोगाय Downloadable videos इत्यस्य उपयोगं कुर्वन्तु।"



तदनन्तरं अन्यः NVIDIA शोधकर्तारः इन्ट्रानेट् इत्यत्र एकं पोस्ट् स्थापितवान् सः एकं सूचीं प्राप्तवान् यत् प्रथमं प्रशिक्षणविडियो मॉडल् कृते डाउनलोड् कर्तव्यं तथापि NVIDIA द्वारा उपयुज्यमानस्य HD-VILA-100M डाटा सेट् मध्ये प्रायः 2.3 मिलियन मूल सञ्चिकानां अभावः आसीत् अस्मिन् नित्यं विस्तारमाणे सूचीयां केषाञ्चन सुप्रसिद्धानां यूट्यूबर्-जनानाम् मौलिक-वीडियो अपि सन्ति, यथा मार्क्स् ब्राउन्ली (MKBHD), उत्तर-अमेरिकायां "Hello everyone, I am Classmate He" इत्यादिनां प्रतिष्ठां विद्यमानः डिजिटल-समीक्षा-ब्लॉगरः

प्रतिलिपिधर्मसंरक्षणस्य कारणात् सामान्यविडियोदत्तांशसमूहेषु प्रायः URLलिङ्काः अथवा YouTube IDs भवन्ति एकदा लेखकः मूलविडियोविलोपनं करोति तदा एताः सामग्रीः दत्तांशसमूहे न समाविष्टाः भविष्यन्ति यावत् विडियोलेखकः सामग्रीयाः धारणाय उपयोगाय च स्पष्टतया सहमतः न भवति .

यद्यपि Microsoft HD-VILA-100M आँकडा-समूहस्य उपयोग-वक्तव्ये सर्वान् व्यावसायिक-उपयोगान् स्पष्टतया निषिद्धं करोति तथापि यः Nvidia-कर्मचारिणः सन्देशं प्रकाशितवान् सः शीघ्रमेव सूचीसम्बद्धं YouTube-लिङ्कं स्थापयित्वा स्वसहकारिभिः सह साझां कृतवान् . YouTube इत्यस्य क्रॉलरविरोधी तन्त्रं परिहर्तुं IP परिवर्तनार्थं AWS वर्चुअल् मशीन् इत्यस्य उपयोगस्य समाधानस्य चर्चां कृतवन्तः।

तदतिरिक्तं एनवीडिया-कर्मचारिणः गूगल-द्वारा विमोचितस्य बृहत्-परिमाणस्य विडियो-अवगमन-दत्तांशसमूहस्य YouTube-8M-इत्यत्र अपि सम्पर्कं कृतवन्तः । माइक्रोसॉफ्टस्य डाटा सेट् स्वयमेव पूरकं कर्तुं स्थाने ते यूट्यूबस्य गूगलस्य च सह "सौदां" कृतवन्तः, यूट्यूबस्य वर्तमानस्य मूलकम्पनी एनवीडिया प्रति 10,000 विडियो 0.00625 अमेरिकी-डॉलर् (प्रायः ४ सेण्ट्) मूल्येन ८०० विडियो क्रीतवन् गूगल क्लाउड् मार्गेण। प्रतिलिपिधर्मविक्रयस्य विषयः यथापि भवतु, गूगलः चिन्तयति यत् एतेषां विडियोनां विज्ञापनशुल्कं पुनः अर्जितवान्, परन्तु एनवीडिया इत्यस्य मेघबैण्डविड्थस्य पूर्वमेव काश्चन सीमाः सन्ति गूगलक्लाउड् इत्यत्र डाउनलोड् करणेन अधिकं स्थिरं पूर्वानुमानीयं च संयोजनं प्राप्तुं शक्यते। अतः भवन्तः यथापि पश्यन्ति तथापि एषः "सौदाः" एनविडियायाः कृते लाभप्रदः इति भासते।

किं अधिकं आश्चर्यं यदा एन्विडिया-कर्मचारिणः अन्तर्जाल-माध्यमेन पृष्टवान् यत् “किं अस्माकं कृते एतादृशानि यूट्यूब-वीडियो-अवलोकनं युक्तम्?”

"एषः उच्चस्तरीयः निर्णयः अस्ति। सर्वेषां दत्तांशस्य उपयोगाय अस्माकं पूर्णानुमोदना अस्ति।"

अस्य निर्णयस्य कृते अनुमतदत्तांशः नेटफ्लिक्स् इत्यत्र विडियोनिर्माणानि अपि समाविष्टानि सन्ति । नेटफ्लिक्स् इत्यस्य आँकडासु उच्चगुणवत्तायुक्ताः मुखदत्तांशाः बहु सन्ति तस्य अनुमोदनानन्तरं कश्चन अन्येषु बृहत्कम्पनीषु “बृहत्दत्तांशसमूहानां निर्माणस्य” अनुभवं विद्यमानानाम् सहकारिणां कृते पृष्टवान्

तस्मिन् एव काले कोस्मोस्-दलेन प्रशिक्षणदत्तांशेषु क्रीडायाः दृश्यानि कथं प्रभावीरूपेण योजयितुं शक्यन्ते इति विषये अपि विचारः कृतः । एनवीडिया वरिष्ठः शोधवैज्ञानिकः जिम फैन् अपि वास्तविकसमये क्रीडायाः दृश्यानि गृह्णन् "नियामक" बाधानां सामनाम् अकरोत् ।

जिम फैन् इत्यनेन पोस्ट कृतम्:

अद्यतनम् : अहं GeForce Now (GFN) इत्यत्र जनानां सह मिलित्वा तेषां सह योजनासु कार्यं कुर्वन् अस्मि। वयं GFN तथा सम्बद्धैः अभियांत्रिकीदलैः सह निकटतया कार्यं करिष्यामः यत् वास्तविकसमयस्य क्रीडादत्तांशं गृहीतुं, पाइपलाइनस्य स्केलस्य विस्तारं कर्तुं, प्रशिक्षणार्थं आँकडानां संसाधनार्थं च पद्धतीः विकसितव्याः। उच्चगुणवत्तायुक्ताः गेमप्ले-वीडियो "अस्माकं सोरा" इत्यस्य अतीव उपयोगी परिवर्तनं भविष्यन्ति... यतः लाइव गेमप्ले-वीडियो-क्रियाः च गृहीतुं उपकरणं अद्यापि उपलब्धं नास्ति, अतः आँकडानि अद्यापि न निर्मिताः, परन्तु वयं स्वच्छं करिष्यामः तथा च The processed GFN data team-vfm इत्यत्र योजितं भवति ।

अस्मिन् वर्षे मार्चमासे प्रोजेक्ट् कोस्मो इत्यस्य विडियो-दत्तांशसङ्ग्रहः एकं मीलपत्थरं प्राप्तवान् : एनवीडिया इत्यनेन सप्ताहद्वये एकलक्षं विडियो-डाउनलोड् सम्पन्नम् ।

"प्रगतिः आश्चर्यजनकः अस्ति। अधुना प्रश्नः अस्ति यत् वयं कथं बहूनां उच्चगुणवत्तायुक्तानि URL-पत्राणि प्राप्तुं शक्नुमः।"

मे-मासस्य अन्ते परियोजनादलस्य सदस्येभ्यः विडियो-दत्तांश-रणनीत्याः विषये ईमेल-पत्रं प्राप्तम्, यत्र तेषां कृते ३८.५ मिलियन-वीडियो-URL-संकलनं कृतम् इति घोषितम् । "योजनानुसारं आगामिसप्ताहस्य भिडियोसङ्ग्रहस्य केन्द्रबिन्दुः अद्यापि चलच्चित्रं, ड्रोन्-दृश्यानि, प्रथम-व्यक्ति-दृष्टिकोण-दृश्यानि, प्राकृतिक-दृश्यानि च भविष्यन्ति" इति ईमेल-पत्रे तेषां डाउनलोड्-कृतानां सामग्रीनां प्रकारान् दर्शयन् चार्ट् अपि अन्तर्भवति प्रतिशतम् ।

ईमेलद्वारा काश्चन प्रमुखाः तान्त्रिकसूचनाः प्रकाशिताः, येषु आदर्शप्रशिक्षणदत्तांशतः चत्वारि दत्तांशसमूहाः सन्ति:

  • अहंकार-Exo4D: विश्वस्य १३ नगरेषु ७४० कैमराधारिभिः एकत्रितः विविधः, बृहत्-परिमाणस्य, बहु-मोडल-बहु-दृश्य-वीडियो-दत्तांशसमूहः, बेन्चमार्कः च, यत्र कुशल-मानव-क्रियाकलापानाम् १२८६.३ घण्टानां विडियो गृहीतः
  • अहङ्कार4D: एषः बृहत्-परिमाणस्य, अहङ्कारकेन्द्रितः आँकडा-समूहः, बेन्चमार्क-समूहः च अस्ति यः विश्वस्य ९ देशेषु ७४ स्थानेषु ३,६७० घण्टाभ्यः अधिकस्य दैनिकजीवनक्रियाकलापस्य विडियो संग्रहयति
  • HOI4D : श्रेणी-स्तरीय-मानव-वस्तु-अन्तर्क्रिया-संशोधनस्य सुविधायै समृद्ध-टिप्पणीभिः सह बृहत्-परिमाणस्य 4D अहंकारकेन्द्रित-दत्तांशसमूहः। HOI4D इत्यस्य निर्माणं सिंघुआ विश्वविद्यालयस्य, पेकिङ्ग् विश्वविद्यालयस्य, शङ्घाई किझी शोधसंस्थायाः च शोधकर्तृभिः कृतम् अस्ति यत् अस्य अनुज्ञापत्रं CC BY-NC 4.0 इत्यस्य अन्तर्गतं भवति तथा च व्यावसायिकं उपयोगः निषिद्धः अस्ति ।
  • GeForce Now इति: गेम डाटा।

अन्यस्मिन् ईमेल-पत्रे कोस्मोस्-परियोजनायाः सदस्याः अवदन् यत् "संशोधनदलम् अधुना बहुविधविन्यासैः सह १ अरब-पैरामीटर्-प्रतिरूपं प्रशिक्षयति, प्रत्येकं १६ नोड्-सहितम् । अग्रे स्केलिंग्-करणात् पूर्वं एतत् महत्त्वपूर्णं त्रुटिनिवारण-पदं वर्तते । . वयं क कतिपयानि सप्ताहाणि ततः १० अरब पैरामीटर् मॉडल् यावत् स्केल कुर्वन्तु।"

"एतत् अद्यतनं महान् अस्ति!"

जूनमासे परियोजनादलस्य सदस्यैः चर्चा कृता यत् एआइ-उद्योगे प्रतिस्पर्धां निर्वाहयितुम् सन्दर्भे एनवीडिया-उत्पादानाम् कृते मॉडल्-मध्ये के प्रकाराः सामग्रीः अधिकतया उपयोगिनो भविष्यन्ति

"NVIDIA इत्यत्र रोबोटिक्स, स्वायत्तवाहनचालनम्, Omniverse, Avatar च सन्ति ये अधिकांशसामग्रीकम्पनीषु नास्ति। कम्पनीयाः विकासं अधिकतमं कर्तुं वयं यत् आँकडाम् आयोजयामः तत् एतेषु 'हत्यारा'-अनुप्रयोगेषु सम्यक् प्रयोज्यम् भवितुमर्हति" इति Cosmos परियोजनायाः सदस्यः अवदत्।

कोस्मोस्-दलः यत् प्रतिरूपं विकसयति तत् तस्य अनेक-उत्पादानाम् व्यावसायिक-उपयोगाय अभिप्रेतम् इति न संशयः ।

यावत् एतादृशः कानूनः न प्रवर्तते यत् एतेषां कम्पनीनां प्रशिक्षणदत्तांशं पूर्णतया प्रकटयितुं आवश्यकं भविष्यति, ते प्रतिलिपिधर्मयुक्तदत्तांशं स्क्रैप् कर्तुं कानूनीधूसरक्षेत्राणां शोषणं निरन्तरं करिष्यन्ति। आन्तरिक-ईमेल-पत्राणां लीकं वा अन्तर्-जाल-वार्तालापानां वा विना कोऽपि न ज्ञास्यति यत् पर्दापृष्ठे किं प्रचलति, एतादृशः मॉडल् च एनवीडिया, रनवे, ओपनएआइ इत्यादीनां टेक्-विशालकायानां अरब-अरब-रूप्यकाणि कर्तुं शक्नोति

https://www.404media.co/nvidia-ai-scraping-मूल-प्रतिरूप-ब्रह्माण्ड-परियोजना/