समाचारं

एनविडिया प्रतिदिनं ८० वर्षाणाम् अधिकं विडियो डाटा क्रॉल कृत्वा आँकडाचोरी इत्यस्य सम्मुखीभवति स्म, पेकिङ्ग् विश्वविद्यालयस्य शैक्षणिकदत्तांशसमूहः अपि प्रभावितः आसीत्

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

एनवीडिया अद्यैव कष्टप्रदकालं प्रविष्टवती इव दृश्यते।
तस्य सर्वाधिकशक्तिशालिनः एआइ चिप् इत्यस्य सामूहिकनिर्माणे विलम्बः जातः, तस्य विपण्यमूल्यं ३०० अरब अमेरिकीडॉलर् अधिकं वाष्पितम् इति प्रकाशितस्य अनन्तरं एनवीडिया इत्यस्य प्रशिक्षणार्थं प्राधिकरणं विना यूट्यूब, नेटफ्लिक्स् इत्यादिभ्यः मञ्चेभ्यः विडियो सामग्रीं हृत्वा ४०४ मीडिया इत्यनेन उजागरितम् .AI video model यत् अद्यापि जनसामान्यं प्रति न प्रकाशितम्।
आन्तरिक-ईमेल-पत्राणि, स्लैक्-चैट्-पत्राणि च दर्शयन्ति यत् यद्यपि एनवीडिया-कर्मचारिभिः एतेषां आँकडा-समूहानां उपयोगस्य वैधानिकतायाः नैतिकतायाश्च विषये प्रश्नाः उत्थापिताः, तथापि कम्पनी-प्रबन्धनेन एतानि कार्याणि वरिष्ठ-प्रबन्धनेन अनुमोदितानि इति उक्तं, तेषां कार्याणि प्रतिलिपिधर्म-कानूनस्य अनुपालनं कुर्वन्ति इति च तर्कयति
ज्ञातव्यं यत् फरवरीमासस्य अन्ते आन्तरिकचर्चासु एनवीडिया इत्यनेन एच् डी-वीजी-१३०एम इत्यादीनि बहुविधदत्तांशसमूहानां उल्लेखः कृतः यत् सः उपयुज्यते स्म ।
उत्तरार्द्धं पेकिङ्ग् विश्वविद्यालयस्य शोधकर्तृभिः निर्मितानाम् १३ कोटि यूट्यूब-वीडियोनां दत्तांशसमूहः अस्ति, तस्य उपयोग-अनुज्ञापत्रे च स्पष्टतया उक्तं यत् एतत् शैक्षणिक-संशोधनं यावत् सीमितम् अस्ति
एनविडिया इत्यस्य दृष्टिकोणः अद्यत्वे अधिकांशस्य एआइ-कम्पनीनां सूक्ष्मविश्वः इव अधिकः अस्ति ।
यदा उपयोक्तारः "दत्तांशनगदयन्त्राणि" इति गण्यन्ते, यावत् अन्तःस्थजनाः तत् न उजागरयन्ति, तदा भवतः मम च कार्याणि एआइ-प्रशिक्षणस्य पोषणं जातम् वा इति ज्ञातुं वास्तवमेव बहिः जगतः कृते कठिनम् अस्ति
संक्षेपेण वक्तुं शक्यते यत् मनुष्याः अद्यापि खाद्यशृङ्खलायाः शीर्षस्थाने उपभोक्तारः सन्ति, परन्तु वयं अनिवार्यतया एआइ विकासस्य आपूर्तिशृङ्खलायाः सदस्याः भविष्यामः।
विदेशीयमाध्यमेभ्यः 404 मीडियातः वार्तानां मूलपाठः निम्नलिखितम् अस्ति, यस्य लेखनम् अस्ति GPT-4o अनुवादः, तस्य आनन्दं लभत~
यूट्यूब-वीडियोभिः सह मॉडलं पोषयन्तु, प्रतिदिनं ८० वर्षाणाम् समकक्षं विडियो डाउनलोड् कुर्वन्तु च
404 Media इत्यनेन प्राप्ताः आन्तरिकाः Slack चैट्, ईमेल, दस्तावेजाः च तत् दर्शयन्ति एनवीडिया स्वस्य एआइ-उत्पादानाम् प्रशिक्षण-आँकडानां संकलनार्थं यूट्यूब-इत्यस्मात् अन्येभ्यः बहुभ्यः स्रोतेभ्यः च विडियो-स्क्रेप् करोति । एआइ मॉडल् प्रशिक्षितुं प्रतिलिपिधर्मयुक्तसामग्रीणां उपयोगस्य कानूनी नैतिकविषयेषु पृष्टे एनवीडिया इत्यनेन तर्कः कृतः यत् तस्य दृष्टिकोणः "प्रतिलिपिधर्मकानूनस्य अक्षरस्य भावनायाः च पूर्णतया अनुपालनं करोति" इति
404 मीडिया इत्यनेन समीक्षितानि एनवीडिया इत्यत्र आन्तरिकवार्तालापानि दर्शयन्ति यत् यदा कर्मचारिणः शोधप्रयोजनार्थं शिक्षाविदः संकलितानां डाटासेट्-यूट्यूब-वीडियो-इत्यस्य उपयोगस्य सम्भाव्य-कानूनी-निमित्तानां विषये प्रश्नान् उत्थापयन्ति स्म तदा प्रबन्धकाः तान् अवदन् यत् कम्पनीयां उच्चतर-अधिकारिभिः तेषां उपयोगस्य अनुमोदनं कृतम् अस्ति
एनवीडिया इत्यस्य पूर्वकर्मचारिणः (यस्य एनवीडिया इत्यस्य आन्तरिकप्रक्रियाणां विषये चर्चां कर्तुं ४०४ मीडियाद्वारा नामकरणं कृतम्) उक्तवान् यत् एनवीडिया इत्यस्य ओम्निवर्स् 3D वर्ल्ड जनरेटर्,स्वचालकवाहनप्रणाली तथा "डिजिटल मनुष्य"उत्पादस्य एआइ मॉडलः।"
आन्तरिकरूपेण कोस्मोस् इति नाम्ना प्रसिद्धा एषा परियोजना (किन्तु कम्पनीयाः विद्यमानस्य कोस्मोस् गहनशिक्षणस्य उत्पादात् भिन्ना) अद्यापि सार्वजनिकरूपेण न प्रकाशिता ।
परियोजनानायकस्य ईमेलद्वारा ज्ञातं यत् कोस्मोस् इत्यस्य उद्देश्यं अत्याधुनिकं विडियो आधारभूतसंरचनाप्रतिरूपं निर्मातुं वर्तते यत् “एन्विडियायाः कृते महत्त्वपूर्णानां विविधानां अधःप्रवाहानाम् अनुप्रयोगानाम् विकासाय प्रकाशपरिवहनस्य, भौतिकशास्त्रस्य, बुद्धिमत्तायाः च अनुकरणं एकस्मिन् स्थाने एकत्र आनयति” इति
404 Media इत्यनेन प्राप्तः ईमेलः एकं चित्रं दर्शयति यत् Cosmos मॉडल् भिन्न-भिन्न-Nvidia उत्पादेषु कथं प्रवर्तते इति दर्शयति ।
परियोजनायाः कृते कम्पनीद्वारा स्थापिते चैनले स्लैक् सन्देशाः दर्शयन्ति यत् कर्मचारिणः yt-dlp इति मुक्तस्रोतस्य YouTube विडियो डाउनलोडरस्य उपयोगं कुर्वन्ति, यत् YouTube द्वारा अवरुद्धं न भवितुं IP-सङ्केतं ताजगीं कर्तुं वर्चुअल् मशीनेन सह संयुक्तम् अस्ति
स्रोतस्य अनुसारं ते नेटफ्लिक्स् सहितं बहुभ्यः स्रोतेभ्यः सम्पूर्णानि विडियो डाउनलोड् कर्तुं प्रयतन्ते स्म, परन्तु मुख्यतया यूट्यूब-वीडियोषु केन्द्रीकृताः आसन् ।
404 Media द्वारा समीक्षितेषु ईमेलषु परियोजनाप्रबन्धकाः प्रतिदिनं 80 वर्षाणां मूल्यस्य विडियो डाउनलोड् कर्तुं 20 तः 30 Amazon Web Services वर्चुअल् मशीनानां उपयोगस्य विषये चर्चां कुर्वन्ति इति दर्शयति।
एनवीडिया-संस्थायाः अनुसन्धानस्य उपाध्यक्षः, कोस्मोस्-परियोजनायाः नेता च मिंग्यु लियू अवदत् मेमासे ईमेल-पत्रे मानवस्य जीवनस्य दृश्य-अनुभवे दत्तांशस्य परिमाणम्” इति ।
एनवीडिया इत्यस्य अन्तः वार्तालापाः निर्देशाः च दर्शयन्ति यत् कर्मचारिणः चिप्स् एपिआइ च डिजाइनं कर्तुं कम्पनीयाः कानूनी नैतिकविचारानाम् चर्चां कुर्वन्ति येन जनरेटिव एआइ इत्यस्य उदयाय ईंधनं दत्तं तथा च विश्वस्य बहुमूल्यं सार्वजनिककम्पनीषु अन्यतमं कृतम्।
अस्मिन् उद्योगे बृहत्तमानां कम्पनीनां प्रकाशनं भवति, यथा Runway तथा... OpenAI, एआइ मॉडल् प्रशिक्षणार्थं दत्तांशरूपेण सामग्रीयाः असन्तुष्टा माङ्गलिका अस्ति ।
एनवीडिया इत्यस्य प्रवक्ता ४०४ मीडिया इत्यस्मै ईमेलद्वारा अवदत् यत् -
वयं सर्वेषां सामग्रीनिर्मातृणां अधिकारानां सम्मानं कुर्मः तथा च दृढतया विश्वामः यत् अस्माकं आदर्शाः शोधकार्यं च प्रतिलिपिधर्मकानूनस्य अक्षरस्य भावनायाः च पूर्णतया अनुपालनं करोति। प्रतिलिपिधर्मनियमः कतिपयानां अभिव्यक्तिनां रक्षणं करोति परन्तु तथ्यं, मतं, दत्तांशं वा सूचनां वा न रक्षति । कोऽपि अन्यस्रोताभ्यां तथ्यानि, विचाराणि, दत्तांशं वा सूचनां वा ज्ञात्वा स्वस्य अभिव्यक्तिं निर्मातुं उपयोक्तुं शक्नोति । न्याय्यप्रयोगः कार्यस्य परिवर्तनकारीप्रयोजनार्थं, यथा आदर्शप्रशिक्षणार्थं, उपयोगस्य अधिकारस्य अपि रक्षणं करोति ।
यदा एनवीडिया इत्यनेन स्वस्य मॉडल् कृते प्रशिक्षणदत्तांशरूपेण यूट्यूब-वीडियो-उपयोगस्य विषये पृष्टः तदा गूगलस्य प्रवक्ता ४०४ मीडिया इत्यस्मै अवदत् यत् कम्पनीयाः "पूर्वटिप्पण्याः अद्यापि प्रवर्तन्ते" इति
तेषु यूट्यूबस्य मुख्यकार्यकारी नीलमोहनः अवदत् यत् यदि ओपनएइ स्वस्य एआइ विडियो जनरेटर् सोरा इत्यस्य अनुकूलनार्थं यूट्यूब-वीडियो-उपयोगं करोति तर्हि एतेन यूट्यूबस्य उपयोगनियमानां स्पष्टतया उल्लङ्घनं भविष्यति।
नेटफ्लिक्स् इत्यस्य प्रवक्ता ४०४ मीडिया इत्यस्मै अवदत् यत् नेटफ्लिक्स् इत्यस्य सामग्रीप्राप्त्यर्थं एनवीडिया इत्यनेन सह सम्झौता नास्ति तथा च मञ्चस्य सेवानियमाभिः आँकडानां स्क्रैपिंग् इत्यस्य अनुमतिः नास्ति इति।
परियोजनायां सम्बद्धैः कर्मचारिभिः उत्थापितानां कानूनीविषयाणां विषये प्रश्नाः सामान्यतया परियोजनाप्रबन्धकैः अङ्गीकृताः, येषां कथनमस्ति यत् अनुमतिं विना विडियो स्क्रैप् कर्तुं निर्णयः "उच्चस्तरीयनिर्णयः" अस्ति तथा च कर्मचारिणां चिन्ता नास्ति यत् किं किं उल्लङ्घनम् इति प्रतिलिपिधर्मयुक्ता सामग्री।
अस्माकं अन्वेषणं एतेषां टेक्-कम्पनीनां “don’t ask” इति मनोवृत्तिं प्रकाशयति यत् ते विशालमात्रायां प्रतिलिपिधर्मयुक्तानां सामग्रीनां दत्तांशसमूहेषु स्क्रैप् कुर्वन्ति येषां उपयोगः विश्वस्य केषाञ्चन बहुमूल्यानां AI-माडलानाम् प्रशिक्षणार्थं भवति
एन्विडिया-कार्यकारीभिः सूचितं यत् पेकिङ्ग्-विश्वविद्यालयस्य शैक्षणिकदत्तांशसमूहस्य अपि दुरुपयोगः कृतः
२०२४ तमस्य वर्षस्य फरवरीमासे एनविडिया-संस्थायाः मुख्यवैज्ञानिकः फ्रांसिस्को फेरोनी इत्यनेन #cosmos-dataset-creation इति नाम्ना एनवीडिया-स्लैक्-चैनेल्-मध्ये लिखितम् यत् -
“हाय सर्वेभ्यः, @Sanja Fidler इत्यनेन मम कृते जनरेटिव मॉडलिंग् कृते क्यूरेटेड् विडियो डाटासेट् इत्यस्य बहूनां संख्यायां समुच्चयस्य उपक्रमस्य उल्लेखः कृतः यत् अस्माभिः चिन्तितम् यत् डुप्लिकेशनं परिहरितुं सर्वेषां आन्तरिकरूपेण उपलब्धानां (सार्वजनिकरूपेण अथवा आन्तरिकरूपेण डाउनलोड् कृतानां) विडियो डाटासेट् इत्यस्य सङ्ग्रहणस्य आरम्भः लेबरः अतीव सार्थकः अस्ति। ” इति ।
(टिप्पणी: संजा फिडलरः एनवीडिया इत्यस्य एआइ-संशोधनस्य उपाध्यक्षः अस्ति ।)
ततः फेरोनी इत्यनेन MovieNet, 60,000 चलच्चित्रस्य ट्रेलर् इत्यस्य आँकडाधारः, WebVid इति दत्तांशसमूहः, Github इत्यत्र स्टॉक इमेजेभ्यः संकलितः विडियो डाटासेट् च सहितः स्प्रेड्शीट् इत्यनेन सह लिङ्क् कृतः यत् पश्चात् Shutterstock इत्यनेन सूचनां प्राप्य तस्य निर्मातृणां विलोपनं कृतम्, InternVid इति -10M (Github इत्यत्र एककोटिः YouTube-वीडियो-ID-समूहः), तथा च आन्तरिकरूपेण गृहीत-वीडियो-खेल-दृश्यानां अनेकाः आँकडा-समूहाः । ४०४ मीडिया इत्यनेन स्लैक्-वार्तालापस्य स्क्रीनशॉट्-मध्ये कनिष्ठकर्मचारिणां नामानि निष्कासितानि सन्ति ।
एआइ उद्योगे नेतारः इति सार्वजनिकदृश्यतायाः कारणात् परियोजनायां सम्बद्धानां कतिपयानां वरिष्ठानाम् अभियंतानां कार्यकारीणां च नाम वयं समावेशितवन्तः।
फेरोनी इत्यनेन लिङ्क् कृतं स्प्रेड्शीट् परियोजनायां प्रयुक्तानि दत्तांशसमूहानि दर्शयति
फरवरीमासे अनुवर्तनचर्चायां अभियंताः तेषां प्राप्तानां आँकडासमूहानां विषये चर्चां कृतवन्तः, यत्र HD-VG-130M इति १३ कोटि यूट्यूब-वीडियो-समूहः अपि अस्ति । चीनदेशस्य पेकिङ्ग् विश्वविद्यालयस्य शोधकर्तृभिः एषः दत्तांशसमूहः निर्मितः, तस्य उपयोगस्य अनुज्ञापत्रे उक्तं यत् केवलं शैक्षणिकप्रयोजनार्थं तस्य उपयोगः कर्तुं शक्यते इति ।
"दत्तांशं डाउनलोड् कृत्वा अथवा उपयुज्य, भवान् निम्नलिखितसमझौतेः सर्वान् नियमान् अवगच्छति, स्वीकुर्वति, सहमतः च भवति" इति दत्तांशसमूहस्य कृते Github पृष्ठं पठ्यते ।
पृष्ठं "केवलं शैक्षणिक-उपयोगाय। HD-VG-130M-दत्तांशसमूहे यत्किमपि सामग्री केवलं शैक्षणिक-संशोधन-उपयोगाय अस्ति। भवान् सहमतः अस्ति यत् प्रतिलिपिं न कर्तुं, व्यापारं कर्तुं, अथवा कस्यापि व्यावसायिक-उद्देश्यस्य कृते उपयोगं न कर्तुं। वितरणं निषिद्धम् अस्ति। गोपनीयतायाः सम्मानं कुर्वन्तु original source's personal information." . दत्तांशसमूहस्य सामग्रीयाः किमपि प्रसारणं, परिवर्तनं वा अन्यत् तत्सदृशं व्यवहारं प्रतिलिपिधर्मस्वामिनः अनुमतिं विना अनुमतं नास्ति।
सम्पूर्णे परियोजनायां शोधकर्तृभिः शिक्षाविदैः च संकलिताः सार्वजनिकरूपेण उपलब्धाः च आँकडासंग्रहाः एनवीडिया-माडलयोः उपयोगाय स्वतन्त्रतया उपलब्धाः इति मन्यन्ते स्म । एआइ-शोधकाः नैतिक-कानूनी-उपयोगैः सह सार्वजनिकरूपेण स्थापितानां आँकडा-समूहानां समुचित-उपयोगस्य विषये अधिकाधिकं चिन्तिताः सन्ति ।
MIT Data Provenance Initiative इत्यस्य Robert Mahari इत्यनेन 404 Media इत्यस्मै उक्तं यत् तेषां कृते विगतवर्षे शोधदत्तांशसमूहानां कृते गैर-व्यावसायिक-उपयोग-अनुज्ञापत्रस्य उपयोगे महती वृद्धिः अभवत्, येन सूचितं यत् शिक्षाविदः स्वकार्यस्य व्यावसायिक-उपयोगं सीमितं कर्तुं प्रयतन्ते। शोधप्रयोगाय संकलिताः आँकडासमूहाः व्यावसायिकप्रयोगाय संकलितदत्तांशसमूहात् उद्देश्यतः महत्त्वपूर्णतया भिन्नाः सन्ति ।
“यदा शिक्षाविदः सार्वजनिकदत्तांशसमूहाः, विशेषतः कार्यविशिष्टदत्तांशसमूहाः, विमोचयन्ति, तदा वयं कतिपयप्रकारस्य पूर्वाग्रहस्य वा पाश्चात्य-केन्द्रितस्य वा विषयेषु दत्तांशस्य विशेषतया परीक्षणं न कुर्मः यदि ते संशोधनस्य केन्द्रबिन्दुः न सन्ति, तर्हि निरीक्षणं न भविष्यति। महरी उवाच। "अतः, यदि कश्चन विद्वान् अनुज्ञापत्रे 'केवलं शैक्षणिकः उपयोगः' अथवा 'कृपया एतान् दत्तांशान् अनभिप्रेतरीत्या न उपयुञ्जीत' इति वदति तर्हि एतेषां नियमानाम् अनुपालनस्य सद्कारणम् अस्ति। यतः दत्तांशः व्यावसायिकगुणवत्तायाः न भवितुम् अर्हति , may अन्येषु प्रकारेषु वातावरणेषु अपि दुर्बलं प्रदर्शनं कुर्वन्ति” इति ।
अन्येषां बहूनां टेक् दिग्गजानां इव एन्विडिया अपि एतादृशान् जनान् नियोजयति ये शैक्षणिकसंशोधनं कुर्वन्ति प्रकाशयन्ति च । परन्तु 404 मीडिया द्वारा समीक्षितानि एनवीडिया इत्यत्र आन्तरिकवार्तालापानि सूचयन्ति यत् कोस्मोस् इत्यस्य उद्देश्यं अत्यन्तं प्रतिस्पर्धात्मके एआइ उद्योगे स्वस्य व्यावसायिकप्रस्तावस्य सुदृढीकरणार्थं कम्पनीयाः प्रयत्नस्य समर्थनं कर्तुं वर्तते।
सार्वजनिकरूपेण विमोचिताः शोधदत्तांशसमूहाः प्रायः URL अथवा YouTube ID इति कारणद्वयेन वितरिताः भवन्ति: प्रथमं, व्यावहारिककारणात् - कोटिशो सम्पूर्णविडियो अथवा चित्रसञ्चिकानां साझेदारी अतीव बोझिलं भवति, द्वितीयं, कानूनी नैतिककारणात् यथा, यदि कोऽपि स्वस्य YouTube-वीडियो वा ट्वीट् वा विलोपयति तर्हि स्वामिनः ज्ञानं वा अनुमतिं वा विना दत्तांशसमूहे प्रतिलिपिः निरन्तरं न भविष्यति ।
“इदं बहिः दत्तांशसमूहं न वितरित्वा कानूनी बाधां परितः गन्तुं इव अस्ति” इति वाशिङ्गटनविश्वविद्यालयस्य कम्प्यूटेशनल् लिङ्ग्विस्ट्स् प्रयोगशालायाः प्राध्यापिका निदेशिका च एमिली बेण्डर् ४०४ मीडिया इत्यस्मै अवदत् "अन्ये दत्तांशसमूहं निर्माय स्वस्य प्रयोजनार्थं तस्य उपयोगं कर्तुं शक्नुवन्ति।"
चर्चाविवरणं उजागरितम्, एनवीडिया कानूनस्य धारायाम् आँकडान् कथं चोरयति?
मार्चमासे एकः शोधवैज्ञानिकः "अवतार", "लॉर्ड आफ् द रिंग्स्" इत्यादीनां हॉलीवुड्-चलच्चित्रेषु प्रशिक्षणदत्तांशरूपेण उपयोगेन ओपनएआइ-संस्थायाः सोरा-वीडियो-जनरेटर्-इत्यस्य सम्भावनायाः विषये स्लैक्-इत्यत्र चर्चां आरब्धवान्
"चलच्चित्रं वस्तुतः क्रीडासदृशस्य 3D निरन्तरतायां काल्पनिकसामग्रीणां च कृते आँकडानां उत्तमः स्रोतः अस्ति, परन्तु उच्चगुणवत्तायां। पात्राणि पूर्णतया CGI सन्ति, तथा च लाइव-एक्शनदृश्यानां बहवः अधुना CGI अपि सन्ति" इति ते अवदन्। कश्चन उत्तरितवान् यत् दलेन डिस्कवरी चैनल् चलच्चित्रदत्तांशसमूहे प्रशिक्षणं कर्तव्यम् इति।
लियू मिङ्ग्युः अवदत् यत् - "सर्वं चलच्चित्रं डाउनलोड् कर्तुं अस्माकं स्वयंसेवकस्य आवश्यकता अस्ति।"
मूलतः चलच्चित्रस्य प्रस्तावम् अकरोत् यः शोधवैज्ञानिकः सः अपि अवदत् यत् "यद्यपि ते किं कुर्वन्ति इति अतीव स्पष्टं तथापि हॉलीवुड् इत्यस्य एआइ प्रति अतिसंवेदनशीलत्वस्य विषये अस्माभिः अतीव सावधानता भवितव्या, यथा एसडी [स्टेबल डिफ्यूजन" इत्यस्य विमोचनानन्तरं कलाकारसमुदायस्य कृते अभवत् ] अधुना च हॉलीवुड्-नगरे घटमानम्” इति ।
ततः ते गपशपस्य मध्ये द्वौ लिङ्कौ स्थापितवन्तः: टायलर पेरी इत्यनेन ओपनएआइ इत्यस्य सोरा इत्यस्य दर्शनानन्तरं ८० कोटि डॉलरस्य स्टूडियोविस्तारस्य विरामस्य विषये हॉलीवुड् रिपोर्टर् लेखः, तथा च २०२३ तमस्य वर्षस्य SAG- AFTRA हड़तालस्य विषये वैनिटी फेयर इत्यस्य लेखः स्टूडियो अनुबन्धेषु एआइ भाषा सहितं लेखं जनयति
लियू मिंग्युः बोधयति स्म यत् "अत्र वयं यत् कुर्मः तत् किमपि शोधपरिणामं न प्रकाशयिष्यति। वयं प्रयोगान् कर्तुं सर्वाणि डाउनलोड् कर्तुं शक्यमाणानि आँकडानि उपयुञ्ज्महे। यतः वयं किमपि न प्रकाशयिष्यामः, तस्मात् नकारात्मकभावनाः न भविष्यन्ति ये 404 मीडिया पूर्वकर्मचारिभिः सह भाषितवन्तः यत् "प्रकाशयति" इति शोधप्रकाशनानि निर्दिशति।
यः व्यक्तिः "उच्चसंवेदनशीलतां" उत्थापितवान् सः उत्तरितवान् यत् "यदि वयं कम्पनीयाः अन्तः एतादृशी परियोजनां कुर्मः तर्हि तस्य व्यापकरूपेण संचारः करणीयः, यतः समानानि उदाहरणानि दर्शयन् लियू मिंग्युः प्रतिक्रियाम् उत्पन्नं कर्तुं शक्नोति" इति
मार्चमासे फेरोनी अन्यस्मिन् परियोजना-सम्बद्धे स्लैक्-चैनेल्-मध्ये लिखितवान् यत् - "काश्चन उच्च-प्राथमिकता-सञ्चिकाः प्राप्ताः येषां डाउनलोड्-करणस्य आवश्यकता आसीत् । एतत् निष्पन्नं यत् अस्माकं कृते HDVILA [High-Resolution Video Language] इति आँकडा-समूहात् २३ लक्षं कच्चानि भिडियानि अदृश्यानि आसन् . !" ते माइक्रोसॉफ्ट-संस्थायाः HD-VILA-100M इति बृहत्-परिमाणस्य, उच्च-रिजोल्यूशनस्य, विविधस्य च विडियो-भाषा-दत्तांशसमूहस्य उल्लेखं कुर्वन्ति स्म । ते गूगल-ड्राइव-दस्तावेजस्य लिङ्कं प्रेषयित्वा "अत्र गम्यते यूट्यूब-लिङ्क्" इति अवदन्, ततः "एतत् डाउनलोड्-प्रक्रियायां स्थापयामः" इति अवदन्!
HD-VILA-100M इत्यस्य अनुज्ञापत्रविवरणं पठ्यते यत् -
"भवन्तः केवलं अव्यावसायिकसंशोधनार्थं गणनाप्रयोजनार्थं दत्तांशस्य उपयोगं कर्तुं सहमताः सन्ति। अस्य प्रतिबन्धस्य अर्थः अस्ति यत् भवान् अव्यावसायिकसंशोधनक्रियासु (व्यापारिकसंस्थायाः कृते कृतं वा वित्तपोषितं वा अव्यावसायिकसंशोधनं सहितं) संलग्नः भवितुम् अर्हति, परन्तु भवान् उपयोगं न कर्तुं शक्नोति कस्यचित् वाणिज्यिक-उत्पादस्य दत्तांशः वा कोऽपि परिणामः, यत्र उत्पादस्य वा सेवायाः भागत्वेन अपि यत् भवान् अन्येभ्यः उपयुङ्क्ते वा प्रदाति वा (अथवा कस्यापि उत्पादस्य वा सेवायाः उन्नयनार्थं वा)।
"अवलोकितानां URL-दत्तांशकोशं निर्मामः" इति अन्यः अभियंता उत्तरितवान् । "YouTube-वीडियोषु अद्वितीय-ID-इत्येतत् अस्ति । किं वयं एतानि ID-इत्येतत् सन्दर्भरूपेण ("?v="-पश्चात् ID-इत्येतत्) उपयोक्तुं शक्नुमः? भविष्ये वयं बहुवारं URL-इत्यस्य तुलनां करिष्यामः, विलयं च करिष्यामः, Ferroni इत्यनेन उत्तरितम्: "आम्, वयम् अधुना Hive इत्यस्य उपयोगं कुर्मः।" setup infrastructure," अर्थात् ते परियोजनाप्रबन्धनसाधन Hive इत्यत्र योजयन्ति ।
तेषां टैग् कृतः Omniverse दलस्य सदस्यः प्रतिवदति स्म यत् "वयं AWS इत्यत्र स्मः तथा च [वर्चुअल् मशीन्] उदाहरणं पुनः आरभ्य अस्मान् नूतनं सार्वजनिकं IP ददाति, अतः सः अस्मिन् क्षणे मुद्दा नास्ति।
#cosmos-dataset-creation चैनले उत्तमविडियो कथं अन्वेष्टव्यम् इति विषये Slack चर्चायां कर्मचारिणः यदा कदा स्वकार्यस्य कानूनी नैतिकविषयाणां उल्लेखं कृतवन्तः। फरवरीमासे कश्चन गूगलेन संकलितस्य YouTube ID इत्यस्य शोधदत्तांशसमूहस्य YouTube-8M इत्यस्य उपयोगस्य उल्लेखं कृत्वा फेरोनी पृष्टवान् यत् "कदाचित् वयं [YT8M] इत्यस्य उपयोगं गैर-संशोधनार्थं न शक्नुमः?"
YouTube-8M इत्यस्य पत्रे परियोजनापृष्ठे च प्रतिलिपिधर्मस्य विषयाणां उल्लेखः नास्ति, परन्तु पत्रे उक्तं यत् यन्त्रशिक्षणसंशोधनं प्रवर्तयितुं दत्तांशसमूहः निर्मितः आसीत्: “अस्माभिः अपेक्षा अस्ति यत् एषः दत्तांशसमूहः शैक्षणिकक्षेत्रे शोधकर्तृभ्यः समं क्रीडाक्षेत्रं प्रदास्यति Closing the gap with large -स्केल एनोटेटेड् विडियो डाटासेट्स् तथा च विडियो अवगमने महत्त्वपूर्णतया शोधं त्वरयति इति वयम् आशास्महे यत् एषः डाटासेटः उपन्यासस्य विडियो प्रतिनिधित्वशिक्षण एल्गोरिदमस्य विकासाय परीक्षणशय्यारूपेण कार्यं करिष्यति, विशेषतः एतादृशाः पद्धतयः ये प्रभावीरूपेण शोरगुलयुक्तैः अथवा अपूर्णलेबलैः सह निबध्नन्ति।
Cosmos परियोजनायाः कृते तस्य उपयोगस्य विषये Ferroni इत्यस्य प्रश्नस्य उत्तरे एकः NVIDIA कर्मचारी यः पूर्वं ACAV100M इत्यस्य सह-निर्माणं कृतवान् सः उत्तरं दत्तवान् यत् -
"आम्, गूगलतः आँकडानां डाउनलोड् करणं बहु महत्त्वपूर्णम् अस्ति। तथापि एनवीडिया इत्यस्य अन्तः १०,००० कोर्स् इत्यस्य समयनिर्धारणं एकं आव्हानं जातम्।"
तदतिरिक्तं मेघे NVIDIA इत्यस्य बैण्डविड्थ् सीमाः पर्याप्तं परिवर्तनशीलतां योजयन्ति यत् समस्यां जनयितुं शक्नोति । गूगलक्लाउड् इत्यत्र डाउनलोड् करणस्य अर्थः अस्ति यत् प्रत्येकं कार्यं यूट्यूब-सङ्गतिं स्थिरं, उच्च-बैण्डविड्थ्-सम्बद्धं प्राप्नोति । " " .
"ततोऽपि महत्त्वपूर्णं यत् यूट्यूब-वीडियो-डाउनलोड्-करणं यूट्यूब-सेवा-नियमेन निषिद्धम् अस्ति । अतः यूट्यूब-८m-इत्यस्य डाउनलोड्-करणसमये वयं पूर्वमेव गूगल-यूट्यूब-इत्यनेन सह संवादं कृत्वा प्रेरणारूपेण डाउनलोड्-करणाय गूगल-क्लाउड्-इत्यस्य उपयोगं कृतवन्तः।अन्ततः, सामान्यतया ८० लक्षं विडियो कृते, तेषां कृते बहु विज्ञापन-छापाः प्राप्यन्ते ये प्रशिक्षणार्थं प्रयुक्ते सति डाउनलोड् भवन्ति तथा च परिणामः नष्टः राजस्वः भवति, अतः तेभ्यः तस्मात् किञ्चित् राजस्वं प्राप्तव्यम् । प्रति विडियो डाउनलोड् $0.00625 दातुं अद्यापि उत्तमः सौदाः अस्ति। " " .
"ठीकम्, अतः एतत् दत्तांशं केवलं शोधप्रयोजनार्थं उपयुज्यते इति अपेक्षा अस्ति? यथावत् अहं जानामि, गूगलस्य यूट्यूब एपिआइ प्रत्येकस्य विडियोस्य अनुज्ञापत्रस्य शर्ताः पृच्छितुं शक्नोति" इति फेरोनी प्रतिवदति। "किं भवान् ACAV100M तथा YouTube8M इत्येतयोः अनुज्ञापत्रशर्तयोः विषये अपि टिप्पणीं कर्तुं शक्नोति?"
"यावत् अहं जानामि, यूट्यूबस्य सेवानियमासु अनुज्ञापत्रं न कृत्वा डाउनलोड् करणं निषिद्धं भवति; प्रतिबन्धः तेषां नष्टविज्ञापनराजस्वस्य विषये अस्ति, न तु अनुज्ञापत्रस्य विषये" इति अन्यः कर्मचारी प्रतिवदति। ते अग्रे अवदन् : १.
"अहं न जानामि यत् गूगलः दत्तांशसमूहस्य निर्माणकाले केषां अनुज्ञापत्रपदानां छाननं कृतवान्; वयं केवलं तेषां सूचीकृतं दत्तांशसमूहे समाविष्टं इति अवतरणं कृतवन्तः (ते विशेषताः पोस्ट् कृतवन्तः, मूलवीडियोनां लिङ्कैः सह)। अहं YouTube 8m आँकडा The डाउनलोड् कृतवान् सेट् पूर्णमेटाडाटा सह आगच्छति, अतः मम अद्यापि ACAV100M डाटासेटं पश्यितुं आवश्यकता वर्तते, तथापि, यदि प्रतिलिपिधर्मयुक्ता सामग्री उपलब्धा अस्ति कानूनी विषयः अधिकांशकम्पनयः एतत् न्याय्यप्रयोगं मन्यन्ते इति मम विश्वासः अस्ति यत् अस्माकं कानूनीदलेन बृहत्भाषाप्रतिमानानाम् प्रशिक्षणार्थं एतत् प्रथा अनुमोदितं, सम्भवतः च विडियोप्रशिक्षणमपि अनुमोदितं भविष्यति।”.
“मम विचारेण कस्यचित् सहमतिम् विना किमपि व्यावसायिकीकरणस्य सार्वजनिकरूपेण विमोचितसामग्रीणां आधारेण जननात्मक-AI-क्षमतायाः शोधस्य च मध्ये महत् अन्तरम् अस्ति” इति एम.आइ.टी. Cosmos Slack चैनले YouTube इत्यस्य सेवानियमानां विषये प्रश्नाः अन्तिमवारं कानूनी विषयाः न आगताः आसन्।
पश्चात् अन्यः कर्मचारी अवदत्, "अरे दलम्। किं वयं विडियो डाउनलोड् कर्तुं https://research.google.com/youtube8m/download.html इत्यस्य उपयोगं कुर्मः? यदि एवम् अस्ति तर्हि अस्माकं कानूनी अनुमोदनं अस्ति वा? एकस्मिन् परियोजनायां कानूनी विभागः Denied its." use because the license for individual videos is better than the license shared on yt8m "एषः प्रशासनिकः निर्णयः अस्ति। अस्माकं कृते एकः मुख्यः अनुज्ञापत्रः अस्ति यः सर्वान् आँकडान् आच्छादयति" इति लियू मिंग्युः उत्तरितवान् । "ठीकम्, धन्यवादः!"
बेण्डर् ४०४ मीडिया इत्यस्मै अवदत् यत् कम्पनी प्रशिक्षणदत्तांशार्थं प्रयुक्तस्य प्रतिलिपिधर्मयुक्तसामग्रीणां परितः वर्तमानकानूनीधूसरक्षेत्रस्य लाभं लभते। "मम मनसि इदं दृश्यते यत् 'यदि वयं तत् प्राप्तुं शक्नुमः तर्हि तस्य उपयोगं कर्तुं शक्नुमः' इति संस्कृतिः निश्चितरूपेण अस्ति" इति सा अवदत् । "इदं बहुजनानाम् इच्छया आधारितम् अस्ति, न तु तस्य वैधानिकतायाः सावधानीपूर्वकं अध्ययनं वा जनानां उपरि तस्य प्रभावस्य विषये गहनविचारः वा।"
एआइ प्रशिक्षणार्थं प्रतिलिपिधर्मयुक्तसामग्रीणां उपयोगः "निश्चयेन निश्चिन्तः कानूनः नास्ति" इति महरी अवदत् । कानूनीव्यवस्था अद्यापि निर्धारितं न कृतवती यत् एआइ-प्रतिमानानाम् विकासाय प्रशिक्षणदत्तांशं प्राप्तुं पर्याप्तं परिवर्तनकारी अस्ति वा, विशेषतः यतः आदर्शाः प्रशिक्षणदत्तांशं उत्पादनरूपेण स्मर्तुं वा स्मर्तुं वा समर्थाः इति दर्शितम् अस्ति “मम भावः (अस्मिन् विज्ञानलेखे आंशिकरूपेण सारांशतः) अस्ति यत् एआइ-प्रतिरूपस्य प्रशिक्षणं खलु न्याय्यप्रयोगं भवितुं शक्नोति, परन्तु तस्य अर्थः न भवति यत् प्रशिक्षणदत्तांशेषु विशिष्टवस्तूनाम् सदृशं उत्पादनं जनयितुं उल्लङ्घनं न भवति।
अस्मिन् सन्दर्भे अस्पष्टं यत् अन्तर्निहितस्य प्रतिरूपस्य प्रदाता अथवा उत्पादनं जनयन् विशिष्टः उपयोक्ता उल्लङ्घनं करिष्यति वा (एतत् सन्दर्भे निर्भरं भवितुम् अर्हति) " " .
मेमासे एकः शोधवैज्ञानिकः कोस्मोस् स्लैक् चैनल् इत्यस्मिन् केषाञ्चन यूट्यूब-चैनेल्-सम्बद्धानि लिङ्कानि पातयित्वा अवदत् यत्, "यदि भवान् अद्यापि यूट्यूब-चैनेल्-सम्बद्धानां सुझावानां कृते उद्घाटितः अस्ति यत् भवान् डाउनलोड् कर्तुं शक्नोति, तर्हि अत्र कतिचन सन्ति ये विचारणीयाः भवेयुः .Expedia तथा Architectural Digest इत्यस्य आधिकारिकचैनलः, तथैव The Critical Drinker तथा Marques Brownlee (MKBHD) इत्यादयः व्यक्तिगतसामग्रीनिर्मातारः अपि सन्ति एकः परियोजनाप्रबन्धकः तेषां सुझावानां कृते धन्यवादं दत्तवान्, ते तान् दलाय प्रसारयिष्यन्ति इति च अवदत्, तस्मै फिडलरः प्रतिवदति स्म, "किं भवता पाठ्यक्रमस्य भिडियो अपि समाविष्टः? खगोलशास्त्रम्? चिकित्सा?
वाणिज्यिक आधारप्रतिरूपप्रशिक्षणार्थं प्रतिलिपिधर्मयुक्तानां कार्याणां उपयोगस्य "बकाया कानूनी विषयः" दीर्घकालं यावत् असमाधानं न प्राप्नुयात् ।
जनरेटिव एआइ कम्पनीनां विरुद्धं प्रतिलिपिधर्मधारकैः दाखिलाः प्रतिलिपिधर्मस्य उल्लङ्घनमुकदमाः सञ्चिताः सन्ति, यत्र स्टेबल डिफ्फ्यूजन निर्मातुः स्टेबिलिटी एआइ इत्यस्य विरुद्धं गेट्टी इमेजेज् इत्यस्य मुकदमा, ओपनएआइ इत्यस्य विरुद्धं द न्यूयॉर्क टाइम्स् इत्यस्य मुकदमा, तथा च स्टेबिलिटी इत्यस्य विरुद्धं कलाकाराः निर्मातारः च,मध्ययात्रा , DeviantArt तथा ​​Runway इत्यनेन वर्गीयकार्याणां मुकदमा दाखिलः । कोस्मोस् प्रशिक्षणदत्तांशदलेन जनरेटरस्य प्रशिक्षणार्थं नेटफ्लिक्स् इत्यस्य उपयोगस्य विषये अपि चर्चा कृता ।
"अद्यतनस्य सभायां वयं सर्वविधदत्तांशं डाउनलोड् कर्तुं अनुमतिं प्राप्तवन्तः। किं अस्माभिः सम्पूर्णं नेटफ्लिक्स् डाउनलोड् कर्तव्यम्? वयं एतत् कथं परिचालनं कुर्मः?" "अस्माभिः सम्पूर्णं डिस्कवरी चैनल् डाउनलोड् कर्तव्यम्!"
कश्चन प्रत्युवाच । "अस्माकं परियोजनासूचनासमन्वयकस्य आवश्यकता अस्ति। सर्वाणि चलच्चित्राणि पश्यन् कोऽपि स्क्रीनकॅप्चरं कर्तुम् इच्छति?" "अस्माभिः तस्मात् बहु उच्चगुणवत्तायुक्तानि मुखस्य भिडियो प्राप्तव्यानि" इति लियू अग्रे अवदत् । Omniverse आधारभूतसंरचनादलस्य कश्चन सूत्रे टैग् कृतः आसीत् तथा च अवलोकितवान् यत् ते "एतत् परिचालनं कर्तुं" सहायतां कर्तुं इच्छन्ति यतः तेषां "अन्यैः बृहत्कम्पनीभिः सह बृहत्दत्तांशसमूहनिर्माणस्य अनुभवः अस्ति" इति
प्रशिक्षणदत्तांशयोः मध्ये कथं सर्वोत्तमरूपेण वीडियो गेम दृश्यं योजयितुं शक्यते इति अपि दलेन विचारः कृतः । एनवीडिया इत्यस्य वरिष्ठः शोधवैज्ञानिकः जिम फैन् इत्यनेन उल्लेखितम् यत् लाइव् गेमप्ले विडियो गृहीतुं "इञ्जिनीयरिंग् तथा रेगुलेटरी" बाधाः सन्ति ।
"अद्यतन: अहं GeForce Now (GFN) इत्यत्र जनानां सह मिलितवान् अस्मि तथा च तेषां सह आँकडायोजनायां कार्यं करिष्यामि। वयं GFN तथा सम्बद्धैः अभियांत्रिकीदलैः सह वास्तविकसमयस्य गेम डाटा कैप्चरस्य निर्माणार्थं, पाइपलाइनस्य स्केल कर्तुं, तथा च निकटतया कार्यं करिष्यामः प्रशिक्षणार्थं एतान् आँकडान् संसाधयन्ति उच्चगुणवत्तायुक्तानि गेमप्ले-वीडियो अस्माकं सोरा-प्रकल्पे अतीव उपयोगी परिवर्तनं भविष्यन्ति" इति फैन् लिखितवान् । “अस्माकं समीपे अद्यापि सांख्यिकी वा विडियो सञ्चिकाः नास्ति यतोहि लाइव गेम विडियो तथा एक्शन् इत्यस्य विशालमात्रायां ग्रहणार्थं आधारभूतसंरचना न स्थापिता अस्ति तथापि अस्माकं कृते अभियांत्रिकी-नियामक-बाधाः दूरीकर्तुं आवश्यकाः सन्ति तथापि एकवारं स्वच्छं कृत्वा संसाधितं GFN-आँकडा arrives, we इदं यथाशीघ्रं team-vfm मध्ये योजितं भविष्यति।"
मार्चमासे परियोजना एकं मीलपत्थरं प्राप्तवती यत् सप्ताहद्वये एकलक्षं भिडियो डाउनलोड् कृतम् । एकः कर्मचारी एकस्मिन् सूत्रे उक्तवान् यत् फेरोनी इत्यस्य माइलस्टोन् इत्यस्य विषये चर्चा कृता यत् तेषां उपयोगं कुर्वन्तः एकः डाउनलोडरः अस्ति, फेरोनी इत्यनेन च पुष्टिः कृता यत् ते श्रव्यं, भिडियो च डाउनलोड् कुर्वन्ति। "आश्चर्यजनकः प्रगतिः। इदानीं प्रश्नः अस्ति यत् वयं कथं बहूनां उच्चगुणवत्तायुक्तानि URL-पत्राणि प्राप्नुमः" इति लियू उत्तरितवान् ।
मे-मासस्य अन्ते परियोजनादलस्य सदस्येभ्यः विडियो-दत्तांशस्य कृते आँकडा-रणनीति-ईमेलः प्रेषितः, यत्र तेषां कृते ३८.५ मिलियन-वीडियो-URL-संकलनं कृतम् इति घोषितम् । "अस्माकं लक्ष्यवितरणस्य आधारेण आगामिसप्ताहस्य कृते ध्यानं चलच्चित्रेषु, ड्रोन-दृश्येषु, प्रथम-व्यक्ति-वीडियोषु, केचन यात्रा-प्रकृति-वीडियोषु च केन्द्रितं वर्तते" इति ईमेल-पत्रे पठ्यते ईमेल-पत्रे तेषां डाउनलोड्-कृतानां सामग्री-प्रकारानाम् प्रतिशतं दर्शयति इति चार्ट् अपि अन्तर्भवति स्म ।
तस्मिन् ईमेल-पत्रे एकः उत्पाद-प्रबन्धकः मॉडलस्य प्रशिक्षण-दत्तांशेषु चत्वारि अतिरिक्तानि दत्तांशसमूहानि योजयितुं सुझावम् अयच्छत् । ते लिखितवन्तः यत् -

1. Ego-Exo4D: विश्वस्य 13 नगरेषु 740 कैमराधारकैः एकत्रितः विविधः बृहत्-परिमाणस्य बहु-मोडल, बहु-दृश्य-वीडियो-दत्तांशसमूहः, बेन्चमार्कः च, यत्र कुशल-मानव-क्रियाकलापानाम् 1286.3 घण्टानां विडियो-गृहं गृहीतम्

2. Ego4D: एकः बृहत्-परिमाणस्य प्रथम-व्यक्ति-दृष्टिकोण-दत्तांशसमूहः तथा च बेन्चमार्क-सूटः यस्य 3670 घण्टाभ्यः अधिकेभ्यः दैनिकजीवनक्रियाकलाप-वीडियो-विडियो-विडियो-विडियो-समूहः विश्वस्य 74-स्थानेषु 9-देशेषु च एकत्रितः अस्ति

3. HOI4D: श्रेणी-स्तरीयः मानव-वस्तु-अन्तर्क्रियाणां अध्ययनस्य सुविधायै समृद्ध-टिप्पणीभिः सह एकः बृहत्-परिमाणस्य चतुर्-आयामी प्रथम-दृष्टि-दत्तांशसमूहः।

4. GeForce Now: गेम डाटा।
HOI4D इत्यस्य निर्माणं सिंघुआ विश्वविद्यालयस्य, पेकिङ्ग विश्वविद्यालयस्य, शङ्घाई किझी शोधसंस्थायाः च शोधकर्तृभिः कृतम् अस्ति यत् अस्य अनुज्ञापत्रं CC BY-NC 4.0 इत्यस्य अन्तर्गतं अस्ति तथा च व्यावसायिकरूपेण उपयोगस्य अनुमतिः नास्ति ।
"मम मते यदि कश्चन कम्पनी केवलं संशोधनार्थं भवति इति दत्तांशसमूहं गृहीत्वा संशोधनार्थं तस्य उपयोगं करोति तर्हि ते अद्यापि तस्य दत्तांशसमूहस्य अनुज्ञापत्रस्य अनुपालनं कुर्वन्ति" इति बेण्डर् अवदत्
"किन्तु तत् सुनिश्चित्य तेषां कृते तेषां कृते संशोधनस्य उत्पादविकासे तेषां कार्यस्य च मध्ये अग्निप्रावरणानि निर्मातुं तेषां अतीव सावधानता भवितुमर्हति।"
मेमासे अन्यस्मिन् अद्यतन-ईमेल-पत्रे लियू अवदत् यत्, "संशोधनदलम् अधुना अनेकविभिन्नविन्यासानां उपयोगेन १ अरब-मापदण्डैः सह एकं मॉडलं प्रशिक्षयति, प्रत्येकं १६ नोड्-सहितम्। एतत् अग्रे विस्तारात् पूर्वं महत्त्वपूर्णं त्रुटिनिवारणम् अस्ति। चरणाः। वयं क कतिपयानि सप्ताहाणि ततः १० अरब पैरामीटर् मॉडल् यावत् स्केल कुर्वन्तु” इति ।
एनवीडिया-सङ्घस्य मुख्याधिकारी जेन्सेन् हुआङ्ग् तस्मिन् ईमेल-पत्रे प्रतिक्रियाम् अददात् यत्, "महान-अद्यतनम्। अनेकेषां कम्पनीनां कृते विडियो-आधारित-माडल-निर्माणं कर्तव्यम् अस्ति। वयं पूर्णतया त्वरित-पाइप्-लाइन्-प्रदानं कर्तुं शक्नुमः।"
जूनमासे कर्मचारिणः चर्चां कृतवन्तः यत् एआइ-उद्योगे प्रतिस्पर्धां कर्तुं एनवीडिया-उत्पादानाम् कृते मॉडल्-मध्ये के प्रकाराः सामग्रीः अधिकतया उपयोगिनो भविष्यन्ति ।
"NVIDIA इत्यत्र रोबोट्, स्वयमेव चालयन्ति काराः, Omniverse, Avatar च सन्ति ये अधिकांशसामग्रीकम्पनीषु नास्ति। कम्पनीयां सर्वाधिकं प्रभावं कर्तुं वयं यत् आँकडान् क्यूरेट् कुर्मः तत् एतेषु घातक-अनुप्रयोगेषु सम्यक् प्रयोज्यम् भवितुमर्हति" इति लियू अवदत्।
"अहं रोबोट्-स्वचालित-कार-योः प्रभावं कुर्वन्तः आँकडान् अवगच्छामि। किं कोऽपि ओम्निवर्स-अवतार-उपयोग-प्रकरणानाम् उपरि प्रभावं जनयति इति आँकडानां विवरणं साझां कर्तुं शक्नोति?" "मनुष्याः वस्तुभिः सह कथं संवादं कुर्वन्ति इति विषये एषः भिडियो भविष्यति। यथा फर्निचरस्य स्थापना, फलानां कटनं, धूपपात्रस्य तन्तुं च" इति लियू उत्तरितवान्।
किं एआइ मॉडल् इत्यस्य प्रगतिः भवतः मम च सृष्टिषु आधारिता अस्ति?
यद्यपि एनवीडिया शैक्षणिकसंशोधने योगदानं ददाति तथापि 404 मीडिया द्वारा प्राप्ताः वार्तालापाः ईमेलाः च दर्शयन्ति यत् कोस्मोस्-दलः यस्मिन् प्रतिरूपे कार्यं करोति तत् तस्य बहुषु उत्पादेषु व्यावसायिक-उपयोगाय अभिप्रेतम् अस्ति
यावत् प्रशिक्षणदत्तांशः कथं संकलितः भवति इति विषये कानूनी पूर्वानुमानं न निर्धारितं भवति, अथवा यावत् कम्पनीभ्यः अस्य दत्तांशस्य विषये पारदर्शी भवितुम् आवश्यकं न भवति, तावत् कम्पनयः प्रतिलिपिधर्मयुक्तप्रशिक्षणदत्तांशस्य स्क्रैपिंगस्य कानूनीधूसरक्षेत्रस्य शोषणं निरन्तरं करिष्यन्ति एतादृशानां आन्तरिकवार्तालापानां लीक्स् एव एकमात्रं मार्गं जनाः ज्ञातुं शक्नुवन्ति यत् तेषां कार्यस्य उपयोगः एनवीडिया अथवा रनवे अथवा ओपनएआ इत्यादीनां कम्पनीनां अरब-अरब-डॉलर्-रूप्यकाणां निर्माणार्थं मॉडल्-प्रशिक्षणार्थं क्रियते वा इति।
एआइ उद्योगः वर्षाणां यावत् अधिकपारदर्शितायाः कृते धक्कायति, भवेत् तत् सर्वकारीयविनियमनस्य माध्यमेन वा उद्योगमानकानां माध्यमेन वा।
अस्मिन् वर्षे पूर्वं MIT इत्यस्य Jack Hardinges, Elena Simperl, Nigel Shadbolt च लिखितवन्तः यत् “माडलस्य प्रशिक्षणार्थं प्रयुक्तेषु दत्तांशसमूहेषु किं वर्तते, तेषां संकलनं कथं कृतम् इति अवगन्तुं महत्त्वपूर्णम् अस्ति, एतां सूचनां विना विकासकाः, शोधकर्तारः, नीतिशास्त्रज्ञाः च सम्बोधयितुं प्रयतन्ते पूर्वाग्रहं वा दत्तांशतः हानिकारकसामग्रीम् अपसारयितुं बाधितं भविष्यति।
प्रशिक्षणदत्तांशस्य विषये सूचना अपि महत्त्वपूर्णा भविष्यति यत् ते आकलनं कुर्वन्ति यत् अन्तर्निहितप्रतिमानाः व्यक्तिगतदत्तांशं गृहीतवन्तः वा प्रतिलिपिधर्मयुक्ता सामग्री वा। अधः एआइ-प्रणालीनां अभिप्रेताः संचालकाः तेषां उपयोगेन प्रभाविताः च एतेषु प्रणालीषु विश्वासं कर्तुं अधिकं सम्भावनाः सन्ति यदि ते अवगच्छन्ति यत् तेषां विकासः कथं अभवत् " " .
कानूननिर्मातृभिः गतवर्षे अस्य विषयस्य सम्बोधनाय अनेकाः विधेयकाः प्रस्ताविताः, यत्र दिसम्बरमासे एआइ अन्तर्निहितप्रतिरूपपारदर्शिताकानूनम् अपि अन्तर्भवति, यस्मिन् अन्तर्निहित एआइ मॉडल् निर्मायमाणानां कम्पनीनां कृते FTC तथा प्रतिलिपिकार्यालय इत्यादिभिः संघीयसंस्थाभिः सह कार्यं कर्तुं आवश्यकता भविष्यति, यत्र आवश्यकता अपि अस्ति तेषां उपभोक्तृभ्यः कतिपयानि सूचनानि प्रकटयितुं।
अस्मिन् वर्षे एप्रिलमासे प्रस्तावितेन जेनरेटिव् एआइ प्रतिलिपिधर्मप्रकाशनकानूनेन आँकडासमूहनिर्मातृभ्यः "किमपि प्रतिलिपिधर्मयुक्तस्य कार्यस्य पर्याप्तविस्तृतं सारांशं" रजिस्ट्रारस्य समक्षं प्रस्तुतं कर्तुं वा दण्डस्य सामना कर्तुं वा आवश्यकं भविष्यति
"तकनीकीदृष्ट्या भवतः कार्यं प्रशिक्षणार्थं प्रयुक्तम् वा इति निर्धारयितुं वास्तवमेव कठिनम्" इति महरी अवदत्। "आन्तरिकरूपेण सर्वोत्तमनीतिः अस्ति यत् भवन्तः किं प्रशिक्षणं प्रयुञ्जते इति जनान् न वदन्तु यतोहि कस्यापि तृतीयपक्षस्य कृते वास्तविकरूपेण लेखापरीक्षां कर्तुं ज्ञातुं च अतीव कठिनम् अस्ति। अतः यावत् भवन्तः कस्मैचित् न वदन्ति तावत् प्रमाणयितुं अतीव कठिनम्।
प्रतिवेदनस्य मूलपतेः संलग्नः अस्ति : १.

https://www.404media.co/nvidia-ai-scraping-मूल-प्रतिरूप-ब्रह्माण्ड-परियोजना/