2024-08-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
नवीन बुद्धि प्रतिवेदन
सम्पादक : सम्पादकीय विभाग
[नव प्रज्ञायाः परिचयः] ।एआइ-मानचित्रणसाधनं Flux इति सम्पूर्णं अन्तर्जालं तूफानेन गृहीतवान् अस्ति । दम्पत्योः एषः फोटो यथार्थः सुकुमारः च अस्ति, प्रकाशः, बनावटः, केशाः च सर्वे निर्दोषाः सन्ति । विडियो, ध्वनिः, मुखस्य आकारः, एआइ इत्यस्य विकासः अधिकाधिकं परिपूर्णः भवति!
यदि भवान् न अवगच्छति तर्हि केवलं पृच्छतु यत् अद्यत्वे अन्तर्जालस्य अन्ये के विषयाः सत्याः सन्ति?
फ्लक्सः सम्पूर्णं जालम् आहतं कृतवान्
अद्यत्वे मुक्तस्रोतस्य विन्सेन्ट् ग्राफ् मॉडल् फ्लक्स् इत्यनेन सम्पूर्णं अन्तर्जालं तूफानेन गृहीतम् अस्ति ।
अधोलिखितानि एतानि समूहचित्राणि सर्वाणि AI द्वारा उत्पन्नानि सन्ति? अयं ब्लोगरः एतावत् स्तब्धः अभवत् यत् सः स्वजीवने शङ्कितवान् ।
विस्तृतरन्ध्रयुक्तं अग्रभागस्य निकटचित्रं, मुखस्य, मांसपेशीनां बनावटस्य, केशानां च कोऽपि दोषः न दृश्यते ।
ध्यानं कुर्वन्तु यत् पृष्ठभूमिस्थाः पात्राः अपि अतीव स्वाभाविकाः सन्ति, तेषु किमपि दोषः नास्ति ।
किं यदि चक्षुः दूरं भवति, प्रकाशः च कृष्णतरः भवति ? स्वाभाविकम् अपि अस्ति।
द्वयोः आकृतयोः प्रकाशस्य अन्धकारस्य च विपरीतता केवलं विश्वप्रसिद्धस्य चित्रस्य प्रकाशस्य छायायाः च बनावटं निर्माति ।
केवलं सुकुमारं वा न वा इति पृच्छन् एव तत् वस्तुतः अवास्तविकम् एव, किम्?
यदि अधिकाः जनाः सन्ति चेदपि फ्लक्सः न भीतः भविष्यति।
त्रयः जनाः, चत्वारः जनाः, पञ्च जनाः, अपि वा अधिकाः जनाः वा, अद्यापि चित्रं अच्युतम् अस्ति ।
अद्यापि पिकी नेटिजन्स् लघु-लघु-दोषान् अन्वेष्टुं प्रयतन्ते ।
एकदृष्ट्या द्रष्टुं सर्वाधिकं सुलभं वस्तु AI अस्ति, निःसंदेहं लोगो इत्यस्य पाठः।
अहं एआइ इत्यस्य प्रयत्नाः भ्रमितुं अनुभवामि।
केचन विवरणानि अपि सन्ति, यथा एआइ न अवगच्छति यत् मानवटोप्याः हाराः च किं कृते उपयुज्यन्ते, अतः रेखाचित्रेषु अद्यापि लूपहोल्स् भविष्यन्ति ।
वैसे, सार्धवर्षपूर्वं सम्पूर्णे अन्तर्जालस्य Midjourney V5 अनुभवे दम्पतीनां छायाचित्रं एतादृशं दृश्यते।
द्वितीयस्य नवीनतानां तरङ्गः आगच्छति
अधुना, समग्रं अन्तर्जालं Flux इमेजजननस्य तूफानं प्रस्थितवान्, जनाः च सर्वसम्मत्या शोचन्ति स्म यत् Flux इत्यनेन AI इमेज जनरेशनं नूतनस्तरं प्राप्तम्।
प्रत्येकं वयं मन्यामहे यत् AI mapping इत्येतत् उत्तमं प्राप्तुं न शक्नोति तदा पुनः अस्मान् गलत् सिद्धयति ।
अस्य ब्लोगरस्य वचनेषु एआइ नियन्त्रणात् बहिः गच्छति तथा च Pandora’s box उद्घाट्यते!
विशेषतः, Flux इत्यस्य उत्तमाः चित्र-जनन-क्षमता, मुक्त-स्रोत-प्लेबिलिटी च विभिन्नानां गौण-निर्माणानां, विडियो-निर्माणानां, स्वर-निर्माणानां च कृते महत् स्थानं प्रदाति
एतेषां TEDx स्पीकराणां विषये वक्तुं आवश्यकता नास्ति ये वायरल् अभवन्।
अयं नेटिजनः Flux, Kering AI, synclabs इत्यादीनां उपयोगेन प्रसिद्धस्य YouTube blogger इत्यस्य विडियो निर्मितवान् ।
यद्यपि एआइ इत्यस्य लेशाः अद्यापि सन्ति तथापि चित्रेषु, भिडियोषु च प्रगतिः आश्चर्यजनकः अभवत् ।
लेखकेन उक्तं यत् तस्य उद्देश्यं केवलं अन्तर्जाल-प्रसिद्धानां निर्माणं न भवति, अपितु स्वचालितविज्ञापनं, यूट्यूबं, टिकटोक-वीडियो, निर्देशात्मक-वीडियो, विपणनं, व्याख्यानपाठ्यक्रमम् इत्यादीनि निर्मातुं भवति।
यदा ए.आइ.
आम्, एआइ इत्यस्य सर्वाधिकं भयङ्करं वस्तु तस्य वेगः एव ।
एआइ लघुचलच्चित्रं प्रतिपादयितुं केवलं कतिपयानि सेकेण्ड् वा निमेषाणि वा भवन्ति । एआइ जगति गच्छति इति न संशयः, सर्वे च तस्य विषये आशावादीः सन्ति।
अयं नेटिजनः स्पष्टतया अवदत् यत् एआइ-वीडियोषु Flux.1 तथा Midjourney इत्येतयोः परिचयं कृत्वा यद्यपि एतत् परिपूर्णं नास्ति तथापि एतत् पूर्वमेव अद्यपर्यन्तं दृष्टं सर्वोत्तमम् एआइ-कार्यम् अस्ति
अयं ब्लोगरः Flux तथा LoRA इत्येतयोः संयोजनं कृत्वा ज्ञातवान् यत् LoRA इत्यस्य यथार्थवादस्य चित्रेषु चित्रकला/कलाचित्रेषु च उत्तमाः प्रसंस्करणप्रभावाः सन्ति।
Flux.1 तथा LoRA अपि एनिमेशनजनने अतीव प्रभाविणः सन्ति, एकेन 4090 इत्यनेन च चालयितुं शक्यन्ते ।
अयं नेटिजनः अवदत् यत् सः एकघण्टायाः अपि न्यूनेन समये इत्रविज्ञापनद्वयं कृतवान्। सः निष्कपटतया अवदत् यत् - वयं एआइ-वीडियोस्य एकलतायाः समीपे स्मः।
एआइ सुपर इवोल्यूशन इत्यत्र केवलं १८ मासाः एव भवन्ति
अद्यतनं एआइ-जनितं विडियो दृष्ट्वा व्हार्टन् बिजनेस स्कूल् इत्यस्मिन् एआइ क्षेत्रे एकः सहायकप्रोफेसरः एआइ १८ मासेषु स्वस्य विकासं सम्पन्नं करिष्यति इति भविष्यवाणीं कृतवान्
अस्य मतस्य कारणं अस्ति यत् एआइ-माडलस्य विकासवेगः कल्पनातः परः अस्ति ।
यथा, "विमानयाने wifi इत्यस्य उपयोगं कुर्वन्तः ओटर्स्" इत्यस्य निम्नलिखितचित्रेषु एकसप्ताहद्वये वा दृश्यमानः प्रगतिः अभवत् ।
अधुना एकवर्षाधिककालानन्तरं एआइ-इत्यस्य विकासः किं जातम् इति अवलोकयामः——
न केवलं उदकस्य प्रतिबिम्बं अधिकं यथार्थं प्रियं च भवति, अपितु दूरभाषस्य संचालने हस्तगतिः अपि निर्दोषः भवति ।
एकस्यैव उत्पादस्य विकासवेगस्य तुलनां कुर्मः: MidJourney v3 तथा v4 इत्येतयोः मध्ये अतीव स्पष्टः सुधारः अस्ति ।
एकस्मिन् सेकेण्ड् मध्ये Musk प्रति मुखं परिवर्तयन्तु, किमपि न प्रकाशयित्वा ओष्ठ-समन्वयं कुर्वन्तु
न केवलं, अद्यतनं लोकप्रियं GitHub अध्ययनं दावान् कृतवान् यत् भवान् केवलं एकेन फोटोना लाइव स्ट्रीमिंग् कृते स्वमुखं परिवर्तयितुं शक्नोति।
अधोलिखिते विडियोमध्ये मस्कः चक्षुषः उपरि स्थापयित्वा वास्तविकसमये, विलम्बरहितं लाइव प्रसारणं आरभते ।
मस्कस्य मातुः अपि मूर्खता कर्तव्या आसीत् ।
तत्र बॉस लेकुन् अपि अस्ति, यस्य उपयोगः अपि नेटिजनैः लाइव् प्रसारणार्थं मुखं परिवर्तयितुं कृतम् आसीत् ।
सम्प्रति अस्य परियोजनायाः GitHub इत्यत्र १४k ताराणि प्राप्तानि सन्ति, Trending इति सूचीयां च अस्ति ।
परियोजना पता: https://github.com/hacksider/Deep-Live-Cam
तस्मिन् एव काले ReSyncer इत्यादीनि विविधानि ओष्ठ-समन्वयन-प्रौद्योगिकीनि अपि एआइ-वीडियो-पात्राणां मुख-आकारं अत्यन्तं स्वाभाविकं कुर्वन्ति ।
अस्मिन् क्षणे एआइ सम्पूर्णं कार्यप्रवाहं चालितवान् अस्ति! इतः परं अन्तर्जालमाध्यमेन कियत् अपि यथार्थरूपेण चित्राणि दृश्यन्ते चेदपि अस्माकं हृदये प्रश्नचिह्नं भवितुं शक्नोति ।
संतृप्तिम् वर्धयन्तु, एआइ चित्रेषु भीरुतां दर्शयिष्यति
अतः, तीक्ष्णनेत्रेण एआइ-लेशान् चिन्तयितुं किमपि उपायः अस्ति वा ?
एआइ-फोटो-जनन-लोकप्रियतायाः हाले तरङ्गस्य उपरि सवारः गूगल-सर्चस्य पूर्व-संस्थापकानाम् एकः डीडी-इत्यनेन प्रस्तावः कृतः——
एआइ चित्राणां पहिचानस्य सर्वोत्तमः उपायः अस्ति यत् चित्रस्य संतृप्तिम् वर्धयितुं माइक्रोफोन-अन्तरफलकस्य दन्तस्थानस्य च सावधानीपूर्वकं जाँचः करणीयः
यथा, TED स्पीकरस्य अद्यतनं लोकप्रियचित्रे यदि भवान् संतृप्तिम् 200% इति सेट् करोति तर्हि भवान् आश्चर्यजनकदन्तं द्रष्टुं शक्नोति ।
ज्ञातव्यं यत् परिचयसाधनस्य कोडः क्लाउड् इत्यनेन लिखितः अस्ति, सः सार्वजनिकरूपेण उपलब्धः अस्ति ।
पोर्टल: https://claude.site/artifacts/6890e3d7-e65e-41ff-a7d4-3ccb38040b46
परन्तु यदा अन्यस्मिन् AI-जनिते TED स्पीकरस्य चित्रे परीक्षणं कृतम् तदा तत्र कोऽपि दोषः नासीत् ।
अस्मिन् चित्रे दन्ताः विचित्राः न भवन्ति, विषयवर्णक्षेत्रे वर्णेन अधिकं सुसंगताः भवन्ति ।
डीडी इत्यनेन उक्तं यत् यदि वास्तविकचित्रेषु JPG संपीडनं क्रियते तर्हि एषा स्थिरता नष्टा भवितुम् अर्हति ।
नेटिजनः - अहं केवलं नेटवर्क् केबलं अनप्लग् कर्तुं शक्नोमि
यदा वयं एआइ-इत्यनेन परितः "Truman Show" इत्यस्मिन् जीवामः तदा मानवतायाः अन्तिमः निवृत्तिः कुत्र अस्ति?
भवतु, संजालकेबलं विमोचयितुं समयः अस्ति।
सन्दर्भाः : १.
https://x.com/AngryTomtweets/status/1822203767728591350
https://x.com/deedydas/status/1822665923775611374
https://github.com/hacksider/डीप-लाइव-कैम?continueFlag=4be7aad2ca0a560d6f9019228a8b2d3e
https://x.com/emollick/status/1822774265390985401
https://www.reddit.com/r/singularity/comments/1eo4sne/एकल_छवि_जीवित_प्रवाह_गहन_नकली_डीप्लिवकैम/