समाचारं

Zhipu AI विडियो जनरेशनं प्रविशति: "Qingying" ऑनलाइन अस्ति, 6 सेकण्ड् दीर्घः, निःशुल्कः असीमितः च अस्ति

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

झीपु बृहत् आदर्शदलः स्वयमेव विकसितः निर्मितः च अस्ति ।

यतः कुआइशौ केलिंग एआइ देशे विदेशे च लोकप्रियः अभवत्, अतः २०२३ तमे वर्षे बृहत्पाठप्रतिरूपस्य इव घरेलुविडियोजननं अधिकाधिकं लोकप्रियं भवति

अधुना एव अन्यत् विशालं विडियो जनरेशन मॉडल् उत्पादं आधिकारिकतया प्रारब्धम् अस्ति: Zhipu AI इत्यनेन आधिकारिकतया "Qingying" इति विमोचितम्। यावत् भवतः समीपे उत्तमविचाराः (कतिपयानि शब्दानि शतशः शब्दानि यावत्) किञ्चित् धैर्यं च (३० सेकेण्ड्) अस्ति, तावत् यावत् "Qingying" इत्यनेन १४४०x९६० रिजोल्यूशनेन उच्च-सटीक-वीडियो जनयितुं शक्यते



विडियो लिंकः https://mp.weixin.qq.com/s/fNsMxyutjVkEtX_xRnsMA

इतः परं Qingying Qingyan App प्रारम्भं करिष्यति, तथा च सर्वे उपयोक्तारः संवादस्य, चित्रस्य, विडियो, कोडस्य, एजेण्ट् जननस्य च कार्याणां पूर्णतया अनुभवं कर्तुं शक्नुवन्ति। Zhipu Qingyan इत्यस्य वेबं एप् च कवरं कर्तुं अतिरिक्तं, भवान् "AI Dynamic Photo Mini Program" इत्यत्र अपि कार्यं कर्तुं शक्नोति यत् शीघ्रं स्वस्य फ़ोने फोटो कृते गतिशीलप्रभावं प्राप्तुं शक्नोति।



Zhipu "Qingying" इत्यनेन निर्मितः विडियो ६ सेकेण्ड् दीर्घः अस्ति, तस्य रिजोल्यूशनं १४४०×९६० अस्ति ।



  • पीसी अभिगमनलिङ्कः https://chatglm.cn/
  • मोबाईल-प्रवेश-लिङ्कः: https://chatglm.cn/download?fr=web_home

ज़िपु एआइ इत्यनेन उक्तं यत् प्रौद्योगिक्याः निरन्तरविकासेन सह "किंग्इंग्" इत्यस्य जनरेशनक्षमता शीघ्रमेव लघुवीडियोनिर्माणे, विज्ञापनजनने, चलच्चित्रसम्पादने अपि उपयुज्यते।

जनरेटिव एआइ विडियो मॉडल् इत्यस्य विकासे स्केलिंग् लॉ एल्गोरिदम्स् तथा डाटा इत्येतयोः द्वयोः अपि भूमिकां निरन्तरं निर्वहति । "वयं सक्रियरूपेण मॉडलस्तरस्य अधिकदक्षतया स्केलिंग् पद्धतीनां अन्वेषणं कुर्मः।" दृढ भूमिका।"



विविधाः शैल्याः उद्धृत्य

वर्तमानस्य केषाञ्चन प्रदर्शनानां सरलपरीक्षाणां च न्यायेन Zhipu AI इत्यस्य “Qingying” इत्यस्य निम्नलिखितविशेषताः सन्ति ।

  • परिदृश्यानां, पशूनां, विज्ञानकथा, मानविकी-इतिहास इत्यादीनां विडियो-सामग्रीजननसमये प्रदर्शनं श्रेष्ठं भवति;
  • वयं येषु विडियोशैल्यां जनयितुं कुशलाः स्मः तेषु कार्टुन्शैली, वास्तविकं छायाचित्रशैली, द्वि-आयामी एनिमेशनशैली इत्यादयः सन्ति;
  • सत्ताप्रकारस्य प्रस्तुतिप्रभावस्य दृष्ट्या पशवः > वनस्पतयः > वस्तूनि > भवनानि > जनाः।

एतत् पाठेन सह चित्रैः सह विडियो जनयितुं शक्नोति, उत्पन्नशैल्या च काल्पनिक-एनिमेशनशैलीं आच्छादयति ।

विन्सेन्ट् विडियो

प्रेरणावचनम् : निम्नकोणे ऊर्ध्वं धक्कायन्तु, शनैः शनैः शिरः उत्थापयन्तु, ततः हिमशैले सहसा अजगरः प्रकटितः भवति ततः अजगरः भवन्तं दृष्ट्वा भवतः प्रति त्वरितम् आगच्छति। हॉलीवुड् चलच्चित्रशैली।



शीघ्रशब्दः : एकः mage तरङ्गयोः मन्त्रं पातयति रत्नः समुद्रजलं सङ्गृह्य जादूद्वारं उद्घाटयति।



शीघ्रं वचनम् : कवकः ऋक्षे परिणमति।



वास्तविकदृश्यं प्रति : १.

शीघ्रं वचनम् : वने मानवीयदृष्ट्या उच्छ्रितवृक्षाः सूर्यं अवरुद्धयन्ति, पत्रेषु अन्तरालद्वारा किञ्चित् सूर्यप्रकाशं प्रकाशते, टाण्डल् प्रभावः।



शीघ्रं वचनम् : कैपिबरा मनुष्यवत् स्थित्वा हस्ते आइसक्रीमम् आदाय सुखेन खादति।



tusheng video

पाठ-जनित-वीडियो-व्यतिरिक्तं Qingying इत्यत्र चित्र-जनित-वीडियो-सहितं अपि क्रीडितुं शक्नुवन्ति । Tusheng Video अधिकानि नवीनमार्गाणि क्रीडितुं आनयति, यत्र इमोटिकॉन्, विज्ञापननिर्माणं, कथानकनिर्माणं, लघुविडियोनिर्माणम् इत्यादयः सन्ति । तस्मिन् एव काले Qingying इत्यस्य आधारेण "Old Photos Animated" इति एप्लेट् अपि युगपत् प्रारब्धं भविष्यति, भवद्भिः केवलं एकस्मिन् चरणे पुरातनं फोटो अपलोड् कर्तुं आवश्यकम्, तथा च AI पुरातनसमये सघनीकृतानि छायाचित्राणि एनिमेट् कर्तुं शक्नोति।

प्रॉम्प्ट् वर्ड : एकः स्वतन्त्रतया गच्छन् रङ्गिणी मत्स्यः।



शीघ्रं वचनम् : चित्रे यः पुरुषः अस्ति सः उत्तिष्ठति, वायुः केशान् फूत्करोति।



प्रॉम्प्ट् वर्ड : तरणकुण्डस्य पृष्ठे प्लवमानं लघु पीतं बकस्य क्रीडनकं, निकटतः।



ततः च आधुनिककलायां : १.

संकेतशब्दः : कॅमेरा भिन्न-भिन्न-प्रदर्शनानि दर्शयन्तः विंटेज-टीवी-समूहस्य परितः परिभ्रमति - १९५० तमे दशके विज्ञान-कथा-चलच्चित्रं, भयानक-चलच्चित्रं, समाचाराः, स्थिरचित्रं, ७०-दशकस्य सिटकॉम-इत्यादीनि, न्यूयॉर्क-सङ्ग्रहालये स्थापितानि विशाले गैलरी-मध्ये।



युक्तिः - iPhone बहिः निष्कास्य फोटो गृह्यताम्।



न शीघ्रं शब्दाः।



भवतः सामान्यतया प्रयुक्ताः इमोटिकॉन्, Zhipu AI तान् "सीरियल्" इत्यत्र विस्तारयितुं शक्नोति ।

शीघ्रं वचनम् : चत्वारः स्वामिनः शिक्षुः च परस्परं हस्तं प्रसारयित्वा उच्चपञ्चकं कृतवन्तः, तेषां मुखयोः भ्रान्तव्यञ्जनाः आसन्।



विडियो लिंकः https://mp.weixin.qq.com/s/fNsMxyutjVkEtX_xRnsMA

शीघ्रं वचनम् : बिल्लीपुत्रः मुखं विस्तृतं उद्घाटितवान्, भ्रान्तव्यञ्जना, मुखस्य उपरि बहवः प्रश्नचिह्नानि च।



विडियो लिंकः https://mp.weixin.qq.com/s/fNsMxyutjVkEtX_xRnsMA

द्रष्टुं शक्यते यत् किङ्ग्यिंग् विविधशैल्याः सम्भालितुं शक्नोति, जनानां आविष्कारस्य प्रतीक्षया क्रीडनस्य अधिकाः उपायाः सन्ति । केवलं Zhipu Qingyan PC/APP इत्यस्मिन् "Qingying Intelligent" इति कार्ये क्लिक् कुर्वन्तु, ततः भवतः प्रत्येकं विचारं क्षणमात्रेण वास्तविकतायां परिणतुं शक्यते।

सर्वाणि स्वविकसितानि प्रौद्योगिकी

All in large model Wisdom AI बहुविधजननात्मक AI मॉडल् बहुकालात् परिनियोजयति। २०२१ तः आरभ्य ज़िपु एआइ इत्यनेन अनेके अध्ययनाः प्रकाशिताः यथा CogView (NeurIPS'21), CogView2 (NeurIPS'22), CogVideo (ICLR'23), Relay Diffusion (ICLR'24), CogView3 (2024), इत्यादयः

रिपोर्ट्-अनुसारं "Qingying" CogVideoX इत्यस्य उपरि निर्भरं भवति, यत् Zhipu AI बृहत् मॉडल-दलेन स्वतन्त्रतया विकसितस्य बृहत्-वीडियो-जनरेशन-माडलस्य नूतन-पीढी अस्ति ।

गतवर्षस्य नवम्बरमासे तस्य दलेन विन्सेन्ट् ग्राफ् मॉडल् CogView2 इत्यस्य आधारेण पाठतः विडियोजननप्रतिरूपं CogVideo इति निर्मितम्, तदनन्तरं तत् मुक्तस्रोतरूपेण कृतम्



CogVideo इत्यस्य ९.४ अरब पैरामीटर् सन्ति । तदतिरिक्तं, CogVideo पाठविवरणानाम् आधारेण 3D वातावरणं जनयति तथा च महत् प्रशिक्षणं परिहरितुं पूर्वप्रशिक्षितानां मॉडलानां प्रत्यक्षं उपयोगं कर्तुं शक्नोति।

Qingying Base इत्यस्य विडियो जनरेशन मॉडल् अस्मिन् समये CogVideoX अस्ति, यत् पाठस्य, समयस्य, स्थानस्य च त्रीणि आयामानि एकीकृत्य स्थापयितुं शक्नोति इदं Sora इत्यस्य एल्गोरिदम् डिजाइनं अपि निर्दिशति अनुकूलनस्य माध्यमेन CogVideoX पूर्वपीढीयाः अपेक्षया उत्तमम् अस्ति । CogVideo).अनुमानस्य गतिः ६ गुणा वर्धिता।

ओपनएआइ इत्यस्य सोरा इत्यस्य उद्भवेन एआइ इत्यनेन विडियोजनने महती प्रगतिः कृता, परन्तु अधिकांशमाडलानाम् अद्यापि सुसंगततायाः तार्किकसङ्गतिः च सह विडियोसामग्रीजनने कष्टानि सन्ति

एतासां समस्यानां समाधानार्थं ज़िपु एआइ इत्यनेन एकं कुशलं त्रि-आयामी-विविधता-स्वयं-एन्कोडर-संरचना (3D VAE) विकसितम्, यत् मूल-वीडियो-स्थानं २% यावत् संपीडयितुं शक्नोति, येन मॉडल-प्रशिक्षणस्य व्ययः बहुधा न्यूनीकरोति, प्रशिक्षणस्य कठिनतां च बहुधा न्यूनीकरोति

मॉडल संरचना मुख्य मॉडल घटकरूपेण Causal 3D convolution इत्यस्य उपयोगं करोति, तथा च autoencoders इत्यत्र सामान्यतया उपयुज्यमानं attention module इत्येतत् दूरीकरोति, येन model इत्यस्य भिन्नसंकल्पेषु स्थानान्तरणस्य क्षमता भवति

तस्मिन् एव काले, काल-आयामे कारणात्मक-विक्षेपः मॉडल-वीडियो-एन्कोडिंग्-डिकोडिंग्-अनुक्रमं अग्रे पृष्ठतः स्वतन्त्रं करोति, यत् सूक्ष्म-ट्यूनिङ्ग-माध्यमेन मॉडलस्य उच्चतर-फ्रेम-दरेषु, दीर्घतर-दृश्येषु च विस्तारयितुं साहाय्यं करोति

तदतिरिक्तं, विडियो जनरेशन इत्यस्य समस्या अपि अस्ति यत् अधिकांशं विडियो डेटा तदनुरूपं वर्णनात्मकं पाठं न्यूनं भवति अथवा अस्य कारणात्, Zhipu AI इत्यनेन स्वयमेव विशालविडियो आँकडानां कृते अन्ततः अन्तः विडियो अवगमनप्रतिरूपं विकसितम् अस्ति यत् सामग्रीं उपयुक्तं भवति, ततः उच्चगुणवत्तायुक्तानां विडियो-पाठयुग्मानां बहूनां संख्यां निर्मान्ति, येन प्रशिक्षितं प्रतिरूपं निर्देशैः सह अत्यन्तं अनुरूपं भवति ।

अन्ते उल्लेखनीयं यत् Zhipu AI इत्यनेन स्वयमेव एकं ट्रांसफार्मर आर्किटेक्चर विकसितम् अस्ति यत् पाठं, समयं, स्थानं च एकीकृत्य एतत् आर्किटेक्चरं पारम्परिकं क्रॉस् अटेंशन मॉड्यूल् न उपयुज्यते, अपितु इनपुट् स्टेज इत्यत्र टेक्स्ट् एम्बेडिंग्स् तथा विडियो एम्बेडिंग्स् इत्येतयोः संयोजनं करोति द्वयोः मोडालिटीयोः मध्ये अधिकं पूर्णतया अन्तरक्रियां कर्तुं।

तथापि, पाठ-विडियो-विशेषता-स्थानेषु बृहत्-अन्तराणि सन्ति, Zhipu AI-इत्येतत् विशेषज्ञ-अनुकूली-स्तर-norm-द्वारा पृथक् पृथक् प्रक्रियां करोति, येन मॉडल्-इत्यनेन दृश्य-सूचनाः शब्दार्थ-सूचनायाः सह उत्तम-संरेखणं कर्तुं मापदण्डानां कुशलतापूर्वकं उपयोगः भवति

Zhipu AI इत्यनेन उक्तं यत् अनुकूलनप्रौद्योगिक्याः माध्यमेन Zhipu AI इत्यस्य जननात्मकस्य विडियो मॉडलस्य अनुमानवेगः 6 गुणा वर्धितः अस्ति । सम्प्रति 6s विडियो जनयितुं मॉडलेन व्ययितः सैद्धान्तिकः समयः ३० सेकेण्ड् अस्ति ।

अधुना "किङ्ग्यिंग्" इत्यस्य प्रक्षेपणेन सह विडियो जनरेशन ट्रैक इत्यस्य प्रमुखः खिलाडी ज़िपु एआइ पुनः प्रकटितः अस्ति ।

अनुप्रयोगानाम् अतिरिक्तं यत् सर्वे प्रयासं कर्तुं शक्नुवन्ति, Qingying API अपि एकत्रैव बृहत् मॉडल ओपन प्लेटफॉर्म bigmodel.cn इत्यत्र प्रारब्धः अस्ति उद्यमाः विकासकाः च एपीआई इत्यस्य आह्वानं कृत्वा Wensheng Video तथा Tusheng Video इत्येतयोः मॉडलक्षमतायाः अनुभवं कर्तुं शक्नुवन्ति।

यथा यथा विभिन्नाः कम्पनयः एआइ-वीडियो-जनरेशन-कार्यं निरन्तरं कुर्वन्ति, अस्मिन् वर्षे जनन-एआइ-प्रतियोगिता श्वेत-उष्ण-पदे प्रविष्टा अस्ति । अधिकांशप्रयोक्तृणां कृते अधिकाः विकल्पाः सन्ति: अधुना, येषां जनानां विडियोनिर्माणपृष्ठभूमिः नास्ति तथा च व्यावसायिकसामग्रीनिर्मातारः द्वौ अपि बृहत् मॉडलक्षमतायाः साहाय्येन विडियोनिर्माणं प्राप्तुं शक्नुवन्ति।