समाचारं

सोरा इत्यस्य एआइ संस्करणम् अत्र अस्ति!सर्वेषां कृते निःशुल्कं असीमितं च अस्ति, भवान् इदं क्रीडितुं शक्नोति यदि भवतां समीपे मोबाईल-फोनः अस्ति, एपिआइ अपि उद्घाटितः अस्ति

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

जिन् लेई आओफेइ मन्दिरात् आगच्छति
Qubits |.सार्वजनिक खाता QbitAI

अधुना एव,बुद्धि स्पेक्ट्रम ऐसोरस्य एकं संस्करणं जातम्, नामस्पष्ट छाया

अग्रे विना, Qingying इत्यनेन उत्पन्नानि चित्राणि अवलोकयामःलघुचलच्चित्रम्



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

अस्तिविन्सेन्ट् विडियोयथा, यदि भवान् Qingying इत्यस्मै प्रॉम्प्ट् ददाति तर्हि भवान् शक्नोतितस्य कल्पनाशक्तिं आव्हानं कुर्वन्तु

साइबरपङ्क्-शैल्याः नगररात्रिदृश्ये ज्वलन्तैः नीयन-प्रकाशैः सह हस्तगतः कॅमेरा शनैः शनैः जूम-इन् करोति, यत्र उच्च-प्रौद्योगिकी-उपकरणैः मरम्मतं कुर्वन् यांत्रिक-शैल्याः लघु-वानरः दर्शयति, यः ज्वलन्तैः इलेक्ट्रॉनिक-उपकरणैः, भविष्य-सज्जा-सामग्रीभिः च परितः अस्ति साइबरपंकशैली, रहस्यमयवातावरणं, 4K उच्चपरिभाषा।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

इदं साइबरपङ्क्-भविष्यस्य स्वादेन च परिपूर्णम् अस्ति, अस्माकं मनसि वयं यत् चित्रं कल्पयामः तस्य समीपे एव अस्ति ।

व्यतिरिक्तं चविन्सेन्ट् विडियोतदतिरिक्तं किङ्ग्यिंग् अस्मिन् समयेtusheng videoसामर्थ्यानि अपि एकत्र मुक्ताः अभवन् ।

अधुना, भवतः कल्पनायाः, किङ्ग्यिंग् इत्यस्य सृजनशीलतायाः च तुलनां कुर्मः यत् कोऽपि श्रेष्ठः इति।

प्रथमं चित्रं पश्यन्तु——गुहा सभ्यता



ततः निम्नलिखितविडियो AI Power इत्यस्य उपयोगेन Qingying इत्यनेन निर्मितं स्कोरं च कृतं संस्करणम् अस्ति:



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

विडियो अन्ते किङ्ग्इंग् वस्तुतः मुख्यचतुष्कोणेषु कॅमेरा कम्पयितुं शिक्षितवान्, येन विडियो अधिकं रहस्यमयः अभवत् ।

तदनन्तरं द्वितीयपरिक्रमम् आगच्छामः, तथापि प्रथमं एकत्र चित्राणि पश्यामः——अग्नि अजगर श्वास



अस्य चित्रस्य आधारेण Qingying इत्यनेन निर्मितः विडियो एवं उद्घाटितः अस्ति ।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

अहं कल्पयितुं शक्नोमि यत् अजगरः अग्निं निःश्वसितुं सज्जः अस्ति, परन्तु मया न अपेक्षितं यत् सः भूमौ ग्रामं दहति, परन्तु तत् अपि युक्तम् आसीत्

परन्तु Zhipu AI इत्यस्य सम्पूर्णं प्रक्षेपणकार्यक्रमं दृष्ट्वा उच्चपरिभाषा तथा चित्रस्थिरता प्रभावाः केवलं मुख्यविषयाणां भागः एवकल्याण मूल्यपूर्णम् अस्ति !

सर्वेषां कृते निःशुल्कं, पङ्क्तिः नास्ति, असीमितसमयः!

अपि च, प्रभावः अस्ति यत् स्वस्य विडियोभ्यः प्रत्यक्षतया विशालं मॉडलं जनयितुं शक्यते ।कोगवीडियोक्षमतापूर्ण शक्ति, क्षुधाविपणनं मा कुरुत ।

Zhipu AI इत्यस्य अनुसारं 6s 1440x960 इति विडियो निर्मातुं केवलं 30 सेकेण्ड् यावत् समयः भवति, तथा च मॉडल् अनुमानस्य गतिः षड्गुणा वर्धिता भवति ।



न केवलं, अधुना झीपु किङ्ग्यन् इत्यत्रPC संस्करणम्तथाए.पी.पीवेबसाइट् इत्यत्र Wensheng Video/Tusheng Video इत्यस्य कार्याणि उद्घाटितानि सन्ति;एप्लेट्स्अपरपक्षे सम्प्रति केवलं तुशेङ्ग-वीडियो-समर्थनं करोति ।

विकासकानां कृते अपि शुभसमाचारः अस्ति अस्मिन् समये विडियो बृहत् मॉडल् जनयति।एपिआइपूर्णतया अपि उद्घाटितम् अस्ति, आम्घरेलु प्रथमंअहो!

मया वक्तव्यं यत् सुविधायाः कार्यक्षमतायाः च दृष्ट्या Zhipu AI इत्यनेन अपि अस्मिन् समये कीलकं कृतम् अस्ति।

अतः अग्रिमम्, किञ्चित् वास्तविकपरीक्षणं कर्तुं Zhipu AI इत्यस्य video generation function इत्यस्य उपयोगस्य समयः अस्ति ।

मापित बुद्धि स्पेक्ट्रम एआई संस्करण सोरा

प्रथमं परीक्षां कुर्मःविन्सेन्ट् विडियोपरिणाम।

Zhipu Qingyan APP अथवा PC संस्करणं उद्घाटयन्तु, ततः Vincent Video इत्यस्य प्रवेशद्वारं मुख्यसंवादे भविष्यति।





एपीपी उदाहरणरूपेण गृहीत्वा अन्तरफलकं निम्नलिखितम् अस्ति ।



तदा सर्वं सज्जं भवति, केवलं प्रॉम्प्ट् प्रविशन्तु ।

परन्तु ज्ञातव्यं यत् एतत् एव विडियोजननस्य सफलतायाः असफलतायाः वा कुञ्जी अस्ति ।

एकः महत्त्वपूर्णः सिद्धान्तः अस्ति : १. ग्रन्थि ! संरचना! सेक्स !सूत्रं यथा, -- १.

  • सरल सूत्रम् : [कॅमेरा गतिः] + [निर्माणदृश्यम्] + [अधिकविवरणम्]
  • जटिल सूत्रम् : [लेन्सस्य भाषा] + [प्रकाशः छाया च] + [विषयः (विषयस्य वर्णनम्)] + [विषयस्य गतिः] + [दृश्यः (दृश्यस्य वर्णनम्)] + [भावना/वातावरण/शैली] ।

अतः प्रभावः कियत् दुष्टः भविष्यति ?

यथा यदि भवान् केवलं प्रविशति तर्हि :लघु बालकः काफीं पिबति, उत्पन्नं परिणामं एतादृशं भवति :



इदं तु अत्यन्तं सन्तोषजनकं, परन्तु एकदृष्ट्या एआइ इव अनुभूयते।

परन्तु यदि सूत्रानुसारं प्रॉम्प्ट् शब्दाः समृद्धाः भवन्ति तर्हि उद्घाटनविधिः सर्वथा भिन्ना भविष्यति-

कॅमेरा पैन कृत्वा उद्यानस्य पीठिकायां उपविष्टः बालकः वाष्पयुक्तं काफीकपं धारयति इति प्रकाशयति। सः नीलशर्टं धारयन् प्रसन्नः दृश्यते स्म, पृष्ठभूमितः वृक्षाकारं उद्यानं, पत्रेषु सूर्यप्रकाशः छानति स्म ।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

न, चलचित्रस्य भावः सहसा बहिः आगतः।

परन्तु अधुना एव सूत्रस्य अतिरिक्तं अनेके महत्त्वपूर्णाः सिद्धान्ताः सन्ति येषां सन्दर्भं भवान् अपि कर्तुं शक्नोति ।

प्रथमः,पुनरावृत्तिः शक्तिः अस्ति

प्रॉम्प्ट् इत्यस्य विभिन्नेषु भागेषु कीवर्ड्स् पुनरावृत्तिः अथवा सुदृढीकरणं आउटपुट् इत्यस्य स्थिरतां सुधारयितुम् सहायकं भवितुम् अर्हति । यथा, कॅमेरा अति-उच्चवेगेन दृश्यस्य माध्यमेन उड्डीयते ("सुपर हाई स्पीड्" "फास्ट्" इति शब्दाः पुनरावृत्तिशब्दाः सन्ति) ।

द्वितीयं, दृश्ये किं किं दृश्यते इति विषये स्वस्य प्रेरणानि केन्द्रीक्रियितुं प्रयतध्वम्। यथा - मेघरहितं आकाशं न तु निर्मलं आकाशं संकेतयितव्यम् ।

एतानि सूत्राणि सिद्धान्तानि च स्थापयित्वा वयं तस्य प्रयासं कर्तुं शक्नुमः ।

शृगालः शृगालः चन्द्रे मिलित्वा तारकान् पश्यति स्म ।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

यथार्थचित्रणं, निकटपरिधिः, भूमौ सुप्तस्य चीतास्य, तस्य शरीरस्य किञ्चित् उदयं पतनं च।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

तदतिरिक्तं Zhipu AI इत्यस्य परिचयानुसारं यदि भवान् कतिपयानि वाराः प्रयतते तर्हि अप्रत्याशितप्रभावाः भवितुम् अर्हन्ति (तथापि निःशुल्कम् अस्ति) ।

विन्सेन्ट् इत्यस्य विडियो इत्यस्य अनन्तरं पुनः परीक्षणं करिष्यामःtusheng video

अत्र द्वौ प्रमुखौ तन्त्रौ अपि स्तः ।

प्रथमं तु अपलोड् कृतानि चित्राणि यथाशक्ति स्पष्टानि भवेयुः, अधिमानतः ३:२ अनुपातेन jpg अथवा png प्रारूपेण च ।

द्वितीयः अद्यापि Prompt अस्ति, .अवश्यं विषयः भवितुमर्हति, ततः "[Subject]+[Subject Movement]+[Background]+[Background Movement]" इति सूत्रानुसारं Prompt लिखितुं शक्यते ।

अवश्यं शीघ्रं विना सम्भवति, परन्तु एआइ स्वस्य विचाराधारितं विडियो जनयिष्यति।

यथा, वयं Tang Monk इत्यस्य फोटो "feed" कुर्मः:



ततः अधुना दत्तस्य सूत्रप्रविधिनुसारं प्रॉम्प्ट् यथा भवति ।

ताङ्ग सेङ्गः हस्तं प्रसारयित्वा सूर्यचक्षुः धारितवान् ।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

अस्मात् क्रीडायाः (कार्यं कर्तुं) अनेकाः उपायाः सन्ति ।

यथा, जेन् हुआन् शेन् मेइझुआङ्ग च "भित्तिं भङ्ग्य" परस्परं आलिंगयन्तु :

जेन् हुआन् मेइझुआङ्गः पर्दायां आलिंगनं करोति।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

पुरातनचित्रं पुनः सजीवीकरणं सुलभम् अस्ति:

हु शिः परिवर्त्य गतः।



विडियो पता: https://mp.weixin.qq.com/s/XmXR-XZtMvhZHtLTCxU4ZQ

विभिन्नप्रभावेभ्यः न्याय्यं चेत्, Zhipu AI इत्यस्य Qingying एकप्रकारस्य Sora अस्ति यस्य प्रत्यक्षतया उपयोगः कर्तुं शक्यते ।

अतः अग्रिमः प्रश्नः अस्ति यत् -

कथं कृतम् ?

विडियोजननस्य क्षेत्रे आउटपुट् सामग्रीयाः स्थिरता, सुसंगतता च प्रमुखकारकाः सन्ति ये अन्तिमप्रभावं निर्धारयन्ति ।

एतदर्थं झीपु एआइ इत्यस्य मते दलेन एकं कुशलं विकसितम्त्रि-आयामी भिन्नात्मक स्व-एन्कोडर संरचना(3D VAE), मूल-वीडियो-स्थानं आकारस्य 2% यावत् संपीडयति, येन विडियो-प्रसार-जनन-प्रतिरूपस्य प्रशिक्षण-व्ययस्य प्रशिक्षण-कठिनता च बहुधा न्यूनीभवति

आदर्शसंरचनायाः दृष्ट्या झीपु-दलः स्वीकरोतिकारणात्मकं त्रिविमविवर्तनम्(कारणात्मकं 3D परिवर्तनम्) मुख्यः आदर्शघटकः अस्ति, तथा च स्वयम्-एन्कोडर्-मध्ये सामान्यतया प्रयुक्तं ध्यान-मॉड्यूल् निष्कासितम् अस्ति, येन मॉडल्-इत्यस्मै भिन्न-भिन्न-संकल्पेषु प्रवासनस्य क्षमता प्राप्यते

तस्मिन् एव काले, काल-आयामे कारण-विवर्तनस्य रूपं विडियो-एन्कोडिंग् तथा डिकोडिंग् इत्येतयोः कृते अग्रतः पृष्ठतः अनुक्रम-स्वतन्त्रतां प्राप्तुं अपि सक्षमं करोति अस्य उद्देश्यं फाइनस्य माध्यमेन उच्चतर-फ्रेम-दरं दीर्घकालं च सामान्यीकरणं सुलभं कर्तुं भवति -ट्यूनिंग ।

अभियांत्रिकीनियोजनस्य दृष्ट्या झीपु एआइ समयपरिमाणस्य आधारेण भवति ।क्रम समानान्तरता(Temporal Sequential Parallel) परिवर्तनात्मकं स्वयम्-एन्कोडरं सूक्ष्मतया ट्यून् करोति, परिनियोजयति च यत् सः लघुतर-ग्राफिक्स्-स्मृति-पदचिह्नेन सह अत्यन्तं उच्च-फ्रेम-दर-वीडियो-इत्यस्य एन्कोडिंग्-डिकोडिंग्-समर्थनं कर्तुं सक्षमं करोति



परन्तु सामग्रीयाः स्थिरतायाः सुसंगततायाः च अतिरिक्तं विडियोजनने अन्यत् समस्या अस्ति - वर्तमानस्य अधिकांशस्य विडियोदत्तांशस्य तदनुरूपं वर्णनात्मकपाठस्य अभावः अस्ति अथवा वर्णनस्य गुणवत्ता न्यूना भवति

अस्य कृते Zhipu AI इत्यनेन विशाल-वीडियो-आँकडानां कृते विस्तृतं सामग्री-अनुकूलं च विवरणं जनयितुं अन्तः अन्तः विडियो-अवगमन-प्रतिरूपं विकसितम् अस्ति ।

एवं प्रकारेण, मॉडलस्य पाठबोधस्य निर्देशस्य अनुसरणस्य च क्षमतां वर्धयितुं शक्यते, येन उत्पन्नं विडियो उपयोक्तृनिवेशेन सह अधिकं सुसंगतं भवति तथा च अतिदीर्घं जटिलं च प्रॉम्प्ट् निर्देशं अवगन्तुं समर्थं भवति

अन्ते ज़िपु एआइ इत्यनेन Transformer आर्किटेक्चर अपि विकसितम् यत् पाठस्य, समयस्य, स्थानस्य च त्रयः आयामाः एकीकृत्य स्थापयति ।

इदं पारम्परिकं क्रॉस् एण्टेन्शन मॉड्यूल् परित्यजति, परन्तु द्वयोः मोडालिटीयोः सह अधिकपूर्णतया अन्तरक्रियां कर्तुं इनपुट् स्टेज मध्ये टेक्स्ट् एम्बेडिंग् तथा विडियो एम्बेडिंग् च संयोजयति

परन्तु द्वयोः मोडालिटीयोः विशेषतास्थानानि बहु भिन्नानि सन्ति, दलेन पाठस्य, विडियो मोडालिटी च पृथक् पृथक् संसाधितुं विशेषज्ञानुकूली लेयरनॉर्मस्य उपयोगः कृतः, येन प्रसारणप्रतिरूपे समयपदसूचना अधिकप्रभावितेण उपयोक्तुं शक्यते, making शब्दार्थसूचनायाः सह दृश्यसूचनाः उत्तमरीत्या संरेखयितुं मॉडलः मापदण्डानां कुशलतापूर्वकं उपयोगं कर्तुं शक्नोति।

ध्यानमॉड्यूलः 3D पूर्णाध्यानतन्त्रं स्वीकरोति पूर्वाध्ययनेषु प्रायः पृथक्कृतस्थानिक-काल-अवधानस्य उपयोगः भवति अथवा स्थानिक-काल-अवधानस्य बृहत् परिमाणं आवश्यकं भवति, यत् एकस्मिन् समये, तेषां कृते कठिनतां बहु वर्धयति न शक्नोति विद्यमानकुशलप्रशिक्षणरूपरेखासु अनुकूलतां प्राप्तुं।

स्थितिसङ्केतनमॉड्यूलेन 3D RoPE इत्यस्य डिजाइनं कृतम्, यत् समयमात्रायां फ्रेमानाम् मध्ये सम्बन्धं गृहीतुं तथा च विडियोमध्ये दीर्घदूरपर्यन्तं निर्भरतां स्थापयितुं अधिकं अनुकूलम् अस्ति

उपर्युक्तं झीपुः किङ्ग्यिंग् कथं जातः इति पृष्ठतः प्रमुखं तकनीकीबलम् अस्ति ।

एकं अधिकं वस्तु

अस्य निःशुल्कसंस्करणस्य अतिरिक्तं Zhipu AI इत्यनेन एकं सशुल्कसंस्करणमपि प्रारब्धम् अस्ति, मूल्यं निम्नलिखितम् अस्ति ।

  • ५ युआन् : १.२४ घण्टानां उच्चगतिलाभानां तालान् उद्घाटयन्तु
  • १९९ युआन्: उच्चगति-अधिकारस्य एकवर्षं अनलॉक् कुर्वन्तु

वार्षिकशुल्कस्य गणनां कुरुत, अर्थात्प्रतिदिनं केवलं ५ सेण्ट्

खैर, वस्तुतः किञ्चित् सुगन्धितं गन्धं प्राप्नोति।

अनुभवलिङ्कः अधः अस्ति इच्छुकाः मित्राणि तस्य प्रयोगं कर्तुं शक्नुवन्ति~

https://chatglm.cn/वीडियो