समाचारं

ECCV 2024|BlazeBVD, अन्धविडियो-विच्छेदनस्य सामान्यविधिः, अत्र अस्ति, सुन्दराणि चित्राणि

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

  • AIxiv इति स्तम्भः एकः स्तम्भः अस्ति यत्र मशीन् हार्ट् शैक्षणिकं तकनीकीं च सामग्रीं प्रकाशयति । विगतकेषु वर्षेषु, हार्ट आफ् द मशीन् एआइक्सिव् स्तम्भे २००० तः अधिकानि प्रतिवेदनानि प्राप्तानि, येषु विश्वस्य प्रमुखविश्वविद्यालयानाम्, कम्पनीनां च शीर्षप्रयोगशालाः कवराः सन्ति, येन प्रभावीरूपेण शैक्षणिकविनिमयस्य प्रसारस्य च प्रचारः कृतः यदि भवतां कृते उत्तमं कार्यं अस्ति यत् भवान् साझां कर्तुम् इच्छति तर्हि कृपया निःशङ्कं योगदानं दातुं वा अस्माभिः सह सम्पर्कं कृत्वा रिपोर्टिंग् कर्तुं शक्नोति। प्रस्तुति ईमेल: [email protected];

अन्तिमेषु वर्षेषु लघु-वीडियो-पारिस्थितिकीतन्त्रं तीव्रगत्या उद्भूतम् अस्ति, लघु-वीडियो-परिसरस्य रचनात्मकाः सम्पादन-उपकरणाः च निरन्तरं उद्भवन्ति विदेशेषु च मात्रा वर्धते एव।

Wink इत्यस्य चित्रगुणवत्तामरम्मतकार्यस्य लोकप्रियतायाः पृष्ठतः Meitu इत्यस्य अन्वेषणं भवति यत् उपयोक्तृणां विडियोनिर्माणवेदनाबिन्दवः यथा धुन्धलाः चित्राणि, तीव्रः कोलाहलः, तथा च विडियो सम्पादनअनुप्रयोगानाम् आग्रहस्य त्वरितविमोचनस्य मध्यं भवति based on मेइतु इमेजिंग रिसर्च इन्स्टिट्यूट् (MT Lab) इत्यस्य शक्तिशाली विडियो बहाली तथा विडियो वर्धन प्रौद्योगिकी समर्थनेन सह वर्तमानकाले इमेज क्वालिटी रिस्टोरेशन-एचडी, इमेज क्वालिटी रिस्टोरेशन-यूएचडी, इमेज क्वालिटी रिस्टोरेशन-पोर्ट्रेट एन्हांसमेण्ट्, रिजोल्यूशन इन्हांसमेण्ट् तथा अन्यकार्यं प्रारब्धम् अस्ति .

अद्यतने मेइतु इमेजिंग रिसर्च इन्स्टिट्यूट् (MT Lab) तथा च चीनी विज्ञान अकादमी विश्वविद्यालयेन एकं नवीनं STE-आधारितं blind video deflickering (BVD) पद्धतिं BlazeBVD प्रस्तावितं, यस्य उपयोगः अज्ञातप्रकाशस्य झिलमिलाहटस्य न्यूनगुणवत्तायुक्तानां विडियोनां संसाधनार्थं भवति , यथासम्भवं मूल-वीडियो-सामग्रीणां वर्णस्य च अखण्डतां निर्वाहयन्, तथा च शीर्ष-सङ्गणक-दृष्टि-सम्मेलनेन ECCV 2024 इत्यनेन स्वीकृतम् अस्ति ।



पेपर लिङ्कः https://arxiv.org/pdf/2403.06243v1

BlazeBVD विडियो झिलमिलना परिदृश्यं लक्ष्यं करोति।वीडियो झिलमिलाहटः सहजतया अस्थायी स्थिरतां प्रभावितं कर्तुं शक्नोति, यत् उच्चगुणवत्तायुक्तं विडियो उत्पादनार्थं आवश्यकं शर्तं भवति दुर्बलं विडियो झिलमिलनं अपि दृश्यानुभवं गम्भीररूपेण प्रभावितं कर्तुं शक्नोति। कारणं सामान्यतया शूटिंग्-उपकरणस्य दुर्बल-शूटिंग्-वातावरणस्य, हार्डवेयर-सीमानां च कारणेन भवति, यदा च इमेज-प्रोसेसिङ्ग्-प्रौद्योगिकी विडियो-फ्रेम्-मध्ये प्रयुक्ता भवति तदा प्रायः एषा समस्या अधिका भवति तदतिरिक्तं, अद्यतन-वीडियो-जनन-कार्येषु अपि बहुधा झिलमिल-आर्टिफैक्ट्-वर्ण-विकृति-विषयाः उत्पद्यन्ते, यत्र जनन-विरोधी-जालस्य (GAN) तथा प्रसार-प्रतिरूपस्य (DM) आधारिताः कार्याणि सन्ति अतः विभिन्नेषु विडियो प्रोसेसिंग परिदृश्येषु विडियो फ्लिकरं समाप्तुं विडियो सामग्रीयाः अखण्डतां निर्वाहयितुम् Blind Video Deflickering (BVD) इत्यस्य उपयोगस्य अन्वेषणं महत्त्वपूर्णम् अस्ति

बीवीडी कार्यं विडियो झिलमिलस्य कारणेन डिग्रीयाश्च प्रभावितं न भवति, तथा च एतादृशेषु कार्येषु वर्तमानकाले ध्यानं मुख्यतया पुरातनचलच्चित्रपुनर्स्थापनं, उच्चगतिकैमराशूटिंग्, वर्णविकृतिप्रक्रियाकरणं अन्यकार्यं च समाविष्टम् अस्ति यत् अस्ति विडियो झिलमिलप्रकारेन, झिलमिलाहटेन च कार्यैः सह किमपि सम्बन्धः नास्ति, तथा च कार्याणि येषां अतिरिक्तमार्गदर्शनसूचनाः यथा विडियो झिलमिलप्रकारः, सन्दर्भविडियोनिवेशः इत्यादीनि विना केवलं एकस्मिन् झिलमिलविडियोमध्ये संचालितुं आवश्यकम्। तदतिरिक्तं, बीवीडी अधुना मुख्यतया पारम्परिक-छननम्, बलात् काल-संगतिः, एटलस-विधिषु च केन्द्रितः अस्ति अतः यद्यपि गहनशिक्षण-विधिभिः बीवीडी-कार्य्येषु महती प्रगतिः अभवत् तथापि पूर्वज्ञानस्य अभावात् अनुप्रयोगस्तरस्य तेषां महती बाधा भवति अद्यापि बीवीडी अनेकानि आव्हानानि सम्मुखीभवति।

BlazeBVD: अन्धविडियोनां डी-फ्लिकर प्रभावं प्रभावीरूपेण सुधारयन्तु

क्लासिक झिलमिलनिष्कासनविधिना स्केल-समयसमीकरणेन (STE) प्रेरितः BlazeBVD हिस्टोग्राम-सहायतायुक्तं समाधानं परिचययति । इमेज हिस्टोग्रामः पिक्सेलमूल्यानां वितरणरूपेण परिभाषितः अस्ति फ्रेममध्ये पिक्सेलमूल्यानि स्थापयन्ति, तस्मात् विडियोस्य दृश्यस्थिरतायां सुधारः भवति । यद्यपि STE केवलं केषाञ्चन लघु झिलमिलानां कृते प्रभावी भवति तथापि सत्यापयति यत् :

हिस्टोग्रामः पिक्सेलमूल्यानां अपेक्षया बहु अधिकं संकुचितः भवति तथा च प्रकाशस्य, झिलमिलसूचनायाः च सम्यक् चित्रणं कर्तुं शक्नोति ।

हिस्टोग्राम-अनुक्रमस्य स्निग्ध-वीडियो-मध्ये दृग्गतरूपेण लक्ष्यमाणः झिलमिलः नास्ति ।

अतः अन्ध-वीडियो-वि-झिलमिलीकरणस्य गुणवत्तां गतिं च सुधारयितुम् STE तथा हिस्टोग्रामात् संकेतानां उपयोगः सम्भवः अस्ति ।

एकल-चतुष्कोण-सङ्ग्रहान्, फ़िल्टर-प्रकाश-नक्शान्, एक्सपोजर-मास्क-नक्शान् च जनयितुं एतान् हिस्टोग्रामान् स्मूथ् कृत्वा, BlazeBVD प्रकाशस्य उतार-चढावस्य तथा च अधिक-अथवा-अन्तर्-एक्सपोजरस्य सम्मुखे द्रुतं स्थिरं च बनावट-पुनर्प्राप्तिं सक्षमं करोति पूर्वगहनशिक्षणविधिभिः सह तुलने, BlazeBVD प्रथमवारं BVD कार्याणां शिक्षणजटिलतां न्यूनीकर्तुं हिस्टोग्रामस्य सावधानीपूर्वकं उपयोगं करोति, शिक्षणस्य विडियोदत्तांशस्य जटिलतां संसाधनस्य उपभोगं च सरलीकरोति, अस्य मूलं STE इत्यस्य flicker prior इत्यस्य उपयोगः अस्ति, यत्र A फ़िल्टर कृते अपि अस्ति प्रकाशमानचित्रं यत् वैश्विक-झिलमिलस्य निष्कासनस्य मार्गदर्शनं करोति, एकैकः फ्रेम-समूहः यः झिलमिल-चतुष्कोण-सूचकाङ्कानां पहिचानं करोति, तथा च एकः एक्सपोजर-नक्शा यः अति-प्रकाश-प्रकाशेन अथवा अन्धकारेण स्थानीयतया प्रभावितानां प्रदेशानां पहिचानं करोति

एकस्मिन् समये, फ्लिकर प्राइयर्स् इत्यस्य उपयोगेन, BlazeBVD एकं वैश्विकं फ्लिकर रिमूवल मॉड्यूल (GFRM) तथा एकं स्थानीयं फ्लिकर रिमूवल मॉड्यूल (LFRM) च संयोजयति यत् व्यक्तिगतसमीपस्थस्य फ्रेमस्य वैश्विकप्रकाशं स्थानीयं एक्सपोजर बनावटं च प्रभावीरूपेण सम्यक् करोति तदतिरिक्तं, अन्तर-फ्रेम-स्थिरतां वर्धयितुं, बहुकालस्य उपभोगं विना कार्यक्षमतायाः उन्नयनार्थं लघुसमयजालं (TCM) एकीकृतं भवति



चित्र 1: अन्ध-वीडियो-विच्छेदन-कार्यस्य विषये BlazeBVD-पद्धत्याः विद्यमान-विधिषु च परिणामानां तुलना

विशेषतः BlazeBVD इत्यस्य त्रयः चरणाः सन्ति : १.

प्रथमं, प्रकाशस्थाने विडियो-फ्रेमस्य हिस्टोग्राम-अनुक्रमं सम्यक् कर्तुं, एकल-फ्रेम-सेट्, फ़िल्टर-प्रकाश-नक्शाः, एक्सपोजर-नक्शाः च समाविष्टाः फ्लिकर्-प्राइयर्स् निष्कासयितुं STE-प्रवर्तनं भवति

द्वितीयं, यतः फ़िल्टर-प्रकाशन-नक्शानां स्थिर-काल-प्रदर्शनं भवति, अतः तेषां उपयोगः वैश्विक-झिलमिल-निष्कासन-मॉड्यूलस्य (GFRM) कृते संकेत-स्थितीनां रूपेण भविष्यति, यस्मिन् 2D-जालम् अस्ति, येन विडियो-चतुष्कोणानां वर्ण-सुधारस्य मार्गदर्शनं भवति अपरपक्षे, स्थानीयः झिलमिलनिष्कासनमॉड्यूलः (LFRM) प्रकाशीयप्रवाहसूचनायाः आधारेण स्थानीयप्रकाशननक्शेन चिह्नितान् अतिप्रकाशितान् अथवा अन्धकारमयक्षेत्रान् पुनः प्राप्तुं शक्नोति

अन्ते सर्वेषां फ्रेम्स-संसाधनाय हल्कं काल-जालं (TCM) प्रवर्तते, यस्मिन् अनुकूल-मास्क-भारित-हानिः विडियो-सङ्गतिं सुधारयितुम् डिजाइनं भवति

सिंथेटिक-वीडियो, वास्तविक-वीडियो, उत्पन्न-वीडियो च इति विषये व्यापक-प्रयोगानाम् माध्यमेन वयं BlazeBVD इत्यस्य श्रेष्ठगुणात्मकं परिमाणात्मकं च परिणामं प्रदर्शयामः, मॉडल-अनुमान-गतिम् अवाप्नुमः यत् अत्याधुनिक-माडल-अनुमान-वेगात् १० गुणाधिकं द्रुततरं भवति



चित्र 2: BlazeBVD इत्यस्य प्रशिक्षणं अनुमानप्रक्रिया च

प्रयोगात्मकपरिणाम

बहुसंख्याकाः प्रयोगाः दर्शयन्ति यत् अन्ध-वीडियो-झिलमिल-कार्यस्य सामान्यपद्धतिः BlazeBVD, सिंथेटिक-वास्तविक-आँकडा-समूहेषु पूर्वकार्यं अधिकं करोति, तथा च एब्लेशन-प्रयोगाः BlazeBVD-द्वारा डिजाइनं कृतानां मॉड्यूलानां प्रभावशीलतां अपि सत्यापयन्ति



सारणी 1: आधाररेखाविधिभिः सह परिमाणात्मकतुलना



चित्रम् ३ : आधाररेखाविधिभिः सह दृश्यतुलना



चित्रम् ४ : विच्छेदनप्रयोगः

उत्पादकताम् वर्धयितुं इमेजिंग् प्रौद्योगिक्याः उपयोगः

अस्मिन् पत्रे BlazeBVD इति अन्ध-वीडियो-झिलमिल-कार्यस्य सामान्य-पद्धतिः प्रस्ताविता, यत्र प्रकाश-परिवर्तनेन अथवा स्थानीय-एक्सपोजर-समस्याभिः प्रभावितानां न्यून-गुणवत्ता-झिलमिल-वीडियो-मरम्मतार्थं 2D-जालस्य उपयोगः भवति अस्य मूलं प्रकाशस्थाने STE-छिद्रकस्य अन्तः झिलमिल-प्रायर्-पूर्व-प्रक्रियाकरणं भवति, ततः वैश्विक-झिलमिल-निष्कासन-मॉड्यूले (GFRM) तथा स्थानीय-झिलमिल-निष्कासन-मॉड्यूलेन (LFRM) सह मिलित्वा, वैश्विक-झिलमिल-स्थानीय-एक्सपोजर-बनावटानां सम्यक्करणाय एतेषां प्राइयर्-इत्यस्य उपयोगः भवति अन्ते, लघुकालजालस्य (TCM) उपयोगः भवति यत् विडियोस्य सुसंगततां, अन्तर-फ्रेम-सङ्गतिं च सुधारयितुम्, तथा च मॉडल-अनुमानस्य 10x त्वरणं अपि प्राप्नोति

चीनदेशे इमेजिंग-डिजाइन-क्षेत्रे अन्वेषकः इति नाम्ना मेइतुः उपयोक्तृभ्यः अभिनवसेवाः अनुभवान् च आनेतुं सुविधाजनकं कुशलं च एआइ-कार्यं निरन्तरं प्रारभते, मेतु इमेजिंग् रिसर्च इन्स्टिट्यूट् (एमटी लैब), कोर-शोध-विकास-केन्द्रत्वेन, निरन्तरं भविष्यति एआइ क्षमतां पुनरावर्तनीयरूपेण उन्नयनं कर्तुं विडियो निर्मातृभ्यः विडियो निर्मातुं व्यापकं विश्वं उद्घाटयितुं च नूतनं मार्गं प्रदातव्यम्।