समाचारं

अत्यन्तं शक्तिशाली मुक्तस्रोत Wensheng ग्राफ मॉडलः रात्रौ एव हस्तं परिवर्तयति स्म! SD इत्यस्य मूलदलेन निर्मितं SOTA विडियो जनरेशन मॉडल् विमोचितं भविष्यति

2024-08-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


स्मार्ट वस्तूनि (सार्वजनिकलेखः : १.झीड्क्सकोम्
लेखकःवेनिला
सम्पादनली शुइकिंग्

अत्यन्तं शक्तिशाली मुक्तस्रोत Wensheng ग्राफ मॉडलः रात्रौ एव हस्तं परिवर्तयति स्म!

Zhidongxi अगस्त 2 दिनाङ्के रिपोर्ट् कृतवान् यत् कालः सायं, मुक्तस्रोत Wensheng ग्राफ मॉडल अधिपतिःस्थिर प्रसारणमूलदलेन नूतनप्रतिबिम्बजननप्रतिरूपस्य प्रारम्भस्य घोषणा कृताFLUX.1

FLUX.1 समाविष्टम् अस्तिव्यावसायिक संस्करण, विकासक संस्करण, एक्स्प्रेस संस्करणत्रयाणां मॉडल् मध्ये प्रथमद्वयं मॉडल् SD3-Ultra इत्यादीनां मुख्यधारा मॉडल् इत्येतत् पराजितवान्, लघुतरः FLUX.1 [schnell] अपि Midjourney v6.0, DALL·E 3 इत्यादीनां बृहत्तरं मॉडल् अपि अतिक्रान्तवान्


▲FLUX.1 मुख्यधारामाडलस्य तुलने ELO स्कोरः

FLUX.1 inपाठजननम्, जटिलनिर्देशस्य अनुसरणंतथाहस्तेन जनितम् लाभाः सन्ति। निम्नलिखितम् अस्य सर्वाधिकशक्तिशालिनः व्यावसायिकसंस्करणस्य मॉडलेन FLUX.1[pro] इत्यनेन उत्पन्नानां चित्राणां उदाहरणम् अस्ति .


▲FLUX.1[pro] उत्पन्नं चित्रं उदाहरणम्

FLUX.1 इदानीं मुक्तस्रोतमञ्चे Replicate इत्यत्र उपलभ्यते, अत्र तस्य उपयोगाय मम युक्तयः सन्ति “विश्वस्य लघुतमः कृष्णवनस्य केकः, अङ्गुलीप्रमाणः, कृष्णवनवृक्षैः परितः”, त्रयः आदर्शाः उत्पन्नाः चित्राणि क्रमशः गृहीतवन्तः17.5s、12.2s、1.5s


▲त्रयस्य आदर्शजननस्य तुलना

FLUX.1 इत्येतत् एपिआइ (Application Programming Interface) अपि उद्घाटयति, तस्य मूल्यं चित्राणां संख्यायाः आधारेण भवति ।अमेररकी ०.०५५, अमरीकी डालर ०.०३, अमरीकी डालर ०.००३(प्रायः आरएमबी ०.४, ०.२२, ०.०२२ युआन् च)।

FLUX.1 इत्यस्य पृष्ठतः कम्पनी इति उच्यतेकृष्णवन प्रयोगशालाः (Black Forest Laboratory), स्थिरप्रसारस्य मूलदलेन तथा स्थिरता एआइ इत्यस्य अनेकाः पूर्वशोधकैः स्थापिताः ।स्थिरता एआइ इत्यस्य सदृशं कृष्णवनं उच्चगुणवत्तायुक्तानि बहुविधप्रतिरूपाणि विकसितुं प्रतिबद्धः अस्ति तथा च तान् मुक्तस्रोतरूपेण सम्पन्नम् अस्ति३१ मिलियन डॉलर(प्रायः २२५ मिलियन आरएमबी) बीजगोलवित्तपोषणे ।

कृष्णवनम् अपि शीघ्रमेव मुक्तं भविष्यति इति चिडयतिSOTA (वर्तमान-तकनीकी-सूचकेषु क्रमाङ्कः) इति विडियो-प्रतिरूपम् . तया विमोचितस्य डेमोतः न्याय्यं चेत्, सुचारुता, स्थिरता, भौतिक अनुकरणं च प्रथमस्तरं प्राप्तवान् अस्ति कम्पनी विडियो जनरेशनस्य क्षेत्रे कृष्णाश्वः भवितुम् अर्हति


▲वीडियो जनरेशन मॉडल पूर्वावलोकन

त्रयः आदर्शाः परीक्षणसङ्केतः : १.

https://replicate.com/कृष्ण-वन-प्रयोगशाला/flux-pro

https://replicate.com/कृष्ण-वन-प्रयोगशाला/प्रवाह-देव

https://replicate.com/कृष्ण-वन-प्रयोगशाला/flux-schnell

1. पाठं मानवहस्तं च जनयितुं उत्तमः, स्केलेन सेकेण्ड्-मात्रेषु त्रीणि आदर्शानि जनयितुं शक्यन्ते

FLUX.1 इत्यस्य दृश्यगुणवत्तायाः, चित्रविवरणस्य, उत्पादनविविधतायाः च दृष्ट्या उत्तमं प्रदर्शनं भवति ।पाठजननम्, जटिलरचना, मानवहस्तचित्रणम्

चित्रजननयोः, विडियोजननयोः च पाठजननम् अतीव महत्त्वपूर्णं भवति, अनेके आदर्शाः च समानरूपेण दृश्यमानानि अक्षराणि भ्रमितुं प्रवृत्ताः भवन्ति । FLUX.1 पुनः पुनः अक्षरैः सह कपटशब्दान् सम्भालितुं शक्नोति, यथा aकृष्ण वन प्रवाह Schnell केक


▲काला वन प्रवाह Schnell केक

यदा रचनायाः विषयः आगच्छति तदा FLUX.1 इत्येतत् चित्रे कुत्र वस्तूनि भवेयुः इत्यादीनां जटिलनिर्देशानां अनुसरणं कर्तुं उत्कृष्टं भवति । यथा, FLUX.1 एतस्य प्रॉम्प्ट् इत्यस्य सम्यक् व्याख्यां करोति । त्रयः माधुर्यपूर्णाः जादूगराः पीतमेजस्य उपरि तिष्ठन्ति, प्रत्येकं चिह्नं धारयन्ति। वामे कृष्णवस्त्रधारी जादूगरः "AI" इति चिह्नं धारयति, दक्षिणे रक्तवस्त्रधारी जादूगरः "IS" इति चिह्नं धारयति; "AI" "शीतल" इति लिखितं चिह्नं ।


▲जटिल रचना

बहुविधजननात्मकप्रतिमानानाम् कृते मानवहस्ताः सर्वदा सर्वाधिकं प्रहारितक्षेत्रं भवन्ति । यद्यपि FLUX.1 इत्यनेन उत्पन्नं मानवहस्तप्रतिबिम्बम् अद्यापि सिद्धं नास्ति तथापि तस्य महती प्रगतिः अभवत् ।


▲जनशक्ति

FLUX.1 कुलव्यावसायिक संस्करण, विकासक संस्करण, एक्स्प्रेस संस्करणत्रयः संस्करणाः ।

इत्यस्मिन्‌,FLUX.1[pro] 1.1.इदं शीर्षस्तरीयं तत्कालनिरीक्षणं, दृश्यगुणवत्ता, चित्रविवरणं, निर्गमवैविध्यं च सहितं सर्वाधिकं उन्नतं संस्करणं वर्तते, यत् व्यावसायिकप्रयोक्तृणां कृते अनुकूलितं उद्यमसमाधानं प्रदाति


▲FLUX.1[pro] उत्पन्नं चित्रं उदाहरणम्

FLUX.1[देव]गैर-व्यावसायिक-अनुप्रयोगानाम् अभिप्रेतं, एतत् FLUX.1[pro] इत्यस्मात् परिष्कृतं भवति तथा च समान-आकारस्य मानक-माडल-अपेक्षया अधिकं कुशलं भवति, तथैव गुणवत्तां क्षमतां च प्रदाति


▲FLUX.1[dev] उत्पन्नं चित्रं उदाहरणम्

FLUX.1[schnell] 1।त्रयाणां मॉडल्-मध्ये द्रुततमं, एतत् स्थानीयविकासाय व्यक्तिगत-उपयोगाय च अनुकूलितं भवति तथा च अपाचे २.० मानक-अनुज्ञापत्रस्य अन्तर्गतं सार्वजनिकरूपेण उपलभ्यते ।


▲FLUX.1[schnell] उत्पन्नं चित्रं उदाहरणम्

FLUX.1 इदानीं मुक्तस्रोतमञ्चे Replicate इत्यत्र उपलभ्यते तथा च केवलं एकया कोडपङ्क्तौ मेघे चालयितुं शक्यते, अथवा उपयोक्तारः मॉडलभारं डाउनलोड् कृत्वा प्रोग्रामेटिकरूपेण चालयितुं शक्नुवन्ति FLUX.1 इत्यस्य एपिआइ अपि एकस्मिन् समये उद्घाटितम् अस्ति, त्रयाणां मॉडल्-मूल्यानि च चित्रानुसारं सन्ति ।अमेररकी ०.०५५, अमरीकी डालर ०.०३, अमरीकी डालर ०.००३(प्रायः आरएमबी ०.४, ०.२२, ०.०२२ युआन् च)।

2. पराजयःMJ V6DALLई ३, तकनीकी प्रतिवेदनं शीघ्रमेव प्रकाशितं भविष्यति

प्रदर्शनस्य दृष्ट्या FLUX.1 इत्येतत् विशेषतया सूक्ष्मरूपेण परिष्कृतं यत् पूर्वप्रशिक्षणे सम्पूर्णं उत्पादनवैविध्यं धारयितुं शक्नोति, निर्देशानुपालनं, दृश्यगुणवत्ता, आकारः/दीर्घता, चौड़ाई च परिवर्तनम् इत्यादिषु अनेकपक्षेषु नूतनान् मानकान् निर्धारयति।

तेषु FLUX.1 [pro] तथा [dev] इति द्वौ मॉडलौ पञ्चसु मूल्याङ्कनमापदण्डेषु Midjourney v6.0, DALL·E 3, SD3-Ultra इत्यादीनां लोकप्रियमाडलानाम् अतिक्रान्तौ ।

लघुभारयुक्तस्य मॉडलस्य रूपेण FLUX.1[schnell] न केवलं समानप्रतियोगिनां अपेक्षया उत्तमः अस्ति, अपितु Midjourney v6.0 तथा DALL·E 3 इत्यादीनां शक्तिशालिनां गैर-आसुतमाडलानाम् अपेक्षया अपि उत्तमः अस्ति


▲FLUX.1 मुख्यधारा मॉडलैः सह कार्यप्रदर्शनस्य तुलना

तदतिरिक्तं सर्वे FLUX.1 मॉडल् बहुविधपक्षानुपातं 0.1 तथा 2.0 मेगापिक्सेलस्य रिजोल्यूशनं च समर्थयन्ति ।


▲आस्पेक्ट रेश्यो/रिजोल्यूशन परिवर्तते

एतादृशं शक्तिशालिनीं प्रदर्शनं कथं सिद्ध्यति ?

मॉडल आर्किटेक्चरस्य दृष्ट्या FLUX.1 बहु-मोडल-समानान्तर-प्रसार-ट्रांसफॉर्मर-मॉड्यूल्-आधारितं संकर-आर्किटेक्चरं स्वीकुर्वति, तथा च 12B-मापदण्डेषु विस्तारयति

दलेन Flow Matching इत्यस्य निर्माणेन अत्याधुनिकप्रसारप्रतिरूपे सुधारः कृतः, तथा च Rotary Position Embedding तथा समानान्तर ध्यानस्तरयोः संयोजनेन मॉडलस्य कार्यक्षमतायाः हार्डवेयरदक्षतायाः च सुधारः कृतः अधिकविस्तृतं तकनीकीप्रतिवेदनं शीघ्रमेव प्रकाशितं भविष्यति।

त्रयः,एस.डीमूलचालकदलः, २.2.25१० कोटिःबीजं गोलम्, प्रेषयितुम् इच्छतिसोताविडियो मॉडल

Black Forest Lab इत्यस्य स्थापना Stable Diffusion इत्यस्य संस्थापकदलेन अभवत् ।

स्थिरप्रसारस्य मूल ५ लेखकानां मध्ये,ये सदस्याः Stability AI इत्यत्र सम्मिलिताः सन्ति तथा च SD इत्यस्य अनन्तरं संस्करणानाम् विकासं निरन्तरं कृतवन्तः, येषु Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser च सन्ति, ते सर्वे Black Forest Labs इत्यस्य संस्थापकदले सन्ति


▲स्थिर प्रसारस्य लेखकः तथा कृष्णवनप्रयोगशालायाः संस्थापकदलः

दलस्य कथनमस्ति यत् तस्य मूलविश्वासाः व्यापकरूपेण सुलभप्रतिमानानाम् विकासः, अनुसन्धानस्य शैक्षणिकसमुदायस्य च नवीनतां सहकार्यं च प्रवर्तयितुं, आदर्शपारदर्शितां वर्धयितुं च सन्ति।

कृष्णवनप्रयोगशालाः समाप्तेः घोषणां करोति३१ मिलियन डॉलर(प्रायः २२५ मिलियन आरएमबी) २.बीजगोलवित्तपोषणम्, सुप्रसिद्धेन उद्यमपुञ्जसंस्थायाः a16z (Andreessen Horowitz) इत्यस्य नेतृत्वे, VR निर्माता Oculus इत्यस्य CEO Brendan Iribe, startup incubator YC इत्यस्य CEO Garry Tan, NVIDIA इत्यस्य शोधकर्तारः Timo Aila इत्यादयः विशेषज्ञाः AI कम्पनयः अपि निवेशे भागं गृहीतवन्तः, and also received जनरल कैटलिस्ट् इत्यादिभ्यः प्रथमस्तरीयनिधिभ्यः अनुवर्तननिवेशाः अभवन् ।

दलस्य सल्लाहकारमण्डले डिज्नी-नगरस्य पूर्वाध्यक्षः माइकल ओवित्ज्, यस्य सामग्रीनिर्माण-उद्योगे विस्तृतः अनुभवः अस्ति, तंत्रिकाशैल्याः स्थानान्तरणस्य अग्रणीः प्रोफेसरः मथियास् बेथ्गे च सन्ति

ए.आइ.मास्टरः यः अधुना एव स्वव्यापारं आरब्धवान्आन्द्रेई कापासी(Andrej Karpathy) इत्यनेन स्वस्य आशीर्वादं Black Forest दलं प्रति प्रेषितं तथा च उक्तं यत् "open source FLUX.1 image generation model अतीव शक्तिशाली दृश्यते" इति ।


▲कापासि इत्यस्य टिप्पणी

संस्थापकदलस्य पूर्वनेता - स्थिरता एआइ इत्यस्य पूर्वसीईओइमाद मोस्तक(Emad Mostaque) अपि अभिनन्दनसन्देशं प्रेषितवान्, "पूर्वं तेषां सह कार्यं कर्तुं गौरवम् अभवत्, मम विश्वासः अस्ति यत् ते प्रत्येकं पिक्सेलं जनयितुं यात्रायां सीमां निरन्तरं धक्कायिष्यन्ति" इति।


▲मोस्ताक टिप्पणी

कार्यस्य अग्रिमे चरणे Black Forest Trailer इत्येतत् एकं...SOTA विन्सेन्ट् विडियो मॉडल , "सर्वः पाठं विडियोरूपेण परिवर्तयितुं शक्नोति।" "उच्चपरिभाषायां अभूतपूर्वगत्या च सटीकनिर्माणं सम्पादनं च सक्षमं कृत्वा" FLUX.1 इत्यस्मिन् मॉडल् निर्मितं भविष्यति ।


▲वीडियो जनरेशन मॉडल पूर्वावलोकन

अन्वयः - बहुविधबृहत्प्रतिमानस्य क्षेत्रे कृष्णाश्वाः उद्भवन्ति

यदा बहवः प्रमुखाः निर्मातारः स्टार्टअप-संस्थाः च विन्सेन्ट्-वीडियो-विषये उन्मत्ताः सन्ति, तदा विन्सेन्ट्-चित्रस्य क्षेत्रेण सहसा अश्वस्य अश्वस्य आरम्भः अभवत् । "नीलेन बहिः जन्म" FLUX.1 न केवलं उत्तमं प्रदर्शनं दर्शयति, पाठजननम्, जटिलरचना, मैनुअल् रेखाचित्रम् इत्यादिषु कठिनतां भङ्गयति, अपितु विविधसंस्करणैः सह विभिन्नप्रयोक्तृणां आवश्यकताः अपि पूरयति

स्थिरप्रसारस्य मूलदलस्य दृढबलस्य उपरि अवलम्ब्य कृष्णवनप्रयोगशाला उदारबीजगोलवित्तपोषणं प्राप्तवती अस्ति तथा च अनेकेषां उद्योगनेतृणां ध्यानं समर्थनं च आकर्षितवती अस्ति। भविष्ये ये विडियो मॉडल् विमोचिताः भविष्यन्ति ते विन्सेन्ट् विडियो क्षेत्रे नूतनं जीवनशक्तिं प्रविशन्ति।