जिया याङ्गकिंगः स्वस्य एकस्य पत्रस्य कृते समयपरीक्षापुरस्कारं प्राप्तवान्, तथा च चीनदेशस्य १० उत्तमपत्रेषु नासीत्, ICML 2024 Award

जिया याङ्गकिङ्ग् इत्यनेन स्वस्य एकस्य पत्रस्य कृते समयपरीक्षापुरस्कारः प्राप्तः, परन्तु चीनदेशस्य १० उत्तमपत्राणां, आईसीएमएल २०२४ पुरस्कारस्य च योग्यता न प्राप्ता

2024-07-23

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

ICML इत्यस्य पूर्णं नाम अन्तर्राष्ट्रीययन्त्रशिक्षणसङ्घटनेन (IMLS) आयोजितम् अस्ति तथा च सङ्गणककृत्रिमबुद्धेः क्षेत्रे सर्वोच्चसम्मेलनम् अस्ति ।

अस्मिन् वर्षे ICML सम्मेलनं ४१तमं सम्प्रति आस्ट्रियादेशस्य वियनानगरे प्रचलति। सद्यः एव आयोजिते उद्घाटनसमारोहे प्रतिवर्षं अधिकाधिकं लोकप्रियं भवति ICML इत्यनेन अस्मिन् वर्षे सम्मेलनस्य आँकडानां पुरस्कारसूचनानां च घोषणा कृता।

अस्मिन् मुख्यसम्मेलने कुलम् ९४७३ वैधपत्रप्रस्तुतयः प्राप्ताः, येषु २६१० पत्राणि स्वीकृतानि, यत्र २७.५% स्वीकृतिदरः, यत्र १४४ मौखिकपत्राणि, १९१ स्पोट्लाइटपत्राणि च सन्ति

स्वीकृतपत्राणां विषयकीवर्डाः सन्ति : बृहत् भाषाप्रतिरूपं, सुदृढीकरणशिक्षणं, गहनशिक्षणं, आलेखन्यूरलजालम्, यन्त्रशिक्षणं, संघीयशिक्षणं, प्रसारप्रतिरूपणं, ट्रांसफार्मर, एलएलएम, प्रतिनिधित्वशिक्षणं, जननात्मकप्रतिरूपं... एते कीवर्डाः वर्तमानस्य अपि प्रतिनिधित्वं कुर्वन्ति एआइ क्षेत्रे सर्वाधिकं लोकप्रियं शोधदिशा।

एतेषां आँकडानां अतिरिक्तं सम्मेलने अस्मिन् वर्षे समयपरीक्षापुरस्कारः, सर्वोत्तमपत्राणि च घोषितानि। DeCAF इति पत्रं यत् Jia Yangqing इत्यनेन दशवर्षपूर्वं Berkeley-नगरे स्थित्वा सह-सम्पन्नम्, अस्मिन् वर्षे Time Test Award इति पुरस्कारं प्राप्तवान् । गतवर्षे ६ अध्ययनानाम् तुलने अस्मिन् वर्षे १० अध्ययनैः सर्वोत्तमपत्रं प्राप्तम्, यत्र गूगल डीपमाइण्ड् वर्ल्ड मॉडल् Genie, विडियो मॉडल् VideoPoet इत्यादयः सन्ति ये किञ्चित्कालपूर्वं लोकप्रियाः अभवन्

समय परीक्षित पुरस्कार

DeCAF इत्यस्य पुरस्कारं प्राप्तुं विषये Jia Yangqing इत्यनेन मित्रमण्डले उक्तं यत्, "अद्यतनस्य शब्दावलीतः DeCAF इत्येतत् दृष्टिक्षेत्रे आधारविशेषताः गहनं च निवेशनं भवितुमर्हति, तथा च एतेन सङ्गणकदृष्टेः क्षेत्रं सामान्यीकरणीयं विशेषता अपि दत्ता। DeCAF इत्यस्य कार्यम् later gave birth to General वस्तुपरिचयरूपरेखा R-CNN, उच्च-प्रदर्शन-विषम-कम्प्यूटिंग-रूपरेखा Caffe, प्रथम-पीढी-त्वरण-रूपरेखा CuDNN, याहू लैब्स् द्वारा निर्मितं बृहत्-परिमाणं वितरित-प्रशिक्षणं CaffeOnSpark इति लेखने बर्कले-एनवीडिया-योः सहकार्यं अप्रत्यक्षरूपेण योगदानं दत्तवान् , अन्येषां कार्याणां च श्रृङ्खला , गहनशिक्षणतरङ्गे बर्कले-नगरस्य अग्रणीस्थानं स्थापयति स्म ।”

论文:DeCAF: सामान्यदृश्यपरिचयस्य कृते गहनं परिवर्तनकारी सक्रियकरणविशेषता

作者:जेफ्री डोनाहुए、यांगकिंग जिया、ओरिओल विन्याल्स、जूडी हॉफमैन、निंग झांग、एरिक त्ज़ेंग、ट्रेवर डैरेल

संस्था: यूसी बर्कले एण्ड आईसीएसआई, बर्कले, सीए, अमेरिका

पेपर लिङ्कः https://arxiv.org/pdf/1310.1531

शोधदलेन मूल्याङ्कनं कृतम् यत् किं वस्तुपरिचयकार्यस्य बृहत्परिमाणे, नियतसमूहे पूर्णतया निरीक्षितरीत्या प्रशिक्षितानां गहनानां कन्वोल्यूशनलजालस्य सक्रियीकरणात् निष्कासितानां विशेषतानां पुनः उद्देश्यं नूतनसामान्यप्रयोजनकार्यस्य कृते कर्तुं शक्यते वा इति। एते सामान्यकार्यं येषां कृते ते मूलतः प्रशिक्षिताः आसन्, तेभ्यः महत्त्वपूर्णतया भिन्नाः भवेयुः, तथा च गहनानि वास्तुकलानि नियमितरूपेण नूतनकार्यं प्रति प्रशिक्षितुं वा अनुकूलितुं वा पर्याप्तं लेबलयुक्तं वा अलेबलयुक्तं वा दत्तांशं न भवितुम् अर्हति ते दृश्यपरिचयः, डोमेन-अनुकूलनं, सूक्ष्म-कणिका-परिचय-चुनौत्यं च समाविष्टं विविधकार्य्येषु गहन-संक्रमण-विशेषतानां शब्दार्थ-समूहीकरणस्य अध्ययनं कुर्वन्ति, दृश्यमानं च कुर्वन्ति शोधकर्तारः नियतविशेषतानां परिभाषार्थं जालस्य विभिन्नस्तरानाम् उपरि अवलम्बनस्य प्रभावस्य तुलनां कृतवन्तः तथा च नूतनानि परिणामानि प्रतिवेदितवन्तः ये कतिपयेषु महत्त्वपूर्णेषु दृश्यचुनौत्येषु विद्यमानप्रविधिभ्यः महत्त्वपूर्णतया अधिकं प्रदर्शनं कुर्वन्ति। तेषां DeCAF इति गहन-कन्वोल्यूशनल्-सक्रियेशन-विशेषतानां मुक्त-स्रोत-कार्यन्वयनं विमोचितम् यस्मिन् दृष्टि-संशोधकाः दृश्य-अवधारणा-शिक्षण-प्रतिमानानाम् एक-श्रेण्यां गहन-प्रतिनिधित्वस्य प्रयोगं कर्तुं समर्थाः भवन्ति, येन सर्वे प्रासंगिकाः संजाल-मापदण्डाः सन्ति

best paper

पत्र 1: उच्च-संकल्प-प्रतिबिम्ब-संश्लेषणार्थं सुधारित-प्रवाह-परिवर्तकानां स्केलिंग्

作者:पैट्रिक एस्सर, सुमिथ कुलाल, आन्द्रियास ब्लैटमैन, रहीम एंटेजारी, जोनास मुलर, हैरी सैनी, यम लेवी, डोमिनिक लोरेन्ज, एक्सेल सौर, फ्रेडरिक बोएसेल्, डस्टिन पोडेल्, टिम डॉकहॉर्न, सियोन इंग्लिश, रॉबिन रोम्बच

संगठनः स्थिरता ए.आइ

कागजस्य पताः https://proceedings.mlr.press/v235/esser24a.html

मशीन हार्ट रिपोर्ट्: अन्ततः स्थिरप्रसार 3 पत्रं विमोचितम्, वास्तुकलाविवरणं च प्रकाशितम् अस्ति किम् सोरा इत्यस्य पुनरुत्पादने साहाय्यं करिष्यति?

इदं पत्रं सम्यक् Stable Diffusion 3 पत्रम् अस्ति । पूर्वसंस्करणस्य तुलने Stable Diffusion 3 इत्यनेन उत्पन्नानां चित्राणां गुणवत्तायां बहु सुधारः कृतः, बहुविषयकप्रोम्प्ट् समर्थयति, पाठलेखनप्रभावः अपि उत्तमः अस्ति

स्थिर प्रसार 3 मॉडल वास्तुकला।

प्रसारप्रतिमानाः, ये शोरात् तस्य अग्रे मार्गं शोररूपेण विपर्यय्य आँकडानां निर्माणं कुर्वन्ति, ते चित्राणि, भिडियो इत्यादीनां उच्च-आयामी-संवेदी-दत्तांशस्य कृते एकस्याः शक्तिशालिनः जननात्मक-प्रतिरूपण-प्रविधिरूपेण उद्भूताः सन्ति Rectified Flow (RF) इति अद्यतनं जननात्मकं प्रतिरूपं सूत्रीकरणं यत् दत्तांशं शोरं च सीधारेखायां संयोजयति । अस्य उत्तमसैद्धान्तिकगुणानां अवधारणात्मकसरलतायाः च अभावेऽपि अद्यापि मानकव्यवहाररूपेण स्पष्टतया न स्थापितं ।

इदं शोधं RF मॉडल् प्रशिक्षयित्वा विद्यमानानाम् शोरनमूनाकरणप्रविधिषु सुधारं करोति, तेषां बोधात्मकरूपेण प्रासंगिकपरिमाणानां प्रति पूर्वाग्रहं कृत्वा। बृहत्-परिमाणस्य अध्ययनस्य माध्यमेन अयं अध्ययनः उच्च-संकल्प-पाठ-प्रति-प्रतिबिम्ब-संश्लेषणार्थं विद्यमान-प्रसार-सूत्राणां तुलने अस्य दृष्टिकोणस्य श्रेष्ठ-प्रदर्शनं प्रदर्शयति

तदतिरिक्तं, शोधं पाठ-प्रति-प्रतिबिम्ब-जननार्थं नूतनं Transformer-आधारितं वास्तुकला अपि प्रस्तावयति, यत् द्वयोः मोडयोः कृते पृथक्-पृथक् भारस्य उपयोगं करोति तथा च चित्र-पाठ-टोकनयोः मध्ये द्विदिशा-सूचना-प्रवाहं सक्षमं करोति, तस्मात् पाठ-समझौ, मानव-प्राथमिकता-रेटिंग् इत्यादिषु सुधारः भवति . अध्ययनं दर्शयति यत् वास्तुकला पूर्वानुमानीयं स्केलिंग-प्रवृत्तिम् अनुसरति तथा च अवलोकयति यत् वर्धमानेन मॉडल-आकारेन प्रशिक्षण-पदार्थैः च प्रमाणीकरण-हानिः सुचारुतया न्यूनीभवति

उन्नत बहुविध प्रसार परिवर्तक: MMDiT ब्लॉक।

पत्र 2: जिनी: जननात्मक अन्तरक्रियाशील वातावरण

作者:जेक ब्रूस, माइकल डेनिस, एशले एडवर्ड्स, जैक पार्कर-धारक, युगे शी, एडवर्ड ह्युग्स् 等

संस्थानम् : Google DeepMind, ब्रिटिशकोलम्बिया विश्वविद्यालयः

पेपर पता: https://arxiv.org/pdf/2402.15391.pdf

अस्मिन् पत्रे जनरेटिव एआइ - जनरेटिव इन्टरएक्टिव् एनवायरनमेण्ट्स् - जिनी (जेनरेटिव इन्टरएक्टिव् एनवायरनमेण्ट्स्) इत्यस्य नूतनं प्रतिमानं परिभाषितम् अस्ति । Genie इति ११ अरब पैरामीटर् आधारविश्वप्रतिरूपं यत् एकस्मात् चित्रप्रोम्प्ट् तः प्लेयबल इन्टरएक्टिव् वातावरणं जनयितुं शक्नोति ।

मशीन हार्ट रिपोर्ट् : अधुना एव गूगलेन एकं मूलभूतं विश्वप्रतिरूपं प्रकाशितम्: 11B पैरामीटर्स्, यत् एकं अन्तरक्रियाशीलं वर्चुअल् वर्ल्ड जनयितुं शक्नोति

Genie आर्किटेक्चरस्य अनेकाः घटकाः Vision Transformer (ViT) इत्यस्य उपरि निर्मिताः सन्ति । ज्ञातव्यं यत् Transformer इत्यस्य गौणस्मृतिव्ययस्य कारणात्, यत् विडियोक्षेत्रे आव्हानानि आनयति, विडियोषु (10^4) टोकनपर्यन्तं भवितुं शक्नोति । अतः गूगलः सर्वेषु मॉडल् घटकेषु स्मृति-कुशलस्य ST-transformer आर्किटेक्चरस्य उपयोगं करोति यत् मॉडल् क्षमतां कम्प्यूटेशनल् बाध्यतां च सन्तुलितं करोति ।

जिनी त्रयः प्रमुखघटकाः सन्ति (यथा अधोलिखिते चित्रे दर्शितम् अस्ति):

१) सुप्तक्रियाप्रतिरूपम् (LAM), यस्य उपयोगः प्रत्येकस्य फ्रेमयुग्मस्य मध्ये सम्भाव्यक्रियाणां विषये तर्कं कर्तुं भवति;

२) विडियो टोकेनिजर (Tokenizer), मूलविडियो फ्रेम्स असततटोकनरूपेण परिवर्तयितुं उपयुज्यते;

३) गतिशीलप्रतिरूपं, सम्भाव्यक्रियाः, पूर्वचक्रस्य टोकनं च दत्त्वा, विडियोस्य अग्रिमचक्रस्य पूर्वानुमानार्थं उपयुज्यते ।

नियन्त्रणीयं विडियोजननं प्राप्तुं गूगलः पूर्वचक्रस्य मध्ये कृतानि क्रियाणि भविष्यस्य फ्रेमस्य पूर्वानुमानस्य शर्तरूपेण उपयुङ्क्ते । परन्तु अन्तर्जालस्य भिडियासु एतादृशाः क्रियालेबल् दुर्लभाः एव उपलभ्यन्ते, क्रियाटिप्पणीप्राप्त्यर्थं च व्ययः अधिकः भवितुम् अर्हति । तस्य स्थाने गूगलः सम्भाव्यक्रियाः सर्वथा अनिरीक्षितरीत्या ज्ञायते ।

पत्र 3: बृहत्-परिमाणेन सार्वजनिकपूर्वप्रशिक्षणेन सह विभेदकरूपेण निजीशिक्षणस्य विचाराः

लेखक : फ्लोरियन ट्रामेर, गौतम कामथ, निकोलस कार्लिनी

संस्थाः : ईटीएच ज्यूरिच्, वाटरलू विश्वविद्यालयः, गूगल डीपमाइण्ड्

पेपर पता: https://arxiv.org/abs/2212.06470

बृहत् सार्वजनिकदत्तांशसमूहेषु पूर्वप्रशिक्षितानां गैर-निजी-माडलानाम् स्थानान्तरण-शिक्षणक्षमतानां लाभं गृहीत्वा भिन्न-भिन्न-निजी-यन्त्र-शिक्षणस्य कार्यप्रदर्शने महत्त्वपूर्णतया सुधारः कर्तुं शक्यते पत्रे प्रश्नः अस्ति यत् बृहत् जाल-स्क्रेप्ड्-दत्तांशसमूहानां उपयोगः भिन्नरूपेण निजी इति विचारणीयः वा इति ।

अध्ययनस्य मतं यत् संजालदत्तांशेषु पूर्वप्रशिक्षितानां एतेषां प्रतिमानानाम् "निजी" आदर्शानां रूपेण सेट् करणं विभेदकगोपनीयतायां जनविश्वासं क्षतिं कर्तुं दुर्बलं च कर्तुं शक्नोति। सार्वजनिकदत्तांशस्य उपयोगस्य गोपनीयताविचारानाम् अतिरिक्तं अध्ययनं अस्य प्रतिमानस्य उपयोगितायाः विषये अधिकं प्रश्नं करोति । अध्ययनं परीक्षणं करोति यत् विद्यमानाः यन्त्रशिक्षणमापदण्डाः पूर्वप्रशिक्षितप्रतिमानानाम् संवेदनशीलक्षेत्रेषु सामान्यीकरणस्य क्षमतां मापनार्थं उपयुक्ताः सन्ति वा येषां प्रतिनिधित्वं सार्वजनिकजालदत्तांशेषु कठिनं भवितुम् अर्हति।

तदतिरिक्तं, अध्ययनं टिप्पणी करोति यत् बृहत् मॉडल् परिनियोजनेन अधिकगणनाशक्तियुक्तानां तृतीयपक्षेभ्यः निजीदत्तांशं बहिः प्रदातुं आवश्यकतायाः कारणतः गोपनीयतायाः शुद्धहानिः भवितुम् अर्हति

पत्र 4: आँकडावितरणस्य अनुपातानाम् अनुमानं कृत्वा असततप्रसारप्रतिरूपणम्

लेखकः एरोन् लू, चेन्लिन् मेङ्ग, स्टीफनो एर्मोन

संस्था : स्टैन्फोर्ड विश्वविद्यालय, पिका प्रयोगशाला

कागजस्य पताः https://proceedings.mlr.press/v235/lou24a.html

यद्यपि प्रसारप्रतिरूपाः अनेकेषु जननात्मकप्रतिरूपणकार्येषु उत्तमं प्रदर्शनं कुर्वन्ति तथापि प्राकृतिकभाषा इत्यादिषु विच्छिन्नदत्तांशक्षेत्रेषु अपेक्षितरूपेण कार्यं कर्तुं असफलाः भवन्ति मानकप्रसारप्रतिमानाः सुस्थापिते स्कोरमेलनसिद्धान्ते अवलम्बन्ते, परन्तु एतत् असततसंरचनानां सामान्यीकरणस्य प्रयासैः समानाः अनुभवजन्यलाभाः न प्राप्ताः

अस्मिन् कार्ये शोधदलः स्कोर्ड् एन्ट्रोपी इति नवीनं हानिम् प्रस्तावयित्वा एतत् अन्तरं पूरयति । स्कोरित-एन्ट्रोपी स्वाभाविकतया स्कोर-मेलनं असतत-अन्तरिक्षे विस्तारयति, असतत-प्रसार-प्रतिरूपाणां निर्माणार्थं निर्विघ्नतया एकीकृत्य, कार्यप्रदर्शने महत्त्वपूर्णतया सुधारं करोति

स्वप्रयोगेषु तेषां कृते मानकभाषाप्रतिरूपणकार्यस्य उपरि स्कोरड् एन्ट्रोपी डिस्क्रिट् डिफ्फ्यूजन मॉडल् (SEDD) इत्यस्य परीक्षणं कृतम् । तुलनीयमाडल आकारेषु SEDD विद्यमानभाषाप्रसारप्रतिमानानाम् (भ्रमस्य २५-७५% न्यूनता) अधिकं प्रदर्शनं करोति तथा च स्वप्रतिगमनमाडलेन सह स्पर्धां करोति, विशेषतः GPT-2 इत्यस्मात् अधिकं प्रदर्शनं करोति तदतिरिक्तं, ऑटोरेग्रेसिव मॉडल् इत्यनेन सह तुलने, SEDD वितरित-एनीलिंग्-तकनीकानां (यथा तापमान-मापनस्य) आवश्यकतां विना वास्तविक-पाठं जनयितुं (अननील्ड् GPT-2 इत्यस्मात् प्रायः 6-8 गुणाधिकं भ्रमम् उत्पन्नं कर्तुं) समर्थः अस्ति, तथा च Tradeoffs इत्यत्र उपयोक्तुं शक्यते कम्प्यूटेशनलप्रयत्नस्य गुणवत्तायाश्च मध्ये (32x न्यूनजालमूल्यांकनैः सह समानगुणवत्तां प्राप्तुं), तथा च नियन्त्रणीयपैडिंग् (कर्नेल् नमूनागुणवत्तायाः मेलनं कृत्वा वामतः दक्षिणतः संकेतस्य अपेक्षया अन्यरणनीतयः अनुमन्यते) समर्थयति

पेपर 5: ट्विस्टेड् सीक्वेंशियल मोंटे कार्लो मार्गेण भाषाप्रतिरूपेषु संभाव्यतावादी अनुमानम्

作者:स्टीफन झाओ、रोब ब्रेकेलमैन्स、अलिरेजा मखजानी 、रोजर ग्रोस

संस्था : टोरोन्टो विश्वविद्यालय, वेक्टर संस्थान

पेपर पता: https://proceedings.mlr.press/v235/zhao24c.html

आरएलएचएफ, स्वचालितलालदलपरीक्षणं, संकेत-इञ्जिनीयरिङ्गं, पैडिंग् च सहितं बृहत्भाषाप्रतिमानानाम् (LLMs) असंख्यानि क्षमताः सुरक्षाप्रविधयः च दत्तपुरस्कारेण अथवा गुप्तकार्येन परिभाषितस्य विसामान्यकृतलक्ष्यवितरणस्य नमूनारूपेण द्रष्टुं शक्यन्ते अस्मिन् कार्ये लेखकाः एतासां संभाव्यतावादीनां अनुमानसमस्यानां निवारणाय क्रमिकमोंटे कार्लो (SMC) इत्यस्य समृद्धसाधनपेटिकायाः शोषणं कुर्वन्ति । विशेषतः, ते प्रत्येकं समयपदे सम्भाव्य अपेक्षितभविष्यमूल्यानां अनुमानं कर्तुं शिक्षितस्य तानाकार्यस्य उपयोगं कुर्वन्ति, येन अनुमानसमये गणना अनुक्रमस्य आशाजनकभागेषु केन्द्रीक्रियते

वयं विवर्तनकार्यं ज्ञातुं एकं नवीनं विपरीतदृष्टिकोणं प्रस्तावयामः तथा च मृदुसुदृढीकरणशिक्षणस्य समृद्धसाहित्येन सह सम्पर्कं कुर्मः। मुड़ित-SMC-रूपरेखायाः पूरक-अनुप्रयोगरूपेण, ते नूतन-द्विदिशात्मक-SMC-बाउण्ड्-इत्यस्य उपयोगेन लॉग-विभाजन-कार्ययोः भाषा-प्रतिरूप-अनुमान-तकनीकानां सटीकतायाः मूल्याङ्कनार्थं पद्धतिं प्रस्तावन्ति एतेषां सीमानां उपयोगेन अनुमानवितरणस्य लक्ष्यवितरणस्य च मध्ये द्विपक्षीयकेएलविचलनस्य अनुमानं कर्तुं शक्यते । अनुमानमूल्यांकनप्रविधिं प्रयोजयित्वा ते प्रदर्शयन्ति यत् पूर्वप्रशिक्षितमाडलात् अवांछितनिर्गमानाम् नमूनाकरणं (अहानिकारकप्रशिक्षणस्य स्वचालितलालदलपरीक्षणस्य च कृते उपयोगी), भिन्नभावनाभिः सह समीक्षां जनयितुं, पैडिंगकार्यं कर्तुं च Twisted SMC प्रभावी अस्ति

पत्र 6: अधिकप्रत्ययप्रद-एलएलएम-सहितं बहसः अधिकसत्य-उत्तरं प्राप्नोति

作者:अकबीर खान、जॉन ह्यूजेस、दान वैलेंटाइन、लौरा रुइस、क्षितिज सचन、अंश राधाकृष्णन、एडवर्ड ग्रेफेनस्टेट、सैमुअल बोमन、टिम रॉकटाशेल、एथन पेरेज

संस्थाः : विश्वविद्यालय महाविद्यालय लण्डन, स्पीचमैटिक्स, MATS, एन्थ्रोपिक, FAR AI

कागज पता: https://proceedings.mlr.press/v235/khan24a.html

बृहत्भाषाप्रतिमानानाम् (LLMs) वांछितव्यवहारैः सह संरेखणस्य सामान्यदृष्टिकोणाः मानवलेबलकृतदत्तांशस्य उपरि बहुधा निर्भराः सन्ति । परन्तु यथा यथा आदर्शाः जटिलाः भवन्ति तथा तथा ते मानवविशेषज्ञतां अतिक्रान्ताः भविष्यन्ति, मानवमूल्यांककानां भूमिका विशेषज्ञानाम् पर्यवेक्षकाणां अविशेषज्ञानाम् भूमिकां यावत् विकसिता भविष्यति एतस्याः अपेक्षायाः आधारेण शोधकर्तारः एकं प्रश्नं पृष्टवन्तः यत् किं दुर्बलतरं प्रतिरूपं दृढतरस्य प्रतिरूपस्य सम्यक्त्वस्य मूल्याङ्कनं कर्तुं शक्नोति? ते एतादृशं परिदृश्यं स्थापयित्वा एतस्याः समस्यायाः अध्ययनं कृतवन्तः यत् यस्मिन् बलिष्ठतरस्य प्रतिरूपस्य (विशेषज्ञस्य) प्रश्नस्य उत्तरं दातुं आवश्यका पृष्ठभूमिसूचना आसीत्, यदा तु दुर्बलतरस्य प्रतिरूपस्य (अविशेषज्ञस्य) एतस्याः सूचनायाः अभावः आसीत् शोधकर्तारः वादविवादं परीक्षणपद्धतिरूपेण चयनं कृतवन्तः - अर्थात् द्वौ एलएलएम-विशेषज्ञौ प्रत्येकं भिन्न-भिन्न-उत्तराणां रक्षणं कर्तुं दत्तवन्तः, अविशेषज्ञाः च अन्तिम-उत्तरं चयनं कुर्वन्ति

शोधदलेन ज्ञातं यत् वादविवादेन अविशेषज्ञप्रतिमानानाम् मनुष्याणां च प्रश्नानाम् उत्तरं दातुं प्रभावीरूपेण सहायता कृता, येन क्रमशः ७६% तथा ८८% सटीकता प्राप्ता (मूल आधाररेखा क्रमशः ४८% तथा ६०% आसीत्)

अपि च, अनिरीक्षितरूपेण विशेषज्ञविमर्शकर्तृणां अनुनयशीलतायाः अनुकूलनं कृत्वा अविशेषज्ञानाम् वादविवादेषु सत्यस्य परिचयस्य क्षमतायां सुधारः भवति एतत् परिणामं भू-सत्यलेबलस्य अभावे संरेखितप्रतिमानानाम् व्यवहार्यतायाः विषये बहसं कृत्वा सन्दर्भं प्रदाति ।

论文 7:स्टोचैस्टिक उत्तल अनुकूलनस्य सूचनाजटिलता: सामान्यीकरणं, कण्ठस्थीकरणं, अनुसन्धानं च कर्तुं अनुप्रयोगाः

作者:इडान अट्टियास、गिंटरे कैरोलिना द्ज़ुगैते、महदी हघिफाम、रोई लिवनी、डैनियल राय

संस्थाः - बेन्-गुरियन विश्वविद्यालयः, टोरोन्टो विश्वविद्यालयः, डीपमाइण्ड् इत्यादयः।

पेपर पता: https://proceedings.mlr.press/v235/attias24a.html

अस्मिन् कार्ये लेखकाः स्टोचैस्टिक कन्वेक्स ऑप्टिमाइजेशन (SCO) इत्यस्य सन्दर्भे स्मृतेः शिक्षणस्य च अन्तरक्रियायाः अध्ययनं कुर्वन्ति । ते एल्गोरिदम् स्वस्य प्रशिक्षणदत्तांशबिन्दुविषये प्रकाशयति सूचनां ज्ञात्वा स्मृतिं परिभाषयन्ति तथा च Steinke and Zakynthinou (2020) द्वारा प्रस्तावितायाः सशर्तपरस्परसूचना (CMI) रूपरेखायाः उपयोगेन एतां सूचनां परिमाणयन्ति

अस्य अध्ययनस्य मुख्यं परिणामं भवति यत् लिवनी (2023) इत्यनेन उपस्थापितस्य मुक्तप्रश्नस्य उत्तरं दत्त्वा, एकस्य शिक्षण-एल्गोरिदमस्य सटीकतायां तस्य CMI-इत्यस्य च मध्ये व्यापारस्य सटीकं लक्षणं भवति अस्मिन् पत्रे दर्शितं यत् L2 Lipschitz–सीमितसेटिंग् तथा प्रबल उत्तलतास्थितौ अत्यधिकदोषयुक्तस्य प्रत्येकस्य शिक्षिकायाः CMI क्रमशः Ω(1/ε2) तथा Ω(1/) इत्यनेन न्यूनसीमितः भवति। लेखकाः अग्रे एससीओ समस्यायां स्मृतेः अनिवार्यभूमिकां प्रदर्शयन्ति यत् एकं प्रतिद्वन्द्वी परिकल्पयन्ति यत् विशिष्टे एससीओ समस्यायां बहूनां प्रशिक्षणनमूनानां समीचीनतया पहिचानं कर्तुं शक्नोति। अन्ते ते परिणामानां अनेकनिमित्तानि उद्धृतयन्ति, यथा सीएमआई-आधारितसामान्यीकरणसीमानां सीमाः तथा च एससीओसमस्यायां नमूनानां असंपीडनक्षमता।

पत्र 8: दत्तांशसमूहवैविध्यं मापयन्तु, केवलं तस्य दावान् मा कुरुत

作者:डोरा झाओ、जेरोन एंड्रयूज、Orestis Papakyriakopoulos、ऐलिस ज़ियांग

संस्थाः : स्टैन्फोर्ड विश्वविद्यालयः, सोनी एआइ (लण्डन्, यूके), म्यूनिखस्य तकनीकी विश्वविद्यालयः, सोनी एआइ (सिएटल, अमेरिका)

कागज पता: https://arxiv.org/html/2407.08188v1

यन्त्रशिक्षणस्य (ML) आँकडासमूहाः प्रायः तटस्थाः इति मन्यन्ते, परन्तु तेषु स्वभावतः अमूर्ताः प्रतिस्पर्धिताः च सामाजिकनिर्माणाः सन्ति । दत्तांशसमूहस्य संरक्षकाः प्रायः दत्तांशसमूहानां वर्णनार्थं विविधता, पूर्वाग्रहः, गुणवत्ता च इत्यादीनां मूल्ययुक्तानां पदानाम् उपयोगं कुर्वन्ति । यद्यपि एतेषां पदानाम् उपयोगः बहुधा भवति तथापि तेषु स्पष्टपरिभाषा, प्रमाणीकरणस्य च अभावः अस्ति । शोधदलस्य अध्ययनेन १३५ चित्रपाठदत्तांशसमूहेषु "विविधतायाः" विश्लेषणं कृत्वा अस्य विषयस्य प्रभावस्य अन्वेषणं कृतम् । सामाजिकविज्ञानात् आकर्षयन् मापनसिद्धान्तात् सिद्धान्ताः विचाराणां पहिचानाय प्रयुक्ताः भवन्ति तथा च दत्तांशसमूहेषु विविधतायाः अवधारणा, परिचालनं, आकलनं च कर्तुं अनुशंसाः प्रदातुं शक्नुवन्ति तेषां निष्कर्षाणां एमएल-संशोधनस्य व्यापकाः प्रभावाः सन्ति, ये आँकडा-समूह-निर्माणे मूल्य-भारित-गुणान् नियन्त्रयन्ते सति अधिकसूक्ष्म-सटीक-दृष्टिकोणस्य वकालतम् कुर्वन्ति

पत्र 9: वीडियोकविः शून्य-शॉट्-वीडियो-जननस्य कृते एकं विशालं भाषा-प्रतिरूपम्

作者:डैन कोंड्राट्युक、लिजुन यू、Xiuye गु、जोसे लेजामा、 जोनाथन हुआंग、ग्रांट शिंडलर、राचेल हॉर्नुंग、विघ्नेश एन बिरोडकर、जिमी यान、मिंग-चांग चिउ、कृष्ण सोमन्देपल्ली、हसन अकबरी、Yair ong चेंग、जोशुआ वी डिल्लन 、अग्रिम गुप्ता、मीरा हाहन、अन्जा हौथ、डेविड हेंडन、एलोन्सो मार्टिनेज、डेविड मिनेन、मिखाइल सिरोटेनको、किह्यूक सोहन、क्सुआन यांग、हार्टविग एडम、मिंग-हसुआन यांग、इरफान एस्सा、हुइशेंग वांग、डेविड रॉस 、ब्रायन सेबोल्ड、लु जियांग

संगठनम् : गूगल, कार्नेगी मेलन विश्वविद्यालय

कागज पता: https://proceedings.mlr.press/v235/kondratyuk24a.html

परियोजनालिङ्कः http://sites.research.google/videopoet/

मशीन हार्ट रिपोर्ट् : किं विडियो जनरेशन अनन्तदीर्घं भवितुम् अर्हति ?Google VideoPoet बृहत् मॉडलः ऑनलाइन अस्ति, नेटिजनाः: क्रान्तिकारी प्रौद्योगिकी

शोधदलेन बहुविधसशर्तसंकेतानां उच्चगुणवत्तायुक्तानां विडियोनां संश्लेषणं कर्तुं समर्थं भाषाप्रतिरूपं VideoPoet इति विमोचनं कृतम् । VideoPoet इत्येतत् चित्रं, विडियो, पाठं, श्रव्यं च समाविष्टं बहु-मोडल-निवेशं नियन्त्रयितुं केवलं डिकोडर-रूपेण Transformer आर्किटेक्चरस्य उपयोगं करोति ।

प्रशिक्षणप्रोटोकॉलः बृहत्भाषाप्रतिमानानाम् (LLMs) पाइपलाइनस्य अनुसरणं करोति तथा च पूर्वप्रशिक्षणं कार्यविशिष्टं अनुकूलनं च इति द्वौ चरणौ भवतः प्रशिक्षणपूर्वपदे VideoPoet बहु-मोडल-जनरेशन-लक्ष्यं स्व-प्रतिगमन-ट्रांसफॉर्मर-रूपरेखायाः अन्तः संयोजयति । पूर्वप्रशिक्षितः एलएलएम आधाररूपेण कार्यं करोति, तस्य अनुकूलनं च विडियोजननकार्यस्य श्रेणीयाः कृते कर्तुं शक्यते । ते शून्य-शॉट्-वीडियो-जनने मॉडलस्य अत्याधुनिकक्षमतां प्रदर्शयन्ति, विशेषतः उच्च-निष्ठा-गति-जननस्य क्षमताम् ।

पत्रं १० : उत्पादनभाषाप्रतिरूपस्य भागस्य चोरी

作者:निकोलस कार्लिनी、डैनियल पलेका、कृष्णमूर्ति द्विजोथम、थॉमस स्टीनके、जोनाथन हयासे、ए. फेडर कूपर、कैथरीन ली、मैथ्यू Jagielski、Milad Nasresfahani、आर्थर Conmy、एरिक वालेस、डेविड Rolnick、फ्लोरियन Tramer

संस्थाः : OpenAI, Google DeepMind, ETH Zurich, वाशिंगटनविश्वविद्यालयः, मैकगिल् विश्वविद्यालयः

पेपर पता: https://arxiv.org/pdf/2403.06634

अस्मिन् पत्रे एआइ मॉडल् आक्रमणस्य नूतना पद्धतिः प्रस्ताविता अस्ति । इदं OpenAI इत्यस्य ChatGPT अथवा Google इत्यस्य PaLM-2 इत्यस्य black-box generative language model इत्यस्मात् सूचनां समीचीनतया निष्कासयितुं शक्नोति । एषा पद्धतिः ट्रांसफॉर्मरस्य एम्बेडेड् प्रोजेक्शन् लेयर (यत् भाषायाः अवगमनस्य प्रमुखः भागः अस्ति) मध्ये भग्नुं शक्नोति, तथा च केवलं एपिआइ-प्रवेशस्य आवश्यकता भवति, वेबसाइट् अथवा एप्लिकेशनस्य माध्यमेन, तथा च मॉडल् इत्यनेन सह गपशपं कृत्वा तत् "पराजयितुं" पत्रे विद्यमानस्य पद्धतेः आधारेण शोधकर्तारः जीपीटी-श्रृङ्खलायाः मूलभूत-माडलयोः सम्पूर्णं प्रक्षेपण-मात्रिकं क्रैक कृतवन्तः, अडा तथा बब्बेज् इत्यादीनां प्रमुख-सूचनाः यथा गुप्त-आयामाः अपि प्रत्यक्षतया क्रैक-कृताः आसन्: एकः १०२४ अपरः २०४८ इति ते gpt-3.5-turbo इत्यस्य गुप्तपरिमाणान् अपि भग्नवन्तः, यदि भवान् मॉडलस्य सम्पूर्णं प्रक्षेपणमात्रिकां पुनः स्थापयितुम् इच्छति तर्हि मूल्यं $2000 अधिकं न भविष्यति एतादृशानां आक्रमणानां निवारणाय शोधकर्तृभिः रक्षापरिपाटानां, शमनरणनीतीनां च श्रृङ्खला प्रस्ताविता अस्ति ।

समाचारं

आमुख

मम सम्पर्कसूचना