समाचारं

Li Feifei इत्यस्य उद्यमशीलतायाः दिशां अवगन्तुं इच्छति वा? अत्र Robot 3D इत्यस्य विषये पत्राणां सूची अस्ति

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय रिपोर्ट

सम्पादक: झांग कियान

८० तः अधिकाः पत्राः "रोबोटिक्स + 3D" इत्यस्य शोधप्रगतिं अवगच्छन्ति ।

किञ्चित्कालपूर्वं बहुविधमाध्यमेन ज्ञातं यत् प्रसिद्धेन एआइ-विद्वानेन स्टैन्फोर्ड-विश्वविद्यालयस्य प्राध्यापकेन च स्थापिता स्टार्टअप-कम्पनी वर्ल्ड लैब्स्-इत्यनेन केवलं मासत्रयेषु वित्तपोषणस्य द्वौ दौरौ सम्पन्नौ अस्य मूल्याङ्कनं एकबिलियन अमेरिकीडॉलर् अतिक्रान्तम् अस्ति, येन एषः नूतनः एकशृङ्गः अभवत् ।

वर्ल्ड लैब्स् इत्यस्य विकासदिशा "स्थानिकबुद्धिः" इति विषये केन्द्रीभूता अस्ति, अर्थात् एतादृशानि प्रतिरूपाणि विकसितुं ये त्रिविमभौतिकजगत् अवगन्तुं शक्नुवन्ति तथा च वस्तुनां भौतिकगुणान्, स्थानिकस्थानं, कार्याणि च अनुकरणं कर्तुं शक्नुवन्ति ली फेइफेइ इत्यस्य मतं यत् "स्थानिकबुद्धिः" एआइ-विकासस्य प्रमुखः भागः अस्ति तस्याः दलं स्टैन्फोर्डविश्वविद्यालयस्य प्रयोगशालायां त्रिविमजगति कार्याणि कर्तुं सङ्गणकान् रोबोट् च प्रशिक्षयति उदाहरणार्थं, अनुमतिं दातुं विशालभाषाप्रतिरूपस्य उपयोगः द्वारं उद्घाट्य मौखिकनिर्देशानुसारं कार्याणि कर्तुं रोबोट् बाहुः। (विवरणार्थं कृपया पश्यन्तु "ली फेइफेइ उद्यमशीलतायाः दिशां "स्थानिकबुद्धिः" व्याख्यायते यत् एआइ यथार्थतया विश्वं अवगन्तुं शक्नोति")



"स्थानिकबुद्धिः" इति अवधारणायाः व्याख्यानार्थं ली फेइफेइ इत्यनेन बिडालस्य चित्रं दर्शितं यत् सः काचम् मेजस्य धारं प्रति धकेलितुं स्वपङ्गुः प्रसारयति सा वदति यत्, एकस्मिन् सेकण्डे मानवमस्तिष्कं "अस्य काचस्य ज्यामितिः, त्रिविम-अन्तरिक्षे तस्य स्थितिः, तस्य मेजस्य, बिडालस्य, एतेषां सर्वेषां वस्तूनाम् सह तस्य सम्बन्धः" इति मूल्याङ्कनं कर्तुं शक्नोति, ततः किं भविष्यति इति पूर्वानुमानं कर्तुं शक्नोति तथा च तस्य निवारणार्थं कार्यं कुर्वन्तु।

वस्तुतः ली फेइफेइ इत्यस्य अतिरिक्तं अधुना बहवः शोधदलाः 3D दृष्टि + रोबोट् इत्यस्य दिशि ध्यानं ददति । एतेषां दलानाम् मतं यत् वर्तमानस्य AI इत्यस्य बहवः सीमाः मॉडलस्य 3D जगतः गहनबोधस्य अभावस्य कारणेन सन्ति । यदि वयम् एतां प्रहेलिकां सम्पूर्णं कर्तुम् इच्छामः तर्हि अस्माभिः 3D दृष्टेः दिशि अधिका शोधशक्तिः निवेशितव्या। तदतिरिक्तं 3D दृष्टिः पर्यावरणस्य गभीरता-बोधं स्थानिक-अवगमनं च प्रदाति, यत् जटिल-त्रि-आयामी-जगति रोबोट्-सञ्चालनस्य, संचालनस्य, निर्णयस्य च कृते महत्त्वपूर्णम् अस्ति

अतः, किं किमपि व्यवस्थितं शोधसामग्री अस्ति यस्याः सन्दर्भं अस्मिन् दिशि शोधकर्तारः कर्तुं शक्नुवन्ति? द हार्ट आफ् द मशीन् इत्यनेन अद्यैव एकं प्राप्तम् :



परियोजनालिङ्कः https://github.com/zubair-irshad/Awesome-Robotics-3D

"Awesome-Robotics-3D" इति नामकं एतत् GitHub भण्डारं "3D vision + robots" इति दिशि कुलम् 80 तः अधिकानि पत्राणि एकत्रितवन्तः अधिकांशपत्राणि तत्सम्बद्धानि कागदानि, परियोजनानि, कोडलिङ्कानि च प्रदास्यन्ति



एतानि पत्राणि निम्नलिखितविषयेषु विभक्तुं शक्यन्ते- १.

  • रणनीतिक शिक्षण
  • पूर्वप्रशिक्षणम्
  • वीएलएम तथा एलएलएम
  • व्यक्त
  • अनुकरणं, दत्तांशसमूहाः, बेन्चमार्काः च

एतेषु पत्रेषु arXiv पूर्वमुद्रणानि, तथैव RSS, ICRA, IROS, CORL इत्यादीनां शीर्षरोबोटिक्ससम्मेलनानां पत्राणि, तथैव CVPR, ICLR, ICML इत्यादीनां सङ्गणकदृष्टेः यन्त्रशिक्षणस्य च क्षेत्रेषु शीर्षसम्मेलनानां पत्राणि च सन्ति ते अतीव मूल्यवान् भवन्ति।

प्रत्येकस्मिन् भागे पत्रसूची निम्नलिखितरूपेण अस्ति ।

1. सामरिकशिक्षणम्





2. पूर्वप्रशिक्षणम्



3. वीएलएम तथा एलएलएम





4. अभिव्यञ्जयति





5. अनुकरणं, आँकडासमूहः, बेन्चमार्कः च





तदतिरिक्तं लेखकः समीक्षापत्रद्वयं अपि प्रदाति यत् भवान् सन्दर्भयितुं शक्नोति-

  • 论文 1:यदा LLMs 3D विश्वे पदानि स्थापयन्ति: बहु-विधा बृहत् भाषा मॉडल् मार्गेण 3D कार्याणां सर्वेक्षणं मेटा-विश्लेषणं च
  • पेपर लिङ्कः https://arxiv.org/pdf/2405.10255

पत्रस्य परिचयः : अयं पत्रः एलएलएम-इत्यस्य 3D-आँकडानां संसाधनं, अवगमनं, जननं च कर्तुं समर्थयति इति पद्धतीनां व्यापकं अवलोकनं प्रददाति, तथा च एलएलएम-सङ्घस्य अद्वितीयलाभान् यथा सन्दर्भे शिक्षणं, चरण-चरण-तर्कः, मुक्तशब्दकोश-क्षमता, विस्तृताः च प्रकाशयति world Knowledge, एते लाभाः मूर्तकृत्रिमबुद्धिप्रणालीषु स्थानिकबोधं अन्तरक्रियाञ्च महत्त्वपूर्णतया उन्नतयन्ति इति अपेक्षा अस्ति। शोधं बिन्दुमेघात् तंत्रिकाविकिरणक्षेत्रं (NeRF) पर्यन्तं विविधानि 3D आँकडाप्रतिपादनविधयः कवरं करोति, तथा च 3D दृश्यसमझं, वर्णनजननं, प्रश्नोत्तरं संवादं च कर्तुं LLM इत्यनेन सह तेषां एकीकरणस्य परीक्षणं करोति, तथैव स्थानिककार्यस्य कृते LLM-आधारित एजेण्ट् यथा तर्कः, योजना, मार्गदर्शनं च । तदतिरिक्तं पत्रे 3D भाषा च एकीकरणस्य अन्येषां पद्धतीनां संक्षेपेण समीक्षा कृता अस्ति । एतेषां अध्ययनानाम् मेटा-विश्लेषणस्य माध्यमेन पत्रे कृता महत्त्वपूर्णा प्रगतिः प्रकाशिता अस्ति तथा च 3D-LLM इत्यस्य क्षमतायाः पूर्णतया शोषणार्थं नूतनानां पद्धतीनां विकासस्य आवश्यकतां प्रकाशयति।

अस्य अन्वेषणस्य समर्थनार्थं लेखकाः एकं परियोजनापृष्ठं स्थापितवन्तः यत् विषयेण सह सम्बद्धानि पत्राणि व्यवस्थितं कृत्वा सूचीकृत्य स्थापयति: https://github.com/ActiveVisionLab/Awesome-LLM-3D



  • पत्र 2: 3-D दृष्टि-आधारित रोबोट हेरफेरस्य व्यापकः अध्ययनः
  • पेपर लिङ्कः https://ieeexplore.ieee.org/document/9541299

पत्रपरिचयः : अस्मिन् लेखे रोबोट्-नियन्त्रणक्षेत्रे 3D-दृष्टेः नवीनतम-प्रगतेः व्यापकरूपेण विश्लेषणं कृतम् अस्ति, विशेषतः मानव-बुद्धेः अनुकरणं कृत्वा रोबोट्-भ्यः अधिक-लचीला-कार्यक्षमता-प्रदाने लेखः 2D दृष्टिप्रणाल्याः चर्चां करोति यस्याः पारम्परिकरोबोट् नियन्त्रणं सामान्यतया अवलम्बते तस्याः सीमाः च, तथा च मुक्तजगति 3D दृष्टिप्रणालीभिः सम्मुखीभूतानां चुनौतीनां सूचनं कृतम् अस्ति, यथा अव्यवस्थितपृष्ठभूमिषु सामान्यवस्तुपरिचयः, ओक्लूजन-अनुमानं, मानवसदृशं लचीलं च नियंत्रणं। लेखः 3D आँकडा-अधिग्रहणं प्रतिनिधित्वं च, रोबोट्-दृष्टि-मापनं, 3D-वस्तु-परिचयः/परिचयः, 6-डिग्री-स्वतन्त्रतायाः मुद्रा-अनुमानं, ग्रहण-अनुमानं, गति-नियोजनं च इत्यादीनां प्रमुख-प्रौद्योगिकीनां कवरं करोति तदतिरिक्तं केचन सार्वजनिकदत्तांशसमूहाः, मूल्याङ्कनमापदण्डाः, तुलनात्मकविश्लेषणं, वर्तमानचुनौत्यं च प्रवर्तन्ते । अन्ते लेखः रोबोट् नियन्त्रणस्य सम्बद्धानां अनुप्रयोगक्षेत्राणां अन्वेषणं करोति तथा च भविष्यस्य शोधदिशानां मुक्तविषयाणां च चर्चां करोति ।

इच्छुकाः पाठकाः शिक्षणं आरभ्य परियोजनालिङ्क् क्लिक् कर्तुं शक्नुवन्ति।