OpenAI इत्यस्य Q* पूर्वं कदापि न दृष्टम्, परन्तु अनेकानाम् स्टार्टअप-कम्पनीनां Q* here

OpenAI इत्यस्य Q* पूर्वं कदापि न दृष्टम्, परन्तु अनेकानाम् स्टार्टअप-कम्पनीनां Q* अत्र अस्ति

2024-07-31

"मन्दं चिन्तयितुं" शक्नुवन्तः एआइ इत्यस्मात् वयं कियत् दूरं स्मः?

लेखिकास्टेफनी पलाज्जोलो

संकलन |

सम्पादकजिंग्यु

गतवर्षे सैम आल्टमैनस्य अस्थायीरूपेण निष्कासनात् पूर्वं पश्चात् च ओपनएआइ-संशोधकाः निदेशकमण्डलाय संयुक्तं पत्रं प्रेषितवन्तः, यत्र क्यू-सङ्केत-नाम्ना रहस्यपूर्णा परियोजना सर्वेभ्यः मानवजातेभ्यः खतरान् जनयितुं शक्नोति इति सूचयति स्म OpenAI इत्यनेन कर्मचारिभ्यः अनुवर्तनात्मके आन्तरिकपत्रे Q* इति स्वीकृतम्, परियोजनायाः वर्णनं च "अतिमानवस्वायत्तप्रणाली" इति कृतम् ।

यद्यपि Q* अद्यापि न दृष्टं तथापि जगति तस्य विषये सर्वदा अफवाः भवन्ति।

गूगल डीपमाइण्ड् इत्यस्य वरिष्ठः अभियंता लु यिफेङ्गः एकदा व्यावसायिकदृष्ट्या Geek Park इत्यस्य अनुमानं कृतवान् यत् मॉडल् इत्यस्य साक्षात्कारस्य आवश्यकता अस्ति यत् काः समस्याः विषये सः निश्चितः नास्ति, अग्रे किं कर्तव्यम् इति। अस्मिन् समये आदर्शस्य अन्तर्जालं भ्रमणं कर्तुं, पुस्तकानि पठितुं, प्रयोगान् कर्तुं, केचन अव्याख्यातविचाराः चिन्तयितुं, मानवसदृशैः अन्यैः सह चर्चां कर्तुं च आवश्यकता भवेत्

अस्मिन् वर्षे यदा अहं प्रमुखानां मॉडलनिर्मातृणां AI सहायक-एप्स्-मध्ये प्रश्नान् पृच्छामि तदा अहं अनुभवितुं शक्नोमि यत् उत्तराणि गतवर्षस्य अपेक्षया अधिकं विश्वसनीयाः सन्ति इति बहवः निर्मातारः अपि अवदन् यत् ते मॉडल्-मध्ये अधिकाधिकं सुधारं कर्तुं परिश्रमं कुर्वन्ति | तेषां तर्कक्षमता। एतावता प्रगतिः कथं वर्तते ?

उपर्युक्तविषयेषु द इन्फॉर्मेशन-रिपोर्टरः स्टेफनी पलाज्जोलो इत्यनेन "How OpenAI's Smaller Rivals Are Developing Their Own AI That 'Reasons'" इति लेखे चीनीयकम्पनी Q* सहितं मॉडल् तर्कक्षमतासु सुधारार्थं विद्यमानानाम् स्टार्टअप-कम्पनीनां मॉडल्-विषये चर्चा कृता Geek Park इत्यनेन आयोजितं, एतत् निम्नलिखितम् अस्ति ।

OpenAI इत्यस्य लघुप्रतियोगिनः

स्वस्य “तर्क” एआइ विकसितं कुर्वन्तु

बुदबुदान् विहाय एआइ इत्यस्य एषा तरङ्गः कियत् उपयोगी अस्ति इति विषयः अस्मिन् वर्षे बहुवारं चर्चायां परीक्षितः अस्ति ।

बृहत्प्रतिरूपस्य सिद्धान्तः संभाव्यतापूर्वसूचनायाः आधारेण एकैकशः शब्दैककानां जननं भवति, परन्तु प्रशिक्षणकाले पोषितस्य कोर्पसस्य आधारेण शब्दानां शुकं करणं, पूर्वं कदापि न दृष्टप्रश्नानां सम्मुखीकरणे मतिभ्रमस्य निर्माणं च स्पष्टतया सर्वेषां न भवति अपेक्षते। आदर्शस्य तर्कक्षमतायां अधिकं सुधारः प्रमुखः अभवत् ।

अस्मिन् विषये अस्माभिः अद्यापि OpenAI तथा Google इत्येतयोः प्रगतिः न दृष्टा, परन्तु केचन स्टार्टअप्स व्यक्तिः च वदन्ति यत् ते AI तर्कक्षमतायाः केषाञ्चन रूपाणां प्राप्त्यर्थं केचन "सस्ताः" पद्धतयः (सस्ते हैक्स्) कल्पितवन्तः।

एतेषु शॉर्टकटेषु जटिलसमस्यां सरलतरपदेषु विभज्य मॉडलं दशकशः अतिरिक्तप्रश्नान् पृच्छति येन तानि पदानि विश्लेषितुं साहाय्यं भवति

यथा, यदा नूतनस्य उत्पादस्य विषये ब्लॉग्-पोस्ट्-मसौदां कर्तुं प्रार्थ्यते तदा एआइ-अनुप्रयोगः स्वयमेव अतिरिक्त-प्रश्नान् प्रेरयति, यथा बृहत्-माडलं तस्य उत्तराणां मूल्याङ्कनं कर्तुं, सुधारार्थं क्षेत्राणां च मूल्याङ्कनं कर्तुं पृच्छति अवश्यं, उपयोक्तृ-अन्तरफलके, पृष्ठभूमितः आदर्शेन कृतानि एतानि क्रियाणि भवन्तः न पश्यन्ति ।

एतत् सुकरातस्य पद्धत्या सदृशं यत् छात्रान् स्वप्रत्ययानां वा तर्कस्य वा विषये समीक्षात्मकरूपेण चिन्तयितुं शिक्षयति । उत्तरार्द्धं प्रश्नोत्तरशिक्षणपद्धतिं स्वीकुर्वति यदा सुकरातः प्रत्यक्षतया उत्तराणि न दास्यति अपितु छात्रान् स्वयमेव समस्यानां आविष्कारं कर्तुं मार्गदर्शनं करिष्यति तथा च सततं प्रश्नान् पृच्छन् तेषां दृष्टिकोणानां विरोधाभासान् न्यूनान् च प्रकाशयिष्यति। , क्रमेण सम्यक् निष्कर्षं प्राप्तुं च सम्यक् ।

एतेन लिङ्केन एआइ एप्लिकेशनं बृहत् मॉडलं उपरिष्टात् ब्लॉग् पोस्ट् पुनः लिखितुं वक्तुं शक्नोति, लेखनकाले केवलं स्वयमेव दत्तं प्रतिक्रियां गृहीत्वा। एषा प्रक्रिया प्रायः प्रतिबिम्बनम् इति उच्यते, एकः एआइ-अनुप्रयोग-उद्यमी च अवदत् यत् एतेन प्रायः उत्तमाः परिणामाः प्राप्यन्ते ।

चिन्तनात्मकपद्धतेः अतिरिक्तं विकासकाः गूगलस्य अनुसरणं कृत्वा प्रयासं कर्तुं अपि शक्नुवन्ति नमूनाकरणं नामकं तन्त्रम् । नमूनाकरणस्य समये विकासकाः एकमेव प्रश्नं दर्जनशः वा १०० वारं अपि पृच्छित्वा ततः उत्तमं उत्तरं चयनं कृत्वा बृहत् मॉडल्-समूहानां रचनात्मकं यादृच्छिकं च उत्तरं उत्पादयितुं क्षमतां सुधारयन्ति

यथा, प्रोग्रामिंग् सहायकः एप् एकं विशालं मॉडलं एकस्यैव प्रश्नस्य १०० भिन्नानि उत्तराणि दातुं पृच्छति, ततः एप् एतान् सर्वान् कोडस्निपेट् चालयति । अन्तिमः प्रोग्रामिंग सहायकः एप् सम्यक् उत्तरं उत्पादयति इति कोडं चयनं करिष्यति तथा च स्वयमेव सर्वाधिकं संक्षिप्तं कोडं चिनोति।

मेटा इत्यनेन स्वस्य हाले एव कृतायां लामा ३ पत्रिकायां केचन समानाः तकनीकाः प्रकाशिताः ।

परन्तु एतत् कार्यपरिहारं-एकं विशालं भाषाप्रतिरूपं १०० वारं आह्वयितुं, अथवा तत् एतावत् पाठं कोडं च निर्गन्तुं पृच्छति-अत्यन्तं मन्दं महत् च भवति । अत एव सम्भवतः केचन विकासकाः एतानि प्रौद्योगिकीनि उपयुज्यमानेन स्टार्टअप-संस्थायाः Cognition-इत्यनेन निर्मितस्य प्रोग्रामिंग-सहायकस्य मन्द-प्रदर्शनस्य आलोचनां कृतवन्तः ।

विकासकाः अपि एतां समस्यां दृष्टवन्तः, ते तस्याः समाधानं कर्तुं प्रयतन्ते।मार्गः अस्तिविशिष्टसमस्यायाः कृते उत्तमं तर्कक्षमतां दर्शयन्तः आदर्शस्य उदाहरणानि चित्वा तान् प्रतिरूपं प्रति "फीड" कुर्वन्तुप्रशिक्षणदत्तांशःएतस्याः समस्यायाः समाधानं प्रति ध्यानं दत्तव्यम्। यथा एकः उद्यमी अवदत्, एषः उपायः प्राथमिकविद्यालये गुणनसारणीनां शिक्षणस्य सदृशः अस्ति । प्रारम्भे छात्राणां प्रत्येकस्य गुणनसमस्यायाः हस्तचलितरूपेण गणनायाः आवश्यकता भवितुम् अर्हति । परन्तु कालान्तरे, ते च एतानि गुणनसारणीनि कण्ठस्थं कुर्वन्ति, उत्तराणि प्रायः छात्रस्य अन्तःकरणस्य भागः भवन्ति ।

एतादृशस्य AI इत्यस्य विकासाय विकासकानां बृहत् मॉडल् इत्यस्य नियन्त्रणस्य आवश्यकता भवति । परन्तु OpenAI अथवा Anthropic इत्यस्य बन्दस्रोतप्रतिरूपेभ्यः नियन्त्रणस्य भावः प्राप्तुं कठिनं भवति, अतः तेषां कृते Llama 3 इव मुक्तभारप्रतिरूपस्य उपयोगः अधिकः भवति (मुक्तभारः मुक्तस्रोतजगति एकः पदः अस्ति, अर्थात् उच्चयुक्तः कोडः अस्ति मुक्ततायाः डिग्री) इति ।

उपर्युक्तौ पद्धतौ OpenAI इत्यनेन तर्कशास्त्रे स्वस्य सफलतायाः पृष्ठतः प्रयुक्ताः प्रौद्योगिकीः भवितुम् अर्हन्ति । अवश्यं OpenAI इत्यनेन अद्यापि Q* इति न प्रकाशितम्, यत् "Strawberry" परियोजना इति अपि ज्ञायते ।

चीनस्य प्र* .

चीनदेशस्य विकासकाः शोधकर्तारः अपि क्रमेण एतेषु प्रौद्योगिकीषु निपुणतां प्राप्नुवन्ति ।

चीनस्य स्काईवर्क् एआइ तथा नान्याङ्ग टेक्नोलॉजिकल यूनिवर्सिटी इत्येतयोः शोधकर्तारः अस्मिन् वर्षे जूनमासे अस्मिन् विषये एकं पत्रं प्रकाशितवन्तः। अस्मिन् लेखे ते पूर्वं कदापि न दृष्टस्य OpenAI इत्यस्य संस्करणस्य सम्मानार्थं प्रौद्योगिक्याः नाम Q* इति अपि कृतवन्तः ।

चीनस्य Q* प्रौद्योगिक्याः कारणात् बृहत् मॉडल् बहुभिः चरणैः समस्यानां समाधानं कर्तुं शक्नोति, यथा जटिलतर्कपहेलिका ।

मार्गः अस्तिउत्तरस्य प्रत्येकं पदे "अन्वेषणेन" सर्वोत्तमः अग्रिमः सोपानः यत् बृहत् मॉडलः प्रयासं कर्तव्यः, न तु निष्कर्षं प्राप्तुं पदानि अनुसृत्य (एषा पद्धतिः मोंटे कार्लो वृक्ष अन्वेषणम् इति अपि ज्ञायते तथा च पूर्वं गूगल आल्फागो इत्यत्र उपयुज्यते स्म) . इदं Q-मूल्यप्रतिरूपं नामकस्य विशेषसमीकरणस्य माध्यमेन सिद्धं भवति यत् बृहत्प्रतिरूपस्य प्रत्येकस्य सम्भाव्यस्य अग्रिमपदस्य भविष्यस्य पुरस्कारस्य अनुमानं कर्तुं साहाय्यं करोति-अथवा अन्तिमम् उत्तरं सम्यक् इति संभावना।

अस्मिन् शरदऋतौ एतत् प्रौद्योगिकीं सार्वजनिकरूपेण विमोचयितुं योजनां कुर्वन्ति इति शोधकर्तारः वदन्ति।

बुद्धिमान् एजेण्ट् स्टार्टअपस्य Minion AI इत्यस्य मुख्यकार्यकारी तथा च GitHub Copilot इत्यस्य पूर्वमुख्यवास्तुकारः Alex Graveley इत्ययं कथयति यत् ते अद्यापि प्रयासं कुर्वन्ति भाषाप्रतिरूपं यदा किमपि भ्रष्टं जातम् इति अवगच्छति तदा एकं पदं पश्चात् गन्तुं शिक्षयन्तु।सः दावान् करोति यत् एषा जागरूकता तदा भवितुम् अर्हति यदा बृहत् प्रतिरूपं अशुद्धं उत्तरं उत्पादयति अथवा तस्य मध्यवर्तीपदेषु चिन्तनं कर्तुं प्रार्थ्यते (उपरि ब्लोग् पोस्ट् मध्ये उदाहरणस्य सदृशम्), त्रुटिः कृता इति अवगत्य ।

उद्योगे अधिकाः प्रयासाः सन्ति, यत्र मार्चमासे स्टैन्फोर्डविश्वविद्यालयेन प्रकाशितं "Quiet-STaR" इति पत्रं, नॉटबैड् एआइ च । यथा मनुष्याः वक्तुं वा लेखनात् वा पूर्वं स्वविचारस्य विषये चिन्तयितुं विरामं कुर्वन्ति, तथैव अस्मिन् पत्रे व्याख्यायते यत् कथं बृहत्भाषाप्रतिमानं शिक्षितुं शक्यते यत् ते जटिलतर्कसमस्यासु तेषां आन्तरिक "चिन्तन"पदार्थानाम् विषये सूचनां जनयन्ति येन ते उत्तमनिर्णयान् कर्तुं शक्नुवन्ति।

OpenAI इत्यस्य Q*/Strawberry प्रौद्योगिक्याः हेडस्टार्टः भवितुम् अर्हति, परन्तु अन्ये सर्वे तत् ग्रहीतुं दौडं कुर्वन्ति इति दृश्यते।

*मुख्यप्रतिबिम्बस्रोतः: गल्फन्यूज

गीकः पृष्टवान्

किं भवन्तः मन्यन्ते यत् वयं दूरं स्मः

"मन्दचिन्तनं" कर्तुं शक्नोति इति एआइ यावत् कियत् दूरम् अस्ति?

iOS 18.1 beta call recording इत्यस्य वास्तविकं मापनं, Android phone अद्यापि recording prompts प्राप्तुं शक्नोति।

Like and followGeek Park वीडियो खाता，

समाचारं

OpenAI इत्यस्य Q* पूर्वं कदापि न दृष्टम्, परन्तु अनेकानाम् स्टार्टअप-कम्पनीनां Q* अत्र अस्ति

आमुख

मम सम्पर्कसूचना