Google AI इत्यनेन IMO Mathematical Olympiad रजतपदकं प्राप्तम्, AlphaProof इति प्रारम्भः अभवत्, सुदृढीकरणशिक्षणं च एतावत् back

गूगल एआइ इत्यनेन IMO Mathematical Olympiad रजतपदकं प्राप्तम्, AlphaProof इति प्रारम्भः अभवत्, सुदृढीकरणशिक्षणं च एतावत् पुनः आगतं

2024-07-26

मशीन हृदय रिपोर्ट

मशीन हृदय सम्पादकीय विभाग

मिथुनस्य बृहत् मॉडलस्य तथा AlphaZero सुदृढीकरणशिक्षणस्य एल्गोरिदमस्य उपयोगेन ज्यामितिः, बीजगणितं, संख्यासिद्धान्तं च निपुणतां प्राप्तुं शक्नुवन्ति ।

एआइ कृते गणितीय-ओलम्पियाड् इदानीं समस्या नास्ति ।

गुरुवासरे गूगल डीपमाइण्ड् इत्यस्य कृत्रिमबुद्धिः एकं पराक्रमं सम्पन्नवती यत् अस्मिन् वर्षे अन्तर्राष्ट्रीयगणितीयओलम्पियाड् IMO इत्यस्य वास्तविकप्रश्नस्य समाधानार्थं AI इत्यस्य उपयोगः, तथा च स्वर्णपदकं प्राप्तुं केवलं एकं पदं दूरम् आसीत्।

गतसप्ताहे एव समाप्तवती IMO प्रतियोगितायां बीजगणितं, संयोजनविज्ञानं, ज्यामितिः, संख्यासिद्धान्तः च समाविष्टाः षट् प्रश्नाः आसन् । गूगलेन प्रस्तावितायाः संकर-एआइ-प्रणाल्याः चत्वारि प्रश्नाः सम्यक् प्राप्ताः, २८ अंकाः च प्राप्ताः, रजतपदकस्तरं प्राप्तवन्तः ।

अस्मिन् मासे प्रारम्भे यूसीएलए-सङ्घस्य कार्यकालस्य प्राध्यापकः टेरेन्स ताओ इत्यनेन एआइ-गणित-ओलम्पियाड् (एआईएमओ-प्रगति-पुरस्कार) इत्यस्य प्रचारः अधुना एव कोटि-डॉलर-पुरस्कारेण कृतः आसीत्

IMO, प्रश्नान् युगपत् कृत्वा कठिनतमान् प्रश्नान् सम्यक् प्राप्नुवन्तु।

IMO युवानां गणितज्ञानाम् कृते प्राचीनतमः, बृहत्तमः, प्रतिष्ठितः च स्पर्धा अस्ति, यः १९५९ तमे वर्षात् प्रतिवर्षं आयोजितः भवति । अधुना एव IMO प्रतियोगिता यन्त्रशिक्षणक्षेत्रे भव्यचुनौत्यरूपेण अपि व्यापकरूपेण स्वीकृता अस्ति, कृत्रिमबुद्धिप्रणालीनां उन्नतगणितीयतर्कक्षमतानां मापनार्थं आदर्शमापदण्डः अभवत्

अस्मिन् वर्षे IMO प्रतियोगितायां DeepMind दलेन विकसिताः AlphaProof तथा AlphaGeometry 2 इत्यनेन संयुक्तरूपेण एकं माइलस्टोन् सफलतां प्राप्तम्।

तेषु AlphaProof औपचारिकगणितीयतर्कस्य कृते सुदृढीकरणशिक्षणप्रणाली अस्ति, AlphaGeometry 2 च DeepMind इत्यस्य ज्यामितिसमाधानप्रणाली AlphaGeometry इत्यस्य उन्नतसंस्करणम् अस्ति

एषा सफलता विज्ञानस्य प्रौद्योगिक्याः च नूतनानि क्षेत्राणि उद्घाटयितुं उन्नतगणितीयतर्कक्षमताभिः सह कृत्रिमसामान्यबुद्धेः (AGI) क्षमतां प्रदर्शयति

अतः, DeepMind इत्यस्य AI प्रणाली IMO प्रतियोगितायां कथं भागं गृहीतवती?

सरलतया वक्तुं शक्यते यत् एताः गणितीयसमस्याः प्रथमं औपचारिकगणितीयभाषायां हस्तचलितरूपेण अनुवादिताः भवन्ति येन एआइ-प्रणाली तान् अवगन्तुं शक्नोति । आधिकारिकस्पर्धायां मानवप्रतियोगिनः द्वयोः सत्रयोः (दिनद्वये) उत्तराणि प्रस्तौति, प्रत्येकस्य सत्रस्य समयसीमा ४.५ घण्टाः भवति । AlphaProof+AlphaGeometry 2 इत्यनेन निर्मितेन AI-प्रणाल्या एकां समस्यां कतिपयेषु निमेषेषु समाधानं कृतम्, परन्तु अन्यसमस्यानां समाधानार्थं त्रयः दिवसाः यावत् समयः अभवत् । यद्यपि यदि भवान् नियमानाम् अनुसरणं कठोररूपेण करोति तर्हि DeepMind इत्यस्य प्रणाल्याः समयः समाप्तः अस्ति। केचन जनाः अनुमानयन्ति यत् अस्मिन् बहुधा क्रूरबलस्य क्रैकिंग् भवितुं शक्नोति ।

आल्फाप्रूफ् इत्यनेन उत्तराणि निर्धारयित्वा तेषां सम्यक्त्वं सिद्ध्य द्वौ बीजगणितसमस्यौ, एकस्याः संख्यासिद्धान्तसमस्यायाः च समाधानं कृतम् इति गूगलः अवदत्। एतेषु प्रतियोगितायां कठिनतमा समस्या अन्तर्भवति, यस्याः समाधानं अस्मिन् वर्षे IMO इत्यत्र केवलं पञ्च प्रतियोगिनः एव कृतवन्तः। तथा च AlphaGeometry 2 ज्यामितिसमस्यां सिद्धयति।

एआइ द्वारा दत्तं समाधानम् : https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/index.html

IMO स्वर्णपदकविजेता तथा फील्ड्स् पदकविजेता Timothy Gowers तथा IMO 2024 समस्याचयनसमितेः अध्यक्षः द्विवारं IMO स्वर्णपदकविजेता डॉ. Joseph Myers इत्यनेन IMO स्कोरिंग् नियमानुसारं संयुक्तप्रणाल्या दत्तानां समाधानानाम् स्कोरः कृतः।

षट् प्रश्नेषु प्रत्येकं ७ अंकस्य मूल्यं भवति, अधिकतमं कुलम् ४२ अंकं प्राप्तुं । DeepMind इत्यस्य प्रणाल्याः अन्तिमः स्कोरः २८ प्राप्तः, अर्थात् तया समाधानं कृतानां चतुर्णां समस्यानां कृते परिपूर्णाङ्काः प्राप्ताः - रजतपदकवर्गे सर्वोच्चाङ्कस्य बराबरम् अस्मिन् वर्षे स्वर्णपदकस्य सीमा २९ अंकाः आसीत्, आधिकारिकस्पर्धायां ६०९ क्रीडकानां मध्ये ५८ क्रीडकाः स्वर्णपदकं प्राप्तवन्तः ।

अयं आलेखः IMO 2024 इत्यस्मिन् मानवप्रतियोगिनां सापेक्षतया Google DeepMind इत्यस्य कृत्रिमबुद्धिप्रणाल्याः कार्यक्षमतां दर्शयति । प्रणाली कुल ४२ अंकानाम् मध्ये २८ अंकं प्राप्तवती, प्रतियोगितायाः रजतपदकविजेतुः समानस्तरं प्राप्तवान् । तदतिरिक्तं अस्मिन् वर्षे २९ अंकाः स्वर्णपदकं प्राप्तुं शक्नुवन्ति ।

AlphaProof: एकः औपचारिकः तर्कविधिः

गूगलेन प्रयुक्तेषु संकर-एआइ-प्रणालीषु आल्फाप्रूफ् इति स्वयमेव प्रशिक्षिता प्रणाली अस्ति, या गणितीयकथनानि सिद्धयितुं औपचारिकभाषा Lean इत्यस्य उपयोगं करोति । एतत् पूर्वप्रशिक्षितं भाषाप्रतिरूपं AlphaZero सुदृढीकरणशिक्षण-अल्गोरिदम् इत्यनेन सह संयोजयति ।

तेषु औपचारिकभाषा गणितीयतर्कप्रमाणानां सम्यक्त्वस्य औपचारिकरूपेण सत्यापनार्थं महत्त्वपूर्णलाभान् प्रददति । अद्यावधि यन्त्रशिक्षणे एतस्य सीमितप्रयोगः अभवत् यतः मानवलिखितदत्तांशस्य परिमाणम् अतीव सीमितम् आसीत् ।

तस्य विपरीतम् प्राकृतिकभाषा-आधारित-विधयः अधिकमात्रायां दत्तांशस्य अभिगमं प्राप्य अपि मध्यवर्ती-तर्क-पदार्थाः समाधानं च उत्पादयन्ति ये युक्तियुक्ताः प्रतीयन्ते परन्तु अशुद्धाः सन्ति

Google DeepMind इत्यनेन प्राकृतिकभाषासमस्यानां कथनानां औपचारिककथनेषु स्वयमेव अनुवादं कर्तुं मिथुनस्य प्रतिरूपं सूक्ष्मरूपेण स्थापयित्वा एतयोः पूरकक्षेत्रयोः मध्ये सेतुः निर्माति, येन भिन्नकठिनतायाः औपचारिकसमस्यानां विशालः पुस्तकालयः निर्मीयते

गणितीयसमस्यां दत्त्वा AlphaProof अभ्यर्थीसमाधानं जनयति ततः Lean इत्यस्मिन् सम्भाव्यप्रमाणपदार्थानाम् अन्वेषणेन तान् सिद्धयति । प्रत्येकं प्रमाणसमाधानं प्राप्तं सत्यापितं च AlphaProof इत्यस्य भाषाप्रतिरूपं सुदृढं कर्तुं तदनन्तरं अधिकचुनौतीपूर्णसमस्यानां समाधानार्थं तस्य क्षमतां वर्धयितुं च उपयुज्यते।

AlphaProof इत्यस्य प्रशिक्षणार्थं Google DeepMind इत्यनेन IMO प्रतियोगितायाः पूर्वसप्ताहेषु कठिनतानां विषयाणां च विस्तृतश्रेणीं आच्छादयन्तः कोटिकोटि गणितीयसमस्याः सिद्धाः अथवा असिद्धाः। स्पर्धायाः समये स्वयमेव उत्पन्नप्रतियोगितासमस्यानां रूपान्तराणां प्रमाणं सुदृढं कर्तुं प्रशिक्षणपाशः अपि प्रयुक्तः भवति यावत् सम्पूर्णं समाधानं न लभ्यते

AlphaProof reinforcement learning training loop process infographic: प्रायः दशलाखं अनौपचारिकगणितीयसमस्याः औपचारिकजालद्वारा औपचारिकगणितीयभाषायां अनुवादिताः भवन्ति। ततः समाधानकर्ता समस्यायाः प्रमाणानि वा असत्यं वा जालपुटे अन्वेषयति, क्रमेण AlphaZero एल्गोरिदम् इत्यस्य उपयोगेन अधिकचुनौत्यसमस्यानां समाधानार्थं स्वयमेव प्रशिक्षयति

अधिक प्रतिस्पर्धी अल्फाज्यामिति 2

AlphaGeometry 2 AlphaGeometry इत्यस्य महत्त्वपूर्णतया उन्नतं संस्करणम् अस्ति, यत् गणितीयं AI अस्मिन् वर्षे Nature पत्रिकायां प्रकाशितम् । इयं न्यूरो-प्रतीकात्मकसंकरप्रणाली अस्ति यस्मिन् भाषाप्रतिरूपं मिथुनराशिना आधारितं भवति तथा च पूर्ववर्तीपेक्षया अधिकसंश्लेषितदत्तांशस्य परिमाणस्य क्रमेण आद्यतः प्रशिक्षितं भवति एतेन प्रतिरूपस्य अधिकचुनौत्यपूर्णानां ज्यामितीयसमस्यानां समाधानं भवति, यत्र वस्तुगतिः, कोणानां, अनुपातस्य, दूरस्य वा समीकरणस्य विषये च समस्याः सन्ति ।

AlphaGeometry 2 इत्यस्मिन् प्रतीकात्मकं इञ्जिनं दृश्यते यत् पूर्ववर्ती इञ्जिनात् द्वौ क्रमौ द्रुततरं भवति । यदा नूतनाः समस्याः सम्मुखीभवन्ति तदा नवीनज्ञानसाझेदारीतन्त्राणि अधिकजटिलसमस्यानां समाधानार्थं विभिन्नानां अन्वेषणवृक्षाणां उन्नतसंयोजनानि सक्षमं कुर्वन्ति ।

अस्मिन् वर्षे स्पर्धायाः पूर्वं अल्फाज्योमेट्री २ विगत २५ वर्षेषु सर्वासु ऐतिहासिकानाम् IMO ज्यामितिसमस्यानां ८३% समाधानं कर्तुं शक्नोति, यदा तु पूर्ववर्ती केवलं ५३% समस्यानां समाधानं कर्तुं शक्नोति स्म IMO 2024 इत्यस्मिन् AlphaGeometry 2 इत्यनेन औपचारिकीकरणं प्राप्तस्य 19 सेकेण्ड् अन्तः समस्या 4 इत्यस्य समाधानं कृतम् ।

प्रश्नस्य ४ उदाहरणार्थं ∠KIL तथा ∠XPY इत्येतयोः योगः १८०° इत्यस्य बराबरः इति सिद्धयितुं आवश्यकम् अस्ति । AlphaGeometry 2 इत्यनेन BI रेखायां बिन्दु E इत्यस्य निर्माणं प्रस्तावितं यत् ∠AEB = 90° । बिन्दु E रेखाखण्डस्य AB इत्यस्य मध्यबिन्दु L इत्यस्मै अर्थं दातुं साहाय्यं करोति, तस्मात् निष्कर्षं सिद्धयितुं ABE ~ YBI तथा ALE ~ IPC इत्यादीनां समानत्रिकोणानां अनेकयुग्मानां निर्माणं भवति

गूगल डीपमाइण्ड् इत्यनेन इदमपि ज्ञापितं यत् IMO कार्यस्य भागत्वेन शोधकर्तारः मिथुनराशिना आधारितस्य नूतनायाः प्राकृतिकभाषातर्कप्रणाल्याः अपि च अत्याधुनिकस्य प्राकृतिकभाषातर्कप्रणाल्याः प्रयोगं कुर्वन्ति, उन्नतसमस्यानिराकरणक्षमतां प्राप्तुं आशां कुर्वन्ति। प्रणाल्याः प्रश्नानां औपचारिकभाषायां अनुवादस्य आवश्यकता नास्ति तथा च अन्यैः एआइ-प्रणालीभिः सह संयोजितुं शक्यते । अस्मिन् वर्षे IMO प्रतियोगिताप्रश्नानां परीक्षायां "महाक्षमता दर्शितवती" ।

गूगलः गणितीयतर्कस्य उन्नतिं कर्तुं एआइ-पद्धतीनां अन्वेषणं निरन्तरं कुर्वन् अस्ति तथा च अल्फाप्रूफ् विषये अधिकानि तकनीकीविवरणानि शीघ्रमेव प्रकाशयितुं योजनां करोति।

वयं भविष्यस्य विषये उत्साहिताः स्मः यस्मिन् गणितज्ञाः परिकल्पनानां अन्वेषणार्थं एआइ-उपकरणानाम् उपयोगं करिष्यन्ति, दीर्घकालीनसमस्यानां समाधानार्थं साहसिक-नवीन-दृष्टिकोणानां प्रयोगं करिष्यन्ति, प्रमाणानां समयग्राहिणः तत्त्वानि च शीघ्रं पूर्णं करिष्यन्ति-तथा च मिथुन-सदृशाः एआइ-प्रणाल्याः गणितस्य भेदं करिष्यन्ति तथा अधिकं व्यापकः तर्कपक्षः अधिकं शक्तिशाली भवति।

शोधदलम्

गूगलेन उक्तं यत् नूतनं शोधं अन्तर्राष्ट्रीयगणितीय-ओलम्पियाड्-संस्थायाः समर्थनं कृतम्, तदतिरिक्तं च :

AlphaProof विकासस्य नेतृत्वं Thomas Hubert, Rishi Mehta, Laurent Sartran च कृतवन्तः प्रमुखाः योगदानकर्तारः Huseen Masoom, Aja Huang, Miklós Z. Horváth, Tom Zahavy, Vivek Veeriah, Eric Wieser, Jessica Yung, Lei Yu, Yannick Schroecker, Julian Schrittwieser, इत्यादयः सन्ति; ओटाविया बर्टोल्लि, बोर्जा इबार्ज्, एडवर्ड लॉकहार्ट्, एडवर्ड ह्युग्स्, मार्क रोलैण्ड्, ग्रेस् मार्गाण्ड् च ।

तेषु अजा हुआङ्ग, जूलियन श्रिट्विसर, यानिक् श्रोकर इत्यादयः सदस्याः अपि ८ वर्षपूर्वं (२०१६) आल्फागो-पत्रस्य मूलसदस्याः आसन् । अष्टवर्षपूर्वं तेषां सुदृढीकरणशिक्षणस्य आधारेण निर्मितं आल्फागो इति संस्था प्रसिद्धा अभवत् । अष्टवर्षेभ्यः अनन्तरं पुनः सुदृढीकरणशिक्षणं आल्फाप्रूफ् इत्यत्र प्रकाशते। मित्रमण्डले कश्चन शोचति स्म : आर एल इत्येव पुनः आगतः!

अल्फाज्यामेट्री २ तथा प्राकृतिकभाषानुमानकार्यस्य नेतृत्वं थाङ्ग लुओङ्ग इत्यनेन क्रियते । अल्फाज्योमेट्री २ इत्यस्य विकासस्य नेतृत्वं त्रियू त्रिन्हः, यूरी चेर्वोन्यी च कृतवन्तः, यत्र मिरेक् ओल्शाक्, जिओमेङ्ग याङ्ग, होआङ्ग गुयेन्, जुनेह्युक् जङ्ग, डाउसेन् ह्वाङ्ग, मार्सेलो मेनेगाली च महत्त्वपूर्णं योगदानं दत्तवन्तः

तदतिरिक्तं डेविड् सिल्वर, क्वाक् ले, हस्साबिस्, पशमीत कोहली च सम्पूर्णस्य परियोजनायाः समन्वयस्य प्रबन्धनस्य च दायित्वं धारयन्ति ।

सन्दर्भ सामग्रीः १.

https://deepmind.google/discover/blog/ai-रजत-पदक-स्तरस्य-इमो-समस्यानां-समाधानं-कृतम्/

समाचारं

गूगल एआइ इत्यनेन IMO Mathematical Olympiad रजतपदकं प्राप्तम्, AlphaProof इति प्रारम्भः अभवत्, सुदृढीकरणशिक्षणं च एतावत् पुनः आगतं

आमुख

मम सम्पर्कसूचना