Το Google AI κέρδισε το ασημένιο μετάλλιο της Μαθηματικής Ολυμπιάδας του IMO, το AlphaProof ξεκίνησε και η ενισχυτική μάθηση είναι τόσο μεγάλη back

Η Google AI κέρδισε το ασημένιο μετάλλιο της Μαθηματικής Ολυμπιάδας του IMO, το AlphaProof ξεκίνησε και η ενισχυτική μάθηση επιστρέφει

2024-07-26

Αναφορά Μηχανικής Καρδιάς

Τμήμα Σύνταξης Machine Heart

Χρησιμοποιώντας το μεγάλο μοντέλο Gemini και τον αλγόριθμο μάθησης ενίσχυσης AlphaZero, μπορείτε να κατακτήσετε τη γεωμετρία, την άλγεβρα και τη θεωρία αριθμών.

Για την τεχνητή νοημοσύνη, η Μαθηματική Ολυμπιάδα δεν είναι πλέον πρόβλημα.

Την Πέμπτη, η τεχνητή νοημοσύνη του Google DeepMind ολοκλήρωσε ένα κατόρθωμα: χρησιμοποίησε την τεχνητή νοημοσύνη για να λύσει το πραγματικό ερώτημα της φετινής Διεθνούς Μαθηματικής Ολυμπιάδας IMO και ήταν μόλις ένα βήμα μακριά από την κατάκτηση του χρυσού μεταλλίου.

Ο διαγωνισμός του ΙΜΟ που μόλις ολοκληρώθηκε την περασμένη εβδομάδα είχε έξι ερωτήσεις που αφορούσαν την άλγεβρα, τη συνδυαστική, τη γεωμετρία και τη θεωρία αριθμών. Το υβριδικό σύστημα τεχνητής νοημοσύνης που πρότεινε η Google πήρε τέσσερις ερωτήσεις σωστά και σημείωσε 28 βαθμούς, φτάνοντας στο επίπεδο του ασημένιου μεταλλίου.

Νωρίτερα αυτόν τον μήνα, ο μόνιμος καθηγητής του UCLA, Terence Tao, είχε μόλις προωθήσει τη Μαθηματική Ολυμπιάδα AI (AiMO Progress Award) με ένα βραβείο εκατομμυρίων δολαρίων.

IMO, κάνε τις ερωτήσεις ταυτόχρονα και λύσε σωστά τις πιο δύσκολες ερωτήσεις.

Ο IMO είναι ο παλαιότερος, μεγαλύτερος και πιο διάσημος διαγωνισμός για νέους μαθηματικούς, που διεξάγεται κάθε χρόνο από το 1959. Πρόσφατα, ο διαγωνισμός του ΙΜΟ έχει επίσης αναγνωριστεί ευρέως ως μια μεγάλη πρόκληση στον τομέα της μηχανικής μάθησης, καθιστώντας το ιδανικό σημείο αναφοράς για τη μέτρηση των προηγμένων μαθηματικών συλλογιστικών ικανοτήτων των συστημάτων τεχνητής νοημοσύνης.

Στον φετινό διαγωνισμό του ΙΜΟ, το AlphaProof και το AlphaGeometry 2 που αναπτύχθηκαν από την ομάδα DeepMind πέτυχαν από κοινού μια σημαντική ανακάλυψη.

Μεταξύ αυτών, το AlphaProof είναι ένα ενισχυτικό σύστημα εκμάθησης για τυπικό μαθηματικό συλλογισμό και το AlphaGeometry 2 είναι μια βελτιωμένη έκδοση του συστήματος επίλυσης γεωμετρίας AlphaGeometry της DeepMind.

Αυτή η ανακάλυψη καταδεικνύει τις δυνατότητες της τεχνητής γενικής νοημοσύνης (AGI) με προηγμένες μαθηματικές συλλογιστικές ικανότητες να ανοίξει νέους τομείς της επιστήμης και της τεχνολογίας.

Λοιπόν, πώς συμμετείχε το σύστημα AI της DeepMind στον διαγωνισμό του ΙΜΟ;

Για να το θέσω απλά, αυτά τα μαθηματικά προβλήματα μεταφράζονται πρώτα χειροκίνητα σε επίσημη μαθηματική γλώσσα, έτσι ώστε το σύστημα AI να μπορεί να τα κατανοήσει. Στον επίσημο διαγωνισμό, οι ανθρώπινοι διαγωνιζόμενοι υποβάλλουν τις απαντήσεις τους σε δύο συνεδρίες (δύο ημέρες), με χρονικό όριο τις 4,5 ώρες για κάθε συνεδρία. Το σύστημα AI που αποτελείται από AlphaProof+AlphaGeometry 2 έλυσε ένα πρόβλημα σε λίγα λεπτά, αλλά χρειάστηκε τρεις ημέρες για να λυθούν άλλα προβλήματα. Αν και αν ακολουθήσετε αυστηρά τους κανόνες, το σύστημα του DeepMind έχει λήξει. Μερικοί άνθρωποι εικάζουν ότι αυτό μπορεί να περιλαμβάνει πολύ σκληρό ράγισμα.

Το AlphaProof έλυσε δύο προβλήματα άλγεβρας και ένα πρόβλημα θεωρίας αριθμών προσδιορίζοντας τις απαντήσεις και αποδεικνύοντας την ορθότητά τους, είπε η Google. Αυτά περιλαμβάνουν το δυσκολότερο πρόβλημα του διαγωνισμού, το οποίο έλυσαν μόνο πέντε διαγωνιζόμενοι στο φετινό IMO. Και το AlphaGeometry 2 αποδεικνύει ένα πρόβλημα γεωμετρίας.

Λύση δίνεται από AI: https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/imo-2024-solutions/index.html

Ο χρυσός Ολυμπιονίκης του ΙΜΟ και ο Χρυσός Ολυμπιονίκης του Fields, Timothy Gowers και ο δύο φορές χρυσός Ολυμπιονίκης του ΙΜΟ, Δρ. Joseph Myers, πρόεδρος της Επιτροπής Επιλογής Προβλημάτων του ΙΜΟ 2024, βαθμολόγησαν τις λύσεις που δίνονται από το συνδυασμένο σύστημα σύμφωνα με τους κανόνες βαθμολόγησης του ΙΜΟ.

Κάθε μία από τις έξι ερωτήσεις αξίζει 7 βαθμούς, για μέγιστη συνολική βαθμολογία 42 βαθμούς. Το σύστημα του DeepMind έλαβε τελική βαθμολογία 28, που σημαίνει ότι και τα τέσσερα προβλήματα που έλυσε έλαβαν τέλειες βαθμολογίες - ισοδύναμες με την υψηλότερη βαθμολογία στην κατηγορία των ασημένιων μεταλλίων. Το φετινό όριο του χρυσού μεταλλίου ήταν 29 βαθμοί και 58 από τους 609 παίκτες του επίσημου διαγωνισμού κέρδισαν χρυσά μετάλλια.

Αυτό το γράφημα δείχνει την απόδοση του συστήματος τεχνητής νοημοσύνης της Google DeepMind σε σχέση με ανθρώπους ανταγωνιστές στο IMO 2024. Το σύστημα συγκέντρωσε 28 βαθμούς σε σύνολο 42 βαθμών, φτάνοντας στο ίδιο επίπεδο με τον ασημένιο ολυμπιονίκη του διαγωνισμού. Επιπλέον, φέτος, 29 βαθμούς μπορούν να κερδίσουν το χρυσό μετάλλιο.

AlphaProof: μια επίσημη μέθοδος συλλογισμού

Μεταξύ των υβριδικών συστημάτων AI που χρησιμοποιεί η Google, το AlphaProof είναι ένα αυτοεκπαιδευμένο σύστημα που χρησιμοποιεί την επίσημη γλώσσα Lean για να αποδείξει μαθηματικές δηλώσεις. Συνδυάζει ένα προεκπαιδευμένο μοντέλο γλώσσας με τον αλγόριθμο μάθησης ενίσχυσης AlphaZero.

Μεταξύ αυτών, οι επίσημες γλώσσες παρέχουν σημαντικά πλεονεκτήματα για την επίσημη επαλήθευση της ορθότητας των αποδείξεων μαθηματικού συλλογισμού. Μέχρι τώρα, αυτό ήταν περιορισμένης χρήσης στη μηχανική εκμάθηση, επειδή ο όγκος των δεδομένων που γράφτηκαν από τον άνθρωπο ήταν πολύ περιορισμένος.

Αντίθετα, οι μέθοδοι που βασίζονται σε φυσικές γλώσσες, παρά το γεγονός ότι έχουν πρόσβαση σε μεγαλύτερες ποσότητες δεδομένων, παράγουν ενδιάμεσα συλλογιστικά βήματα και λύσεις που φαίνονται λογικές αλλά είναι εσφαλμένες.

Το Google DeepMind δημιουργεί μια γέφυρα μεταξύ αυτών των δύο συμπληρωματικών πεδίων, προσαρμόζοντας το μοντέλο Gemini για να μεταφράζει αυτόματα δηλώσεις προβλημάτων φυσικής γλώσσας σε επίσημες δηλώσεις, δημιουργώντας έτσι μια μεγάλη βιβλιοθήκη τυπικών προβλημάτων διαφορετικής δυσκολίας.

Με δεδομένο ένα μαθηματικό πρόβλημα, το AlphaProof δημιουργεί υποψήφιες λύσεις και στη συνέχεια τις αποδεικνύει αναζητώντας πιθανά βήματα απόδειξης στο Lean. Κάθε αποδεικτική λύση που βρίσκεται και επαληθεύεται χρησιμοποιείται για την ενίσχυση του γλωσσικού μοντέλου του AlphaProof και την ενίσχυση της ικανότητάς του να επιλύει επακόλουθα πιο δύσκολα προβλήματα.

Για να εκπαιδεύσει το AlphaProof, το Google DeepMind απέδειξε ή διέψευσε εκατομμύρια μαθηματικά προβλήματα που κάλυπταν ένα ευρύ φάσμα δυσκολιών και θεμάτων τις εβδομάδες που προηγήθηκαν του διαγωνισμού του ΙΜΟ. Εφαρμόζεται επίσης ένας κύκλος προπόνησης κατά τη διάρκεια του διαγωνισμού για την ενίσχυση της απόδειξης παραλλαγών προβλημάτων ανταγωνισμού που δημιουργούνται μόνοι τους μέχρι να βρεθεί μια πλήρης λύση.

Infographic διαδικασίας βρόχου εκπαίδευσης ενίσχυσης AlphaProof: Περίπου ένα εκατομμύριο άτυπα μαθηματικά προβλήματα μεταφράζονται σε επίσημη μαθηματική γλώσσα από το επίσημο δίκτυο. Στη συνέχεια, ο λύτης αναζητά στο δίκτυο αποδείξεις ή αποδείξεις του προβλήματος, εκπαιδεύοντας σταδιακά τον εαυτό του να λύνει πιο δύσκολα προβλήματα χρησιμοποιώντας τον αλγόριθμο AlphaZero.

Πιο ανταγωνιστικό AlphaGeometry 2

Το AlphaGeometry 2 είναι μια σημαντικά βελτιωμένη έκδοση του μαθηματικού AI AlphaGeometry που εμφανίστηκε στο περιοδικό Nature φέτος. Είναι ένα νευρο-συμβολικό υβριδικό σύστημα στο οποίο το γλωσσικό μοντέλο βασίζεται στο Gemini και εκπαιδεύεται από την αρχή σε μια τάξη μεγέθους περισσότερα συνθετικά δεδομένα από τον προκάτοχό του. Αυτό βοηθά το μοντέλο να λύσει πιο δύσκολα γεωμετρικά προβλήματα, συμπεριλαμβανομένων εκείνων που αφορούν την κίνηση των αντικειμένων και τις εξισώσεις γωνιών, αναλογιών ή αποστάσεων.

Το AlphaGeometry 2 διαθέτει έναν συμβολικό κινητήρα που είναι δύο τάξεις μεγέθους ταχύτερος από τον προκάτοχό του. Όταν αντιμετωπίζονται νέα προβλήματα, νέοι μηχανισμοί ανταλλαγής γνώσεων επιτρέπουν προηγμένους συνδυασμούς διαφορετικών δέντρων αναζήτησης για την επίλυση πιο περίπλοκων προβλημάτων.

Πριν από τον φετινό διαγωνισμό, το AlphaGeometry 2 μπορούσε να λύσει το 83% όλων των ιστορικών προβλημάτων γεωμετρίας του ΙΜΟ τα τελευταία 25 χρόνια, σε σύγκριση με μόλις 53% του προκατόχου του. Στο IMO 2024, το AlphaGeometry 2 έλυσε το πρόβλημα 4 μέσα σε 19 δευτερόλεπτα από τη λήψη της επισημοποίησής του.

Ένα παράδειγμα της ερώτησης 4 απαιτεί να αποδειχθεί ότι το άθροισμα των ∠KIL και ∠XPY είναι ίσο με 180°. Το AlphaGeometry 2 προτείνει την κατασκευή του σημείου Ε στην ευθεία ΒΙ έτσι ώστε ∠AEB = 90°. Το σημείο Ε βοηθά να δοθεί νόημα στο μέσο L του ευθύγραμμου τμήματος AB, δημιουργώντας έτσι πολλά ζεύγη όμοιων τριγώνων, όπως ABE ~ YBI και ALE ~ IPC, για να αποδειχθεί το συμπέρασμα.

Το Google DeepMind αναφέρει επίσης ότι ως μέρος της εργασίας του IMO, οι ερευνητές πειραματίζονται επίσης με ένα νέο σύστημα λογικής φυσικής γλώσσας που βασίζεται στο Gemini και ένα υπερσύγχρονο σύστημα λογικής φυσικής γλώσσας, ελπίζοντας να επιτύχουν προηγμένες δυνατότητες επίλυσης προβλημάτων. Το σύστημα δεν απαιτεί μετάφραση ερωτήσεων σε επίσημη γλώσσα και μπορεί να συνδυαστεί με άλλα συστήματα τεχνητής νοημοσύνης. Στη δοκιμή των ερωτήσεων του φετινού διαγωνισμού του ΙΜΟ, «έδειξε μεγάλες δυνατότητες».

Η Google συνεχίζει να εξερευνά μεθόδους τεχνητής νοημοσύνης για την προώθηση της μαθηματικής συλλογιστικής και σχεδιάζει να δημοσιεύσει σύντομα περισσότερες τεχνικές λεπτομέρειες σχετικά με το AlphaProof.

Είμαστε ενθουσιασμένοι για ένα μέλλον στο οποίο οι μαθηματικοί θα χρησιμοποιούν εργαλεία τεχνητής νοημοσύνης για να εξερευνήσουν υποθέσεις, να δοκιμάσουν τολμηρές νέες προσεγγίσεις για την επίλυση μακροχρόνιων προβλημάτων και να ολοκληρώσουν γρήγορα χρονοβόρα στοιχεία αποδείξεων—και συστήματα τεχνητής νοημοσύνης όπως το Gemini θα κάνουν τεράστια διαφορά στο μαθηματικά και άλλα Η ευρεία πτυχή του συλλογισμού γίνεται ακόμη πιο ισχυρή.

ερευνητική ομάδα

Η Google είπε ότι η νέα έρευνα υποστηρίχθηκε από τη Διεθνή Μαθηματική Ολυμπιάδα και επιπλέον:

Η ανάπτυξη του AlphaProof έγινε από τον Thomas Hubert, τον Rishi Mehta και τους βασικούς συντελεστές του Laurent Sartran, όπως οι Hussain Masoom, Aja Huang, Miklós Z. Horváth, Tom Zahavy, Vivek Veeriah, Eric Wieser, Jessica Yung, Lei Yu, Yannick Schroecker, Junice. Ottavia Bertolli, Borja Ibarz, Edward Lockhart, Edward Hughes, Mark Rowland και Grace Margand.

Μεταξύ αυτών, οι Aja Huang, Julian Schrittwieser, Yannick Schroecker και άλλα μέλη ήταν επίσης βασικά μέλη της εφημερίδας AlphaGo πριν από 8 χρόνια (2016). Πριν από οκτώ χρόνια, το AlphaGo, το οποίο έχτισαν με βάση την ενισχυτική μάθηση, έγινε διάσημο. Οκτώ χρόνια αργότερα, η ενισχυτική μάθηση λάμπει ξανά στο AlphaProof. Κάποιος θρήνησε στον κύκλο των φίλων: Ο RL είναι τόσο πίσω!

Η εργασία συμπερασμάτων AlphaGeometry 2 και φυσικής γλώσσας διευθύνεται από τον Thang Luong. Η ανάπτυξη του AlphaGeometry 2 έγινε από τους Trieu Trinh και Yuri Chervonyi, με σημαντικές συνεισφορές από τους Mirek Olšák, Xiaomeng Yang, Hoang Nguyen, Junehyuk Jung, Dawsen Hwang και Marcelo Menegali.

Επιπλέον, οι David Silver, Quoc Le, Hassabis και Pushmeet Kohli είναι υπεύθυνοι για το συντονισμό και τη διαχείριση ολόκληρου του έργου.

Περιεχόμενο αναφοράς:

https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

Νέα

Η Google AI κέρδισε το ασημένιο μετάλλιο της Μαθηματικής Ολυμπιάδας του IMO, το AlphaProof ξεκίνησε και η ενισχυτική μάθηση επιστρέφει

Εισαγωγή

τα στοιχεία επικοινωνίας μου