Η Google AI κερδίζει το ασημένιο μετάλλιο του ΙΜΟ, μόλις ένα πόντο λιγότερο από το χρυσό! Η τέταρτη ερώτηση κράτησε μόνο 19 δευτερόλεπτα

Η Google AI κερδίζει το ασημένιο μετάλλιο του ΙΜΟ, μόλις ένα πόντο λιγότερο από το χρυσό!Η τέταρτη ερώτηση κράτησε μόνο 19 δευτερόλεπτα

2024-07-26

Ο δυτικός άνεμος Baijiao προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Μόλις τώρα, το μεγάλο μοντέλο κατέκτησε ξανά πόλη!

Το Google DeepMind ανακοίνωσε ότι η μαθηματική τους τεχνητή νοημοσύνη «κέρδισε» το ασημένιο μετάλλιο στον IMO (Διεθνής Μαθηματική Ολυμπιάδα), και απείχε μόλις ένα βαθμό από το χρυσό μετάλλιο!

Ναι καλά ακούσατε! Είναι μια ερώτηση της Μαθηματικής Ολυμπιάδας που είναι δύσκολη για τους περισσότερους ανθρώπους. Πρέπει να γνωρίζετε ότι από τους 609 συμμετέχοντες του IMO φέτος, μόνο 58 έχουν φτάσει στο επίπεδο του χρυσού μεταλλίου.

Αυτή τη φορά, η Google AI έλυσε 4 από τις 6 ερωτήσεις στον διαγωνισμό του IMO του 2024 καιΜόλις κάνετε μια τέλεια βαθμολογία, θα πάρετε συνολικά 28 πόντους . (Η πλήρης βαθμολογία είναι 42 βαθμοί, η βαθμολογία του χρυσού μεταλλίου είναι 29 βαθμοί)

Μεταξύ αυτών, για την τέταρτη ερώτηση γεωμετρίας, το AI χρειάστηκε μόνο 19 δευτερόλεπτα; !

Όσο για την έκτη ερώτηση, που λέγεται ότι είναι η πιο δύσκολη φέτος, μόνο πέντε διαγωνιζόμενοι την κέρδισαν φέτος και ήταν απόλυτα σωστή.

Τα αποτελέσματα αυτή τη φορά πιστοποιήθηκαν επίσης επαγγελματικά από την Οργανωτική Επιτροπή του IMO - βαθμολογήθηκαν από τον καθηγητή Timothy Gowers, χρυσό μετάλλιο του IMO και νικητή του Fields Medal, και τον Dr. Joseph Myers, δύο φορές χρυσό μετάλλιο του IMO και πρόεδρο της Επιτροπής Επιλογής Θεμάτων του IMO 2024.

Ο καθηγητής Timothy Gowers αναφώνησε ευθέως:Πολύ πέρα από το υπερσύγχρονο επίπεδο που γνωρίζω。

Πώς το κάνει το Laikangkang;

Η Google κερδίζει το ασημένιο μετάλλιο του IMO, βγαίνει νέο μέλος της οικογένειας Alpha

Τα δύο μέλη της οικογένειας Alpha της Google που κέρδισαν το ασημένιο μετάλλιο του ΙΜΟ αυτή τη φορά ειδικεύονται στην ψηφιακή βιομηχανία.

AlphaProof, ένα νέο μέλος της οικογένειας Alpha, ένα επίσημο σύστημα μαθηματικών συλλογισμών που βασίζεται στην ενισχυτική μάθηση.
ΑλφαΓεωμετρία 2, την προηγούμενη βελτιωμένη έκδοση του AlphaGeometry, που χρησιμοποιείται ειδικά για την επίλυση γεωμετρικών προβλημάτων.

Αρχικά, ας γνωρίσουμε το νέο μέλος-AlphaProof.

Είναι ένα σύστημα αυτοεκπαίδευσης που μπορεί να αποδείξει μαθηματικές δηλώσεις χρησιμοποιώντας την επίσημη γλώσσα Lean. Συνδυάζει προεκπαιδευμένα μοντέλα γλώσσας με τον αλγόριθμο μάθησης ενίσχυσης AlphaZero.

Προσαρμόζοντας το Gemini, η ομάδα μπορεί να μετατρέψει αυτόματα δηλώσεις φυσικής γλώσσας σε τυπικές γλωσσικές Lean δηλώσεις, δημιουργώντας έτσι μια μεγάλη τράπεζα μαθηματικών ερωτήσεων.

Όταν αντιμετωπίζει ένα πρόβλημα, το AlphaProof δημιουργεί υποψήφιες λύσεις και στη συνέχεια αποδεικνύει ή απορρίπτει αυτούς τους υποψήφιους αναζητώντας πιθανά βήματα απόδειξης στο Lean.

Κάθε απόδειξη που βρίσκεται και επαληθεύεται χρησιμοποιείται για την ενίσχυση του γλωσσικού μοντέλου του AlphaProof, βελτιώνοντας έτσι την ικανότητά του να επιλύει επακόλουθα πιο δύσκολα προβλήματα.

Τις πρώτες εβδομάδες του διαγωνισμού, εκπαιδεύτηκε σε εκατομμύρια ερωτήσεις σε επίπεδο ΙΜΟ σε έναν επαναλαμβανόμενο κύκλο.

Οι βρόχοι προπόνησης εφαρμόζονται επίσης κατά τη διάρκεια των αγώνων, όπου οι αυτο-απόδειξη ενισχύονται συνεχώς μέχρι να βρεθεί μια ολοκληρωμένη λύση.

Ας ρίξουμε μια ματιά στην εξέλιξηΑλφαΓεωμετρία 2 . Είναι ένα νευρο-συμβολικό υβριδικό σύστημα στο οποίο το γλωσσικό μοντέλο βασίζεται στους Διδύμους.

Ο προκάτοχός του 1.0 παρουσιάστηκε επίσης στο Nature φέτος:Φτάνοντας στο επίπεδο της γεωμετρίας των χρυσών Ολυμπιονικών του ΙΜΟ χωρίς ανθρώπινη επίδειξη。

Σε σύγκριση με την προηγούμενη έκδοση, χρησιμοποιεί κατά τάξη μεγέθους μεγαλύτερα συνθετικά δεδομένα για προπόνηση από την αρχή. Και ο συμβολικός κινητήρας που χρησιμοποιεί είναι δύο τάξεις μεγέθους ταχύτερος από τον προκάτοχό του. Όταν αντιμετωπίζονται νέα προβλήματα, χρησιμοποιείται ένας νέος μηχανισμός ανταλλαγής γνώσεων για να επιτρέψει προχωρημένους συνδυασμούς διαφορετικών δέντρων αναζήτησης για την επίλυση πιο περίπλοκων προβλημάτων.

Πριν από τον επίσημο διαγωνισμό, μπορούσε ήδη να λύσει το 83% όλων των προβλημάτων γεωμετρίας του ΙΜΟ τα τελευταία 25 χρόνια, ενώ το ποσοστό επίλυσης του προκατόχου του ήταν μόνο 53%.

Στον φετινό διαγωνισμό του ΙΜΟ, χρειάστηκαν μόνο 19 δευτερόλεπτα για να ολοκληρωθεί η τέταρτη ερώτηση.

Στη συνέχεια, ας ρίξουμε μια ματιά στο πώς αυτοί οι δύο άνθρωποι συνεργάζονται αυτή τη φορά IMO.

Πρώτον, το πρόβλημα μεταφράζεται χειροκίνητα σε επίσημη μαθηματική γλώσσα, ώστε να είναι κατανοητό από το σύστημα.

Γνωρίζουμε ότι κατά τη διάρκεια του ανθρώπινου διαγωνισμού, οι απαντήσεις υποβάλλονται σε δύο φορές, κάθε φορά διάρκειας 4,5 ωρών.

Τα δύο συστήματα της Google έλυσαν πρώτα ένα πρόβλημα σε λίγα λεπτά και τα άλλα προβλήματα διήρκεσαν τρεις ημέρες.

Τελικά, το AlphaProof έλυσε δύο προβλήματα άλγεβρας και ένα πρόβλημα θεωρίας αριθμών προσδιορίζοντας τις απαντήσεις και αποδεικνύοντας την ορθότητά τους.

Αυτό περιλαμβάνει την πιο δύσκολη ερώτηση του διαγωνισμού, που είναι η έκτη ερώτηση που έλυσαν μόνο πέντε παίκτες στον φετινό διαγωνισμό του ΙΜΟ.

Το AlphaGeometry 2 λύνει το πρόβλημα της γεωμετρίας, ενώ τα δύο προβλήματα συνδυασμού παραμένουν άλυτα.

Επιπλέον, η ομάδα της Google πειραματίστηκε επίσης με ένα σύστημα λογικής φυσικής γλώσσας που βασίζεται στο Gemini. Με άλλα λόγια, δεν χρειάζεται να μεταφραστεί το πρόβλημα σε επίσημη γλώσσα και μπορεί να χρησιμοποιηθεί σε συνδυασμό με άλλα συστήματα AI.

Η ομάδα είπε ότι θα διερευνήσει επίσης περισσότερες μεθόδους τεχνητής νοημοσύνης για την προώθηση της μαθηματικής συλλογιστικής.

Περισσότερες τεχνικές λεπτομέρειες για το AlphaProof σχεδιάζονται επίσης να κυκλοφορήσουν σύντομα.

Netizen: Δεν καταλαβαίνω μαθηματικά, αλλά σοκαρίστηκα

Βλέποντας την απόδοση αυτών των δύο συστημάτων, οι χρήστες του Διαδικτύου εξέφρασαν ότι «δεν καταλαβαίνουν μαθηματικά αλλά σοκαρίστηκαν».

Ο Scott Wu, συνιδρυτής της Cognition AI, μιας ομάδας προγραμματιστή AI Devin, είπε:

Τα αποτελέσματα είναι πραγματικά εκπληκτικά. Ως παιδί, η Ολυμπιάδα ήταν τα πάντα για μένα. Ποτέ δεν πίστευα ότι θα λυθούν με τεχνητή νοημοσύνη σε 10 χρόνια.

Ο επιστήμονας του OpenAI Noam Brown άνοιξε επίσης το μικρόφωνο για να συγχαρεί:

Ωστόσο, ορισμένοι χρήστες του Διαδικτύου είπαν ότι εάν ακολουθηθεί ο τυπικός χρόνος διαγωνισμού (ο διαγωνισμός χωρίζεται σε δύο ημέρες, τεσσερισήμισι ώρες την ημέρα και τρία προβλήματα επιλύονται κάθε μέρα), τα δύο συστήματα τεχνητής νοημοσύνης μπορούν στην πραγματικότητα να λύσουν μόνο ένα από τα έξι προβλήματα.

Αυτή η δήλωση διαψεύστηκε αμέσως από ορισμένους χρήστες του Διαδικτύου:

Σε αυτό το σενάριο, η ταχύτητα δεν είναι το κύριο μέλημα. Εάν ο αριθμός των πράξεων κινητής υποδιαστολής (flops) παραμένει σταθερός, η αύξηση των υπολογιστικών πόρων θα συντομεύσει τον χρόνο που απαιτείται για την επίλυση του προβλήματος.

Σχετικά με αυτό το σημείο, ορισμένοι χρήστες του Διαδικτύου ρώτησαν επίσης:

Τα δύο συστήματα τεχνητής νοημοσύνης απέτυχαν να απαντήσουν στις ερωτήσεις συνδυασμού Είναι πρόβλημα εκπαίδευσης ή ανεπαρκείς υπολογιστικούς πόρους ή χρόνος; Ή υπάρχουν άλλοι περιορισμοί;

Ο καθηγητής Timothy Gowers έγραψε στο Twitter τις σκέψεις του:

Εάν επιτρεπόταν στους ανθρώπινους διαγωνιζόμενους να αφιερώσουν περισσότερο χρόνο σε κάθε ερώτηση, οι βαθμολογίες τους θα ήταν αναμφίβολα υψηλότερες. Ωστόσο, για τα συστήματα τεχνητής νοημοσύνης, αυτό έχει ξεπεράσει κατά πολύ τις δυνατότητες των προηγούμενων αυτόματων αποδεικτών θεωρημάτων, δεύτερον, καθώς βελτιώνεται η απόδοση, ο απαιτούμενος χρόνος αναμένεται να μειωθεί περαιτέρω.

Ωστόσο, τις προηγούμενες δύο ημέρες, το μεγάλο μοντέλο ήταν ακόμα κολλημένο στο "Ποιος αριθμός είναι μεγαλύτερος, 9,11 ή 9,9 Μια τέτοια ερώτηση δημοτικού σχολείου, πώς γίνεται το μεγάλο μοντέλο από αυτήν την πλευρά να λύσει το πρόβλημα της Μαθηματικής Ολυμπιάδας;" !

Έχασα το μυαλό μου, και τώρα μου ήρθε ξαφνικά μια ιδέα και ξαναπήρα το μυαλό μου;

Ο επιστήμονας της Nvidia, Jim Fan, εξηγεί: Ναιδιανομή δεδομένων εκπαίδευσηςΤο πρόβλημα.

Το σύστημα της Google εκπαιδεύτηκε σε επίσημες αποδείξεις και συμβολικές μηχανές για συγκεκριμένο τομέα. Σε κάποιο βαθμό, είναι ιδιαίτερα εξειδικευμένοι στην επίλυση Ολυμπιάδων, παρόλο που βασίζονται σε γενικά μεγάλα μοντέλα.

Το σετ εκπαίδευσης όπως το GPT-4o περιέχει μεγάλη ποσότητα δεδομένων κώδικα GitHub, τα οποία μπορεί να υπερβαίνουν κατά πολύ τα μαθηματικά δεδομένα. Σε εκδόσεις λογισμικού, "v9.11>v9.9", αυτό μπορεί να παραμορφώσει σοβαρά τη διανομή. Άρα, αυτό το λάθος είναι απολύτως δικαιολογημένο.

Σχετικά με αυτό το περίεργο φαινόμενο, το περιέγραψε ως

Ανακαλύψαμε μια πολύ παράξενη περιοχή, σαν έναν εξωπλανήτη που μοιάζει με τη Γη αλλά είναι γεμάτος παράξενες κοιλάδες.

Υπάρχουν επίσης ενθουσιώδεις χρήστες του Διαδικτύου που πήραν το σύνθημα από το OpenAI Ίσως μπορείτε να το δοκιμάσετε κι εσείς...

Σε αυτό, η απάντηση του Ultraman ήταν:

Σύνδεσμοι αναφοράς:
[1]https://x.com/googledeepmind/status/1816498082860667086?s=46
[2]https://x.com/jeffdean/status/1816498336171753948?s=46
[3]https://x.com/quocleix/status/1816501362328494500?s=46
[4]https://x.com/drjimfan/status/1816521330298356181?s=46
[5]https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

Νέα