Το Google DeepMind σπάει το ανώτατο όριο του μαθηματικού συλλογισμού της τεχνητής νοημοσύνης: λύνει 4 από τις 6 ερωτήσεις της Διεθνούς Μαθηματικής Ολυμπιάδας

Το Google DeepMind σπάει το ανώτερο όριο μαθηματικού συλλογισμού της τεχνητής νοημοσύνης: λύνει 4 από τις 6 ερωτήσεις της Διεθνούς Μαθηματικής Ολυμπιάδας

2024-07-26

Το IT House ανέφερε στις 26 Ιουλίου ότι η ομάδα του Google DeepMind δημοσίευσε μια ανάρτηση ιστολογίου χθες (25 Ιουλίου), δηλώνοντας ότι τα μοντέλα AlphaProof και AlphaGeometry 2 που ανέπτυξε μπορούν να λύσουν προηγμένα συλλογιστικά προβλήματα στα μαθηματικά.Πέτυχε πρότυπο αργυρού μετάλλου στην επίλυση παζλ της Διεθνούς Μαθηματικής Ολυμπιάδας.

Εισαγωγή στα μοντέλα AI

AlphaProof: Ένα νέο μαθηματικό επίσημο σύστημα συλλογισμού που βασίζεται στην ενισχυτική μάθηση.
AlphaGeometry 2: Μια βελτιωμένη έκδοση του συστήματος επίλυσης προβλημάτων γεωμετρίας.

Η ομάδα του DeepMind συνδύασε δύο μοντέλα τεχνητής νοημοσύνης και συνεργάστηκε για να λύσει 4 από τις 6 ερωτήσεις της φετινής Διεθνούς Μαθηματικής Ολυμπιάδας (IMO), επιτυγχάνοντας για πρώτη φορά τα ίδια αποτελέσματα με τους ασημένιους μετάλλιο στον διαγωνισμό.

Ομάδα σκοράρισμα

Δύο ειδικοί από την ομάδα DeepMind βαθμολογήθηκαν σύμφωνα με τους κανόνες βαθμολόγησης του ΙΜΟ Οι δύο ειδικοί είναι:

Καθηγητής Sir Timothy Gowers: Διάσημος μαθηματικός, χρυσός Ολυμπιονίκης του IMO και μετάλλιο Fields.
Δρ Joseph Myers: Δύο φορές χρυσός Ολυμπιονίκης του ΙΜΟ και Πρόεδρος της Επιτροπής Επιλογής Θεμάτων του ΙΜΟ 2024

Συμπέρασμα μοντέλου AI

Το AI θα μεταφράσει τις 6 ερωτήσεις του ΙΜΟ σε μαθηματική γλώσσα που μπορεί να κατανοήσει το μοντέλο.

Το AlphaProof έλυσε δύο αλγεβρικά προβλήματα και ένα πρόβλημα θεωρίας αριθμών προσδιορίζοντας τις απαντήσεις και αποδεικνύοντας την ορθότητά τους, και 1 από τα προβλήματα που λύθηκαν ήταν το πιο δύσκολο στον διαγωνισμό, το οποίο λύθηκε μόνο από 5 παίκτες στο φετινό IMO.

Το AlphaGeometry 2 δείχνει προβλήματα γεωμετρίας και δεν επιλύει 2 συνδυαστικά προβλήματα.

Αποτελέσματα μοντέλου AI

Σύμφωνα με τους κανόνες του ΙΜΟ, κάθε μία από τις 6 ερωτήσεις αξίζει 7 βαθμούς, με μέγιστη συνολική βαθμολογία τους 42 βαθμούς.

Το σύστημα DeepMind σημείωσε τελικά 28 πόντους, με τέλειες βαθμολογίες σε κάθε ερώτηση, ισοδύναμο με την υψηλότερη βαθμολογία στην ασημένια ομάδα.

Το όριο του χρυσού μεταλλίου για το 2024 ξεκινά από 29 βαθμούς και στον επίσημο διαγωνισμό, 58 από τους 609 συμμετέχοντες πέτυχαν χρυσά μετάλλια.

Το IT Home επισυνάπτει διεύθυνση αναφοράς

Νέα

Το Google DeepMind σπάει το ανώτερο όριο μαθηματικού συλλογισμού της τεχνητής νοημοσύνης: λύνει 4 από τις 6 ερωτήσεις της Διεθνούς Μαθηματικής Ολυμπιάδας

Εισαγωγή

τα στοιχεία επικοινωνίας μου