Google DeepMind supera il limite superiore del ragionamento matematico dell'intelligenza artificiale: risolve 4 delle 6 domande delle Olimpiadi matematiche internazionali

Google DeepMind supera il limite superiore del ragionamento matematico dell'intelligenza artificiale: risolve 4 su 6 domande delle Olimpiadi internazionali di matematica

2024-07-26

IT House ha riferito il 26 luglio che il team di Google DeepMind ha pubblicato un post sul blog ieri (25 luglio), affermando che i modelli AlphaProof e AlphaGeometry 2 sviluppati possono risolvere problemi di ragionamento avanzati in matematica.Ottenuto lo standard della medaglia d'argento nella risoluzione dei puzzle delle Olimpiadi Internazionali della Matematica.

Introduzione ai modelli di intelligenza artificiale

AlphaProof: un nuovo sistema di ragionamento formale matematico basato sull'apprendimento per rinforzo.
AlphaGeometry 2: una versione migliorata del sistema di risoluzione dei problemi di geometria.

Il team di DeepMind ha combinato due modelli di intelligenza artificiale e ha collaborato per risolvere 4 delle 6 domande delle Olimpiadi internazionali di matematica (IMO) di quest'anno, ottenendo per la prima volta gli stessi risultati delle medaglie d'argento della competizione.

Squadra che segna

Due esperti del team DeepMind hanno assegnato un punteggio secondo le regole di punteggio IMO. I due esperti sono:

Professor Sir Timothy Gowers: famoso matematico, medaglia d'oro dell'IMO e medaglia Fields.
Dott. Joseph Myers: due volte medaglia d'oro IMO e presidente del comitato di selezione delle questioni IMO 2024

Inferenza del modello AI

L’intelligenza artificiale tradurrà le 6 domande IMO in un linguaggio matematico comprensibile al modello.

AlphaProof ha risolto due problemi algebrici e un problema di teoria dei numeri determinando le risposte e dimostrandone la correttezza, e uno dei problemi risolti è stato il più difficile della competizione, risolto da soli 5 giocatori nell'IMO di quest'anno.

AlphaGeometry 2 dimostra problemi di geometria e non risolve 2 problemi combinatori.

Risultati del modello di intelligenza artificiale

Secondo le regole IMO, ciascuna delle 6 domande vale 7 punti, con un punteggio totale massimo di 42 punti.

Il sistema DeepMind alla fine ha ottenuto 28 punti, con punteggi perfetti per ogni domanda, equivalenti al punteggio più alto nel gruppo argento.

La soglia della medaglia d'oro per il 2024 parte da 29 punti e nella competizione ufficiale 58 dei 609 partecipanti hanno ottenuto medaglie d'oro.

IT Home allega l'indirizzo di riferimento

notizia

Google DeepMind supera il limite superiore del ragionamento matematico dell'intelligenza artificiale: risolve 4 su 6 domande delle Olimpiadi internazionali di matematica

introduzione

le mie informazioni di contatto