Google DeepMind dépasse la limite supérieure du raisonnement mathématique de l'IA : résout 4 des 6 Olympiades mathématiques internationales questions

Google DeepMind dépasse la limite supérieure du raisonnement mathématique de l'IA : résout 4 des 6 questions de l'Olympiade mathématique internationale

2024-07-26

IT House a rapporté le 26 juillet que l'équipe de Google DeepMind avait publié hier (25 juillet) un article de blog affirmant que les modèles AlphaProof et AlphaGeometry 2 qu'elle avait développés pouvaient résoudre des problèmes de raisonnement avancés en mathématiques.A obtenu la médaille d'argent en résolvant les énigmes de l'Olympiade mathématique internationale.

Introduction aux modèles d'IA

AlphaProof : Un nouveau système de raisonnement mathématique formel basé sur l'apprentissage par renforcement.
AlphaGeometry 2 : Une version améliorée du système de résolution de problèmes de géométrie.

L'équipe DeepMind a combiné deux modèles d'IA et collaboré pour résoudre 4 des 6 questions de l'Olympiade mathématique internationale (OMI) de cette année, obtenant pour la première fois les mêmes résultats que les médaillés d'argent de la compétition.

Équipe de notation

Deux experts de l'équipe DeepMind ont noté selon les règles de notation de l'OMI. Les deux experts sont :

Professeur Sir Timothy Gowers : Mathématicien célèbre, médaillé d'or de l'OMI et médaillé Fields.
Dr Joseph Myers : double médaillé d'or de l'OMI et président du comité de sélection de l'édition 2024 de l'OMI

Inférence de modèle d'IA

L'IA traduira les 6 questions de l'OMI en un langage mathématique que le modèle peut comprendre.

AlphaProof a résolu deux problèmes algébriques et un problème de théorie des nombres en déterminant les réponses et en prouvant leur exactitude, et l'un des problèmes résolus était le plus difficile de la compétition, résolu par seulement 5 joueurs lors de l'OMI de cette année.

AlphaGeometry 2 démontre des problèmes de géométrie et ne résout pas 2 problèmes combinatoires.

Résultats du modèle d'IA

Selon les règles de l'OMI, chacune des 6 questions vaut 7 points, avec un score total maximum de 42 points.

Le système DeepMind a finalement obtenu 28 points, avec des scores parfaits à chaque question, équivalents au score le plus élevé du groupe argent.

Le seuil de médaille d'or pour 2024 commence à 29 points, et lors de la compétition officielle, 58 des 609 participants ont obtenu des médailles d'or.

IT Home joint l'adresse de référence

nouvelles

Google DeepMind dépasse la limite supérieure du raisonnement mathématique de l'IA : résout 4 des 6 questions de l'Olympiade mathématique internationale

Introduction

mes coordonnées