noticias

Google DeepMind rompe el límite superior del razonamiento matemático de la IA: resuelve 4 de 6 preguntas de la Olimpiada Internacional de Matemáticas

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House informó el 26 de julio que el equipo de Google DeepMind publicó una publicación de blog ayer (25 de julio), afirmando que los modelos AlphaProof y AlphaGeometry 2 que desarrolló pueden resolver problemas de razonamiento avanzado en matemáticas.Obtuvo el estándar de la Medalla de Plata en la resolución de acertijos de la Olimpiada Internacional de Matemáticas.

Introducción a los modelos de IA

  • AlphaProof: un nuevo sistema de razonamiento matemático formal basado en el aprendizaje por refuerzo.

  • AlphaGeometry 2: una versión mejorada del sistema de resolución de problemas de geometría.

El equipo de DeepMind combinó dos modelos de IA y colaboró ​​para resolver 4 de las 6 preguntas de la Olimpiada Internacional de Matemáticas (OMI) de este año, logrando por primera vez los mismos resultados que los medallistas de plata en la competencia.

Equipo goleador

Dos expertos del equipo de DeepMind puntuaron según las reglas de puntuación de la OMI. Los dos expertos son:

  • Profesor Sir Timothy Gowers: matemático famoso, medallista de oro de la OMI y medallista Fields.

  • Dr. Joseph Myers: dos veces medallista de oro de la OMI y presidente del Comité de selección de cuestiones de la OMI para 2024

Inferencia del modelo de IA

La IA traducirá las 6 preguntas de la OMI a un lenguaje matemático que el modelo pueda entender.

AlphaProof resolvió dos problemas algebraicos y un problema de teoría de números determinando las respuestas y demostrando su exactitud, y uno de los problemas resueltos fue el más difícil de la competencia, resuelto por solo 5 jugadores en la IMO de este año.


AlphaGeometry 2 demuestra problemas de geometría y no resuelve 2 problemas combinatorios.


Resultados del modelo de IA

Según las normas de la OMI, cada una de las 6 preguntas vale 7 puntos, con una puntuación total máxima de 42 puntos.

El sistema DeepMind finalmente obtuvo 28 puntos, con puntuaciones perfectas en cada pregunta, equivalente a la puntuación más alta del grupo plata.


El umbral para la medalla de oro para 2024 comienza en 29 puntos, y en la competición oficial, 58 de 609 participantes lograron medallas de oro.

IT Home adjunta dirección de referencia