Nachricht

Google DeepMind durchbricht die Obergrenze des mathematischen Denkens der KI: löst 4 von 6 Fragen der Internationalen Mathematikolympiade

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House berichtete am 26. Juli, dass das Google DeepMind-Team gestern (25. Juli) einen Blogbeitrag veröffentlicht habe, in dem es erklärte, dass die von ihm entwickelten Modelle AlphaProof und AlphaGeometry 2 fortgeschrittene Denkprobleme in der Mathematik lösen könnten.Erreichte die Silbermedaille beim Lösen von Rätseln der Internationalen Mathematikolympiade.

Einführung in KI-Modelle

  • AlphaProof: Ein neues mathematisches formales Argumentationssystem, das auf verstärkendem Lernen basiert.

  • AlphaGeometry 2: Eine verbesserte Version des Geometrie-Problemlösungssystems.

Das DeepMind-Team kombinierte zwei KI-Modelle und arbeitete bei der Lösung von vier der sechs Fragen der diesjährigen Internationalen Mathematikolympiade (IMO) zusammen und erzielte damit erstmals die gleichen Ergebnisse wie die Silbermedaillengewinner des Wettbewerbs.

Torschützenteam

Zwei Experten des DeepMind-Teams bewerteten gemäß den IMO-Bewertungsregeln. Die beiden Experten sind:

  • Professor Sir Timothy Gowers: Berühmter Mathematiker, IMO-Goldmedaillengewinner und Fields-Medaillengewinner.

  • Dr. Joseph Myers: Zweifacher IMO-Goldmedaillengewinner und Vorsitzender des IMO 2024 Issue Selection Committee

KI-Modellinferenz

KI übersetzt die 6 IMO-Fragen in eine mathematische Sprache, die das Modell verstehen kann.

AlphaProof löste zwei algebraische Probleme und ein Problem der Zahlentheorie, indem es die Antworten ermittelte und ihre Richtigkeit bewies. Eines der gelösten Probleme war das schwierigste im Wettbewerb und wurde bei der diesjährigen IMO von nur fünf Spielern gelöst.


AlphaGeometry 2 demonstriert Geometrieprobleme und löst keine zwei kombinatorischen Probleme.


Ergebnisse des KI-Modells

Gemäß den IMO-Regeln ist jede der 6 Fragen 7 Punkte wert, mit einer maximalen Gesamtpunktzahl von 42 Punkten.

Das DeepMind-System erzielte letztendlich 28 Punkte, wobei bei jeder Frage die höchste Punktzahl erreicht wurde, was der höchsten Punktzahl in der Silbergruppe entspricht.


Die Goldmedaillenschwelle für 2024 beginnt bei 29 Punkten und im offiziellen Wettbewerb erreichten 58 von 609 Teilnehmern Goldmedaillen.

IT Home fügt Referenzadresse bei