notizia

Terminano i cinque campionati consecutivi della Cina e gli Stati Uniti tornano sul trono dell'IMO! Il QI dell'intelligenza artificiale è stato riportato alla sua forma originale dalla prima domanda

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Nuovo rapporto sulla saggezza

Editor: Taozi è così assonnato

[Introduzione alla Nuova Saggezza] I risultati finali dell'IMO 2024 sono finalmente disponibili! Senza precedenti, quattro anni dopo, la squadra statunitense vinse nuovamente il primo posto, precedendo di due punti la squadra cinese. Per LLM, la prima domanda più semplice IMO, GPT-4o, Claude 3.5 Sonnet e altri modelli non hanno risposto.

Il record della Cina di vincere il campionato IMO per cinque anni consecutivi è stato ora battuto dalla squadra americana!

Nei giorni scorsi, la 65a IMO ha annunciato la squadra nazionale vincitrice della finale. Gli Stati Uniti si sono classificati al primo posto con un punteggio di 192 punti, e la Cina al secondo posto con una differenza di 2 punti.

Vale la pena ricordare che la squadra indiana è arrivata per la prima volta al quarto posto.


Sia la squadra cinese che quella americana dell'IMO hanno vinto 5 medaglie d'oro e 1 medaglia d'argento.

L'IMO è la più importante competizione matematica delle scuole superiori al mondo, che attira giovani matematici eccezionali da tutto il mondo.

Quest'anno hanno partecipato 609 studenti provenienti da 108 paesi e regioni.


Haojia Shi della squadra cinese ha ricevuto punteggi personali perfetti due volte di seguito ed è anche il settimo giocatore nella storia a raggiungere punteggi perfetti.

I giocatori americani Alexander Wang e Jessica Wan si sono classificati rispettivamente al terzo e quinto posto nella classifica individuale.


I membri del team sono sei, quattro dei quali cinesi


Interpreti:Jessica Wan, Alexander Wang, Tiger Zhang, Jordan Lefkowitz, Carl Schildkraut (vice leader), Krishna Pothapragada, Linus Tang

I membri del team IMO statunitense del 2024 sono:

- Jordan Lefkowitz, 17 anni (Connecticut)

-Krishna Pothapragada, 18 anni (Illinois)

-Jessica Wan, 18 anni (Florida)

-Alexander Wang, 16 anni (New Jersey)

- Qiao (Tigre) Zhang, 16 anni (California)

- Linus Tang, 18 anni (California)


Jessica Wan è la prima donna ad unirsi al team IMO statunitense dal 2007. Anche se non esiste un risultato personale del Grande Slam, ho comunque ottenuto 4 punteggi perfetti.

Prima di allora, era una delle migliori studentesse di matematica.

L'anno scorso, la studentessa delle scuole superiori Jessica Wan ha vinto tre campionati consecutivi nel 15° concorso di matematica per donne (MP4G) indetto dal MIT.


Nella competizione, Jessica ha risposto correttamente a 17 delle 20 domande, diventando la partecipante di maggior successo in questa competizione MP4G.

Ha anche partecipato alla competizione European Girls Mathematical Olympiad (EGMO) per quattro anni consecutivi, vincendola due volte.


Alexander Wang è una matricola alla Millburn School nel New Jersey.

Per lui la matematica è una materia interessante e interessante. Wang è stato molto interessato alla matematica fin dall'asilo.

Per aiutare più studenti ad apprendere la matematica e a scoprire gli aspetti interessanti della matematica, ha collaborato con Angelina Wang e Bill Sun per fondare un'organizzazione senza scopo di lucro - Impact Learners.

Vale la pena ricordare che è anche membro del team americano IMO 2023. Ha vinto la medaglia d'oro individuale e il campionato a squadre al Master di Matematica Rumeno del 2023. È stato anche selezionato due volte per la competizione nazionale MATHCOUNTS.


Linus Tang frequenta le lezioni online alla Davidson Academy di Reno, Nevada. Nel 2021, ha vinto il primo posto in matematica combinatoria allo Stanford Mathematics Championship.

Nella primavera del 2022, ha studiato i principi matematici di un gioco chiamato "Solitario bulgaro".

Quando Linus aveva solo un anno, vinse il suo primo premio di matematica: Math Kangaroo. Disse che da bambino passava molto tempo a giocare ai puzzle ed esercitava le sue capacità di visualizzazione.


Dieci anni di sostituzione del leader dell'IMO

Vale la pena ricordare che questa volta la vittoria della squadra americana ha qualcosa a che fare con il leader del progetto.

Dal 2014, il team statunitense dell'IMO è guidato da Po-Shen Loh, un matematico cinese e professore della CMU. Ha guidato il team statunitense a vincere medaglie d'oro dell'IMO nel 2015, 2016, 2018 e 2019.


Nel 2019, la squadra cinese e quella statunitense si sono classificate al primo posto. Quattro anni dopo, la squadra cinese è in cima alla lista e la squadra statunitense è al secondo posto nel mondo.


Questa volta, John Berman è diventato il capo del team IMO statunitense.

Ha conseguito la laurea in matematica presso il MIT e il dottorato in matematica presso l'Università della Virginia nel 2018. Attualmente è anche docente del corso online Geodemath.


Dopo che la squadra ha vinto, Berman ha pubblicato un messaggio per festeggiare.


Domande del test IMO 2024

Ci sono 6 domande in queste Olimpiadi Internazionali della Matematica e 9 ore di tempo per rispondere.

Quello che segue è il contenuto completo del documento di prova. Gli amici interessati possono provarlo e sfidarlo.



Analisi della prima domanda: https://www.youtube.com/watch?v=50W_ntnPX0k

Analisi della seconda domanda: https://www.youtube.com/watch?v=VXFG1t_ksfI

Analisi della terza domanda: https://www.youtube.com/watch?v=ASV1dZCuWGs

Analisi della quarta domanda: https://www.youtube.com/watch?v=WnZv3fdpFXo

Analisi della quinta domanda: https://www.youtube.com/watch?v=wfQkk9WktGE

Analisi della domanda sei: https://www.youtube.com/watch?v=7h3gJfWnDoc

Prima domanda IMO, il modello grande ha fallito miseramente

Alcuni utenti della rete hanno affermato che le domande del test IMO forniscono un buon set di test per i modelli all'avanguardia.

In generale, le domande del test IMO richiedono solo conoscenze di matematica delle scuole superiori e la prima domanda è la più semplice e i giocatori umani di solito la completano entro 60 minuti.

Quindi, puoi indovinare come sta andando il LLM più forte in superficie?



Dopo alcuni test i risultati sono i seguenti:

GPT-4: fallito. Anche evidenziare l'errore non aiuta. GPT-4o: fallito. Anche evidenziare l'errore non aiuta. Claude 3.5 Sonetto: Fallito. Sottolineare l'errore ha aiutato il modello a dare brevemente la risposta corretta, ma poi a continuare sulla strada sbagliata.



Sembra che ci sia ancora molta strada da fare per i modelli di grandi dimensioni.


Riferimenti:

https://www.zhihu.com/question/662130364?utm_psn=1798276113539153920

https://x.com/sytelus/status/1815203518913085900