Lee Sedol, vaincu par AlphaGo, a passé 8 ans à reconstruire l'effondrement

Lee Sedol, vaincu par AlphaGo, a passé 8 ans à reconstruire le monde effondré

2024-07-22

En perdant face à l’IA, j’ai l’impression que tout mon monde s’est effondré.

Lee Sedol a déclaré dans une récente interview avec le New York Times.

En 2016, le joueur d'échecs coréen, 14 fois champion du monde, a représenté les humains dans un match contre AlphaGo de Google, et a finalement perdu 1:4.

Lorsqu'il a accepté l'invitation, il a pensé que ce serait une expérience « amusante » :

Le principe du plaisir est que je pense que je vais gagner. Je n'ai jamais pensé que je perdrais.

C’était probablement l’un des points forts les plus importants avant les débuts de la technologie de l’IA dans ChatGPT.

Moins de deux ans se sont écoulés depuis la sortie de ChatGPT. Nous avons vu de nombreux domaines être affectés par l'IA, et d'autres aspects de la vie semblent avoir été annoncés pour un changement. Nous ne pouvons nous empêcher de spéculer et d'imaginer l'avenir. IA.

Dans ce contexte, le monde du Go, qui a été touché par l’IA plus tôt que d’autres industries et domaines, peut nous aider à entrevoir une possibilité qui s’est déjà produite.

Après avoir vaincu les humains, une IA plus forte est encore plus déshumanisante

Je ne pouvais plus profiter du Go, alors j'ai pris ma retraite.

Trois ans après avoir joué contre AlphaGo, Lee Sedol a officiellement annoncé sa retraite.

Pour Lee Sedol, qui a commencé à apprendre le Go à l'âge de 5 ans, le Go n'est pas seulement une compétition, mais un art, une extension de la personnalité et du style du joueur. Cependant, à l'ère de l'IA, il a été « réduit » à. un jeu d'efficacité algorithmique.

Au cours de ces trois années, une autre chose s’est réellement produite.

En 2017, DeepMind a annoncé une nouvelle version d'AlphaGo - AlphaGo Zero.

AlphaGo est né de l'apprentissage et de l'auto-pratique du réseau neuronal de plus de 30 millions de mouvements par des maîtres humains, mais AlphaGo Zero a été séparé du « contact humain » dès le début. Pendant la période de formation, il n'est entré en contact avec aucun. des records d'échecs humains et comptait uniquement sur lui-même et sur sa propre formation aux échecs.

En seulement trois jours, AlphaGo Zero a déjà gagné 100 : 0 contre AlphaGo.

The Atlantic l’appelle « une IA qui n’a pas besoin d’apprendre quoi que ce soit des humains ».

Dans Go, il existe une technique qui semble simple ou sans conséquence, mais qui peut constituer une menace mortelle à long terme. Certains diront qu'elle s'apparente à un "fantôme".

Les enregistrements des jeux AlphaGo et AlphaGo Zero sont si difficiles à comprendre qu'ils sont directement considérés comme « un guide mystérieux abandonné par une civilisation extraterrestre ».

Le joueur d'échecs professionnel américain Michael Redmond a déclaré en 2017 que l'un des moyens importants pour les humains d'apprendre le Go est de construire une histoire : "C'est ainsi que nous communiquons. C'est une chose très humaine."

Cela peut également faire écho au point de vue de Lee Sedol selon lequel lorsqu'ils jouent aux échecs, les joueurs d'échecs montrent également une partie d'eux-mêmes en tant qu'êtres humains.

Redmond a ajouté que, sur la base de ses propres observations, les joueurs d'échecs humains sont susceptibles de « lever la main et de se rendre » lorsqu'ils voient pour la première fois des échecs « à saveur d'IA » :

La façon dont AlphaGo joue aux échecs semble toujours très « inhumaine ». Face à un tel jeu d'échecs, il nous est même difficile de nous impliquer.

Lee Sedol, l'un des premiers maîtres de Go impactés, n'a pas pu lâcher prise pendant longtemps.

Il est devenu obsédé par l’IA.

Après avoir pris sa retraite, en plus d'ouvrir sa propre académie de Go, de publier des livres et de lancer des jeux de société basés sur Go, Lee Sedol a également commencé à donner des conférences sur l'IA :

J’ai commencé très tôt à rencontrer des problèmes d’IA, et d’autres en feront également l’expérience. Cela ne mènera peut-être pas à une fin heureuse.

Pour lui, l’aspect le plus inquiétant de l’IA est qu’elle peut changer les valeurs humaines :

Dans le passé, les gens étaient impressionnés par la créativité, l’originalité et l’innovation, mais depuis l’avènement de l’IA, une grande partie de ces éléments ont disparu.

Tout le monde n’est pas d’accord avec cette affirmation.

L’ère de la co-création homme-machine

L'IA a détruit tout l'ordre existant dans le monde de Go, puis a commencé à le reconstruire.

a déclaré Jiuheng He, un passionné de Go qui étudie l'intelligence artificielle à l'Université Cornell.

Dans de nombreuses académies de Go, utiliser l’IA pour apprendre le Go est un processus que presque tous les joueurs doivent suivre.

Dans une académie de Go à Hong Kong, Ng Chee Man fournit aux étudiants des iPad pour apprendre le Go à l'aide de l'IA.

Chaque fois qu'un élève joue aux échecs, l'IA affichera les suggestions de « meilleurs coups ». En même temps, le système enregistrera également les mouvements que l'élève a bien effectués et ceux qui n'étaient pas bons.

L'année dernière, une étude publiée dans les Actes de l'Académie nationale des sciences a souligné que depuis que l'IA est entrée dans le cercle du Go, la capacité de jugement des joueurs humains s'est améliorée.

Dès 2016, avant qu'AlphaGo ne batte Lee Sedol, Fan Hui, qui avait joué contre AlphaGo lors d'un test privé, avait vécu une expérience similaire.

Bien qu'il ait perdu, Fan Hui a déclaré qu'AlphaGo lui avait permis de regarder le Go d'une nouvelle manière, d'améliorer ses compétences et de grimper rapidement dans le classement mondial.

L'étude de 2023 est basée sur les records d'échecs accumulés de 1950 à 2021, comprenant des données sur 5,8 millions de mains.

Les chercheurs ont découvert qu'avant qu'AlphaGo ne batte Lee Sedol, la qualité des jugements des joueurs d'échecs humains était restée stable et pratiquement inchangée pendant 66 ans. Cependant, en 2016 et 2017, la qualité des jugements des joueurs d'échecs a commencé à augmenter.

En d’autres termes, même si les joueurs d’échecs humains ne sont peut-être pas capables de vaincre les joueurs d’échecs IA, leurs capacités de jugement se sont en effet améliorées.

C'est très inspirant de voir avec quelle rapidité les joueurs d'échecs humains peuvent s'adapter et intégrer ces nouveaux mouvements dans leurs propres méthodes. Ces résultats suggèrent que les humains s’adapteront à ces découvertes et s’appuieront sur elles pour améliorer considérablement notre potentiel.

David Silver, chercheur scientifique en chef chez DeepMind et chef du projet AlphaGo, a commenté cette recherche.

Ke Jie, qui a été vaincu par AlphaGo en 2017, a également déclaré en 2023 qu'il s'entraînait rarement avec de vraies personnes, sauf pour les compétitions, et estime que l'IA est même devenue la source de créativité au Go :

La créativité ne consiste pas simplement à faire quelque chose de différent. La créativité doit être mise en pratique et testée. Désormais, la plupart des innovations de Go sont réalisées par l'IA. Si nous voulons jouer à des jeux différents d'avant, il y a de fortes chances que cela se produise. nous perdrons parce que l'IA réussit beaucoup de combats réels, et proposer une pensée différente qu'avant, c'est de la créativité.

De plus, la performance d’un autre joueur d’échecs professionnel est également particulièrement intéressante.

Le joueur d'échecs coréen Shin Jin-jin est le premier joueur d'échecs après 2000 à remporter un championnat du monde. Il est souvent surnommé « Shen Gong Intelligence » par les fans d'échecs parce qu'il est célèbre pour sa formation et ses recherches à long terme en IA.

En février de cette année, Shin Jin-seok a battu le capitaine chinois Gu Zihao lors de la 25e Coupe Nongshim, remportant six victoires consécutives en une seule saison et 16 victoires consécutives au fil des saisons, surpassant ainsi son prédécesseur Lee Chang-ho. En mars de cette année, il a parlé de sa relation avec l'IA :

J'ai l'impression qu'AI et moi sommes amis maintenant. J'ai étudié avec des IA meilleures que moi. L'IA et la pensée humaine sont complètement différentes. L'IA résout les problèmes grâce à des algorithmes mathématiques. J'ai beaucoup bénéficié de l'apprentissage de la pensée de l'IA.

Désormais, les joueurs professionnels de Chine, de Corée du Sud et du Japon utiliseront l’IA pour s’entraîner.

Apocalypse « Saveur IA »

Tout comme à l'ère de l'IA générative, certains concepteurs et auteurs doivent procéder à des autocertifications compliquées en raison de la soi-disant « saveur IA » contenue dans leurs travaux, qui est intégrée à l'IA depuis longtemps. a également été confronté à l'émergence de divers problèmes liés à l'IA.

Dans les jeux Go actuels, l’IA est souvent utilisée pour prédire le taux de victoire et l’IA recommande le meilleur coup. Le public peut ainsi acquérir une sorte d'« initiative » en regardant le match et disposer de plusieurs angles de vue.

En 2022, lors du match contre Shen Zhenzhen, le joueur d'échecs chinois Li Xuanhao a pris de nombreuses décisions qui étaient conformes aux trois premières prédites par le jugement optimal d'IA. Par conséquent, son coéquipier Yang Dingxin a remis en question ses soupçons de tricherie avec AI.

Li Xuanhao, né en 1995, « travaille de neuf heures à neuf heures, toute l'année, et travaille vraiment dur » sur la formation en IA. C'est pourquoi le jeu d'échecs est parfois considéré comme ayant ce qu'on appelle une « saveur de machine ».

Concernant les doutes, l'Association chinoise de Go a mené une enquête et a finalement déterminé qu'il n'y avait aucune preuve pour l'accusation, et Yang Dingxin a imposé des sanctions.

Mais des cas de tricherie avec l’IA existent.

En 2020, il a été constaté que le joueur d'échecs professionnel sud-coréen Kim Eun-chi, âgé de 13 ans, présentait un chevauchement de 92 % entre ses mouvements dans les matchs en ligne et les recommandations de l'IA. Après une enquête, il a finalement été établi qu'il avait triché (et il l'a admis) et a été condamné à une amende et à une suspension d'un an.

En 2022, le joueur d'échecs chinois Liu Ruizhi a été reconnu coupable de tricherie avec l'IA et a été le premier joueur d'échecs professionnel en Chine à être officiellement puni pour tricherie avec l'IA. Comparé à Kim Eun-chi, Liu Ruizhi a appris à éviter la « saveur de l'IA » et n'utilise l'IA que sur certains points clés.

En réponse, les compétitions dans divers pays améliorent constamment les mécanismes anti-triche de l'IA.

Dans le même temps, certaines personnes ont utilisé la « saveur de l'IA » pour vaincre l'IA.

En 2023, le joueur d'échecs amateur américain Kellin Pelrine a vaincu le Go AI KataGo.

KataGo est l'une des IA de Go open source les plus puissantes disponibles, et la Corée du Sud l'utilisera également pour former les joueurs de Go.

Pelrine a utilisé un programme appelé FAR AI pour jouer contre KataGo pendant plus d'un million de parties. Finalement, FAR AI a trouvé la faiblesse de KataGo, l'a pratiquée dans le duel homme-machine et a gagné :

Cette stratégie n’est pas vraiment enfantine, mais elle n’est pas non plus particulièrement difficile à apprendre.

Ensuite, il a également utilisé la même méthode pour vaincre Leela Zero, une autre Go AI relativement puissante.

La clé de la stratégie est de créer un grand « cercle » pour entourer le groupe de pièces d'échecs de l'adversaire, puis de déplacer soudainement une pièce vers un autre coin sans rapport pour interférer avec l'IA.

Pelrine a déclaré que s'il s'agissait d'un joueur d'échecs humain, il saurait certainement que quelque chose ne va pas lorsqu'il verrait le cercle, mais l'IA ne le remarquerait pas.

Cette faiblesse semble un peu « délicate ». Peut-elle être corrigée en laissant l'IA effectuer un entraînement ciblé ?

Un article paru la semaine dernière dans Nature citait un article préimprimé de cette année et soulignait que face aux programmes qui recherchent spécifiquement les faiblesses de l'IA, les vulnérabilités des modèles ne sont pas aussi faciles à corriger qu'on l'imagine.

Cette fois, c'est KataGo qui a été « ciblé ». Les chercheurs ont utilisé trois stratégies différentes pour rendre KataGo plus capable de contre-attaquer :

Laissez KataGo apprendre à répondre aux attaques grâce au jeu personnel ;
Entraînement itératif, utilisez le programme d'attaque pour attaquer KataGo, renvoyez la vulnérabilité à KataGo, laissez-le apprendre à la gérer via le jeu autonome ou d'autres méthodes, puis utilisez le programme d'attaque pour attaquer KataGo, en répétant le cycle ;
Entraînez un nouveau système Go AI à partir de zéro, en utilisant un modèle de réseau neuronal différent.

Bien que ces formations aient aidé KataGo à améliorer ses capacités de défense dans une certaine mesure, le programme d'attaque peut encore trouver des failles et vaincre KataGo avec respectivement des taux de victoire de 91 %, 81 % et 78 %.

Ces programmes d’attaque eux-mêmes ne sont pas d’excellents Go AI et peuvent être facilement vaincus par les humains.

Bien sûr, la clé ici n’est pas de rivaliser pour savoir si les humains ou l’IA sont meilleurs.

Le fait est que pour Go, un domaine que l'IA a « subverti », et après tant d'années d'application et d'amélioration, son IA a encore de nombreux problèmes. Adam Gleave, auteur de l'article, a déclaré :

Si nous ne pouvons pas résoudre ce problème dans un seul domaine comme Go, alors à court terme, la possibilité de corriger le jailbreak dans des modèles comme ChatGPT semble mince.

nouvelles

Lee Sedol, vaincu par AlphaGo, a passé 8 ans à reconstruire le monde effondré

Introduction

mes coordonnées