notícias

Lee Sedol, derrotado pelo AlphaGo, passou 8 anos reconstruindo o mundo em colapso

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Perdendo para a IA, sinto como se todo o meu mundo desabasse.

Lee Sedol disse em uma entrevista recente ao New York Times.


Em 2016, o jogador de xadrez coreano, 14 vezes campeão mundial, representou humanos em uma partida contra o AlphaGo do Google e acabou perdendo por 1:4.

Ao aceitar o convite, achou que seria uma experiência “divertida”:

A premissa da diversão é que acho que vou vencer. Nunca pensei que iria perder.

Esse foi provavelmente um dos destaques mais importantes antes da estreia da tecnologia de IA no ChatGPT.

Agora, menos de dois anos se passaram desde o lançamento do ChatGPT. Vimos muitos campos sendo afetados pela IA e mais aspectos da vida parecem ter sido prenunciados para mudanças. Não podemos deixar de querer especular e imaginar o futuro. IA.

Neste contexto, o mundo Go, que foi impactado pela IA antes de outras indústrias e campos, pode ajudar-nos a ver uma possibilidade que já aconteceu.

Depois de derrotar os humanos, a IA mais forte desumaniza ainda mais


Eu não conseguia mais aproveitar Go, então me aposentei.

Três anos depois de jogar contra o AlphaGo, Lee Sedol anunciou oficialmente sua aposentadoria.

Para Lee Sedol, que começou a aprender Go aos 5 anos, Go não é apenas uma competição, mas uma arte, uma extensão da personalidade e do estilo do jogador. Porém, na era da IA, foi “reduzido” a. um jogo de eficiência algorítmica.

Durante esses três anos, outra coisa realmente aconteceu.

Em 2017, DeepMind anunciou uma nova versão do AlphaGo - AlphaGo Zero.

AlphaGo nasceu do aprendizado e autoprática da rede neural de mais de 30 milhões de movimentos por mestres humanos, mas AlphaGo Zero foi separado do “toque humano” desde o início. Durante o período de treinamento, não entrou em contato com nenhum. registros humanos de xadrez e confiou apenas em si mesmo e em seu próprio treinamento de xadrez.

Em apenas três dias, o AlphaGo Zero já venceu o AlphaGo por 100:0.

The Atlantic chama isso de “IA que não precisa aprender nada com os humanos”.


Em Go, existe uma técnica que parece simples ou inconsequente, mas que pode representar uma ameaça fatal no longo prazo. Algumas pessoas diriam que é como um “fantasma”.

Os registros dos jogos AlphaGo e AlphaGo Zero são tão difíceis de entender que são diretamente considerados "um guia misterioso abandonado por uma civilização alienígena".

O jogador de xadrez profissional americano Michael Redmond disse em 2017 que um dos meios importantes para os humanos aprenderem Go é construir uma história: "É assim que nos comunicamos. É uma coisa muito humana."

Isto também pode ecoar o argumento de Lee Sedol de que, ao jogar xadrez, os jogadores de xadrez também mostram parte de si mesmos como seres humanos.

Redmond acrescentou que, com base em suas próprias observações, os jogadores de xadrez humanos provavelmente “jogarão as mãos para o alto e se renderão” quando virem pela primeira vez um xadrez com “sabor de IA”:

A forma como o AlphaGo joga xadrez sempre parece muito “desumana”. Diante de um jogo de xadrez assim, é até difícil para nós nos envolvermos.

Como um dos primeiros mestres do Go a ser impactado, Lee Sedol não conseguiu desistir por muito tempo.

Ele ficou obcecado por IA.


Após se aposentar, além de abrir sua própria academia Go, publicar livros e lançar jogos de tabuleiro baseados em Go, Lee Sedol também começou a dar palestras sobre IA:

Comecei a enfrentar problemas de IA muito cedo e outras pessoas também os enfrentarão. Isso pode não levar a um final feliz.

Para ele, o aspecto mais preocupante da IA ​​é que ela pode mudar os valores humanos:

No passado, as pessoas ficariam maravilhadas com a criatividade, a originalidade e a inovação, mas desde o advento da IA, grande parte disto desapareceu.

Nem todos concordam com esta afirmação.

A era da cocriação homem-máquina


A IA destruiu toda a ordem existente no mundo Go e então começou a reconstruí-la.

disse Jiuheng He, um entusiasta do Go que estuda inteligência artificial na Universidade Cornell.

Em muitas academias de Go, usar IA para aprender Go é um processo pelo qual quase todos os jogadores devem passar.

Em uma academia Go em Hong Kong, Ng Chee Man oferece aos alunos iPads para aprender Go usando IA.

Cada vez que um aluno joga xadrez, a IA mostrará as sugestões de “melhor jogada”, ao mesmo tempo, o sistema também registrará quais jogadas o aluno fez bem e quais não foram boas.


No ano passado, um estudo publicado no Proceedings of the National Academy of Sciences apontou que desde que a IA entrou no círculo Go, a capacidade de julgamento dos jogadores humanos melhorou.

Já em 2016, antes de AlphaGo derrotar Lee Sedol, Fan Hui, que havia jogado contra AlphaGo em um teste privado, teve uma experiência semelhante.

Embora tenha perdido, Fan Hui disse que AlphaGo lhe permitiu olhar para Go de uma nova maneira, melhorou suas habilidades e lhe permitiu subir rapidamente no ranking mundial.

O estudo de 2023 baseia-se em registos de xadrez acumulados de 1950 a 2021, incluindo dados de 5,8 milhões de mãos.

Os pesquisadores descobriram que antes de AlphaGo derrotar Lee Sedol, a qualidade dos julgamentos dos jogadores de xadrez humanos permaneceu estável e basicamente inalterada por 66 anos. No entanto, durante 2016 e 2017, a qualidade dos julgamentos dos jogadores de xadrez começou a aumentar.

Em outras palavras, embora os jogadores de xadrez humanos possam não ser capazes de derrotar os jogadores de xadrez da IA, suas habilidades de julgamento realmente melhoraram.

É muito inspirador ver a rapidez com que os jogadores de xadrez humanos conseguem se adaptar e incorporar esses novos movimentos em seus próprios métodos. Estes resultados sugerem que os humanos se adaptarão a estas descobertas e as desenvolverão para melhorar significativamente o seu potencial.

David Silver, cientista-chefe de pesquisa da DeepMind e líder do projeto AlphaGo, comentou esta pesquisa.


Ke Jie, que foi derrotado pelo AlphaGo em 2017, também disse em 2023 que raramente pratica com pessoas reais, exceto em competições, e acredita que a IA se tornou até mesmo a fonte de criatividade no Go:

A criatividade não se trata apenas de fazer algo diferente. A criatividade deve ser colocada em combate real e testada. Agora, a maior parte da inovação em Go é feita pela IA. perderemos porque a IA passa por muitos combates reais e surge com um pensamento diferente de antes, isso é criatividade.

Além disso, o desempenho de outro jogador profissional de xadrez também é particularmente interessante.

O jogador de xadrez coreano Shin Jin-jin é o primeiro jogador de xadrez pós-2000 a vencer um campeonato mundial. Ele é frequentemente chamado de "Inteligência Shen Gong" pelos fãs de xadrez porque é famoso por seu treinamento e pesquisa de IA de longo prazo.


Em fevereiro deste ano, Shin Jin-seok derrotou o capitão chinês Gu Zihao na 25ª Copa Nongshim, alcançando seis vitórias consecutivas em uma única temporada e 16 vitórias consecutivas em todas as temporadas, superando seu antecessor Lee Chang-ho. Em março deste ano, ele falou sobre sua relação com a IA:

Eu sinto que AI e eu somos amigos agora. Estudei com IAs que eram melhores que eu. A IA e o pensamento humano são completamente diferentes. A IA resolve problemas através de algoritmos matemáticos. Eu me beneficiei muito ao aprender com o pensamento da IA.

Agora, jogadores profissionais na China, Coreia do Sul e Japão usarão IA para treinar.

Apocalipse "Sabor AI"


Assim como na era da IA ​​generativa, alguns designers e autores precisam realizar autocertificações complicadas por causa do chamado "sabor IA" contido em seus trabalhos, que está integrado à IA há muito tempo. também tem enfrentado o surgimento de vários problemas de "sabor de IA".

Nos jogos Go atuais, a IA é frequentemente usada para prever a taxa de vitórias e a IA recomenda a melhor jogada. O público pode, portanto, ganhar uma espécie de “iniciativa” no processo de assistir ao jogo e ter múltiplos ângulos de visão.

Em 2022, durante a partida contra Shen Zhenzhen, o enxadrista chinês Li Xuanhao tomou muitas decisões que estavam de acordo com as três primeiras previstas pelo julgamento ideal da IA. Portanto, seu companheiro de equipe Yang Dingxin questionou sua suspeita de trapaça com a IA.

Li Xuanhao, que nasceu em 1995, "trabalha das nove às nove, durante todo o ano, e realmente trabalha duro" no treinamento de IA. Portanto, o jogo de xadrez é às vezes considerado como tendo o chamado "sabor de máquina".


Em relação às dúvidas, a Associação Chinesa Go conduziu uma investigação e finalmente determinou que não havia provas para a acusação, e Yang Dingxin impôs penalidades.

Mas existem casos de trapaça com IA.

Em 2020, descobriu-se que o jogador de xadrez profissional sul-coreano Kim Eun-chi, de 13 anos, tinha uma sobreposição de 92% entre seus movimentos em partidas online e as recomendações de IA. Após uma investigação, foi finalmente determinado que ele havia trapaceado (e ele admitiu) e foi multado e suspenso por um ano.

Em 2022, o jogador de xadrez chinês Liu Ruizhi foi condenado por trapaça de IA e foi o primeiro jogador de xadrez profissional na China a ser oficialmente punido por trapaça de IA. Comparado com Kim Eun-chi, Liu Ruizhi aprendeu a evitar o “sabor IA” e só usa IA em alguns pontos-chave.

Em resposta, as competições em vários países estão constantemente a melhorar os mecanismos de fraude anti-IA.

Ao mesmo tempo, algumas pessoas usaram o “sabor IA” para derrotar a IA.

Em 2023, o jogador de xadrez amador americano Kellin Pelrine derrotou o Go AI KataGo.

KataGo é uma das IAs Go de código aberto mais poderosas disponíveis, e a Coreia do Sul também a usará para treinar jogadores Go.

Pelrine usou um programa chamado FAR AI para jogar contra o KataGo por mais de 1 milhão de jogos. Finalmente, o FAR AI encontrou o ponto fraco do KataGo, praticou-o no duelo homem-máquina e venceu:

Essa estratégia não é exatamente infantil, mas também não é particularmente difícil de aprender.

Então, ele também usou o mesmo método para derrotar Leela Zero, outra Go AI relativamente poderosa.


A chave da estratégia é criar um grande “círculo” para cercar o grupo de peças de xadrez do oponente e, de repente, mover uma peça para outro canto não relacionado para interferir na IA.

Pelrine disse que se fosse um jogador de xadrez humano, ele definitivamente saberia que algo estava errado quando visse o círculo, mas a IA não notaria.

Essa fraqueza parece um pouco “complicada”. Ela pode ser corrigida permitindo que a IA conduza um treinamento direcionado?

Um relatório publicado na Nature na semana passada citou um artigo pré-impresso deste ano e apontou que, face a programas que procuram especificamente as fraquezas da IA, as vulnerabilidades dos modelos não são tão fáceis de corrigir como se imagina.

Desta vez foi o KataGo que foi “alvo”. Os pesquisadores usaram três estratégias diferentes para tornar o KataGo mais capaz de contra-atacar:

  • Deixe o KataGo aprender como responder aos ataques por meio do autojogo;
  • Treinamento iterativo, use o programa de ataque para atacar o KataGo, devolva a vulnerabilidade ao KataGo, deixe-o aprender a lidar com ela por meio de auto-jogo ou outros métodos e, em seguida, use o programa de ataque para atacar o KataGo, repetindo o ciclo;
  • Treine um novo sistema Go AI do zero, usando um modelo de rede neural diferente.

Embora esses treinamentos tenham ajudado o KataGo a melhorar suas capacidades de defesa até certo ponto, o programa de ataque ainda pode encontrar brechas e derrotar o KataGo com taxas de vitórias de 91%, 81% e 78%, respectivamente.

Esses programas de ataque em si não são excelentes IAs Go e podem ser facilmente derrotados por humanos.

É claro que a chave aqui não é competir se os humanos ou a IA são melhores.

A questão é que para Go, um campo que a IA “subverteu”, e depois de tantos anos de aplicação e aprimoramento, sua IA ainda tem muitos problemas. Adam Gleave, autor do artigo, disse:

Se não conseguirmos resolver esse problema em um único domínio como Go, então, no curto prazo, a possibilidade de consertar o jailbreak em modelos como ChatGPT parece pequena.