알파고에게 패한 이세돌, 무너진 세계를 재건하는 데 8년 걸렸다

2024-07-22

AI에게 져서 세상이 다 무너진 기분이에요.

이세돌은 최근 뉴욕타임스와의 인터뷰에서 이렇게 말했다.

2016년 14차례 세계 챔피언에 오른 한국 체스 선수는 구글 알파고와의 경기에서 인간을 대표해 결국 1:4로 패했다.

그는 초대를 수락했을 때 그것이 "재미있는" 경험이 될 것이라고 생각했습니다.

재미의 전제는 내가 이길 것이라고 생각하는 것입니다. 나는 내가 질 것이라고는 결코 생각하지 못했습니다.

이는 ChatGPT에 AI 기술이 도입되기 전 가장 중요한 하이라이트 중 하나였을 것입니다.

ChatGPT가 출시된 지 2년이 채 되지 않은 지금, 우리는 AI의 영향을 받는 많은 분야를 보아왔고, 삶의 더 많은 측면이 변화를 예고하고 있는 것 같습니다. 일체 포함.

이런 맥락에서 다른 산업이나 분야보다 먼저 AI의 영향을 받은 바둑의 세계는 이미 일어난 가능성을 보는 데 도움이 될 수 있다.

인간을 물리친 뒤 더 강한 AI는 더욱 비인간화된다

더 이상 Go를 즐길 수 없어서 은퇴했습니다.

이세돌은 알파고와 대결한 지 3년 만에 공식 은퇴를 선언했다.

5세부터 바둑을 배우기 시작한 이세돌에게 바둑은 단순한 경쟁이 아니라 선수의 개성과 스타일의 확장인 예술이다. 알고리즘 효율성 게임.

이 3년 동안 실제로 또 다른 일이 일어났습니다.

2017년 DeepMind는 AlphaGo의 새로운 버전인 AlphaGo Zero를 발표했습니다.

알파고는 인간 마스터의 3천만 개가 넘는 동작의 신경망 학습과 자체 연습을 통해 탄생했지만 알파고 제로는 처음부터 '인간의 손길'과 분리되어 훈련 기간 동안 어떤 것과도 접촉하지 않았습니다. 인간의 체스 기록은 오로지 그 자신과 그 자신의 체스 훈련에만 의존했습니다.

단 3일 만에 AlphaGo Zero는 이미 AlphaGo를 상대로 100:0으로 승리했습니다.

Atlantic에서는 이를 “인간에게서 아무것도 배울 필요가 없는 AI”라고 부릅니다.

바둑에는 단순해 보이거나 하찮아 보이지만 장기적으로는 치명적인 위협이 될 수 있는 기술이 있다.

알파고와 알파고 제로의 게임 기록은 '외계 문명이 떨어뜨린 신비한 안내자'라고 직시할 만큼 이해하기 어렵다.

미국의 프로 체스 선수인 마이클 레드몬드는 2017년 인간이 바둑을 배우는 중요한 수단 중 하나는 스토리를 구축하는 것이라고 말했습니다. "그것이 우리가 소통하는 방식입니다. 그것은 매우 인간적인 것입니다."

이는 체스를 두는 동안 체스를 두는 사람도 인간으로서의 모습을 드러낸다는 이세돌의 주장과도 맥을 같이 한다.

레드몬드는 자신의 관찰에 따르면 인간 체스 선수들이 "AI 맛" 체스를 처음 보면 "손을 들고 항복"할 가능성이 높다고 덧붙였습니다.

AlphaGo가 체스를 두는 방식은 항상 매우 "비인간적"으로 느껴집니다. 이러한 체스 게임에 직면하면 우리는 참여하기조차 어렵습니다.

가장 먼저 영향을 받은 바둑 고수 중 한 명인 이세돌은 오랫동안 손을 놓지 못했다.

그는 AI에 집착하게 되었습니다.

은퇴 후 이세돌은 자신의 바둑 아카데미를 열고 바둑을 기반으로 한 책 출판과 보드 게임 출시 외에도 AI에 대한 강의도 시작했습니다.

나는 아주 일찍 AI 문제에 직면하기 시작했고 다른 사람들도 그것을 경험하게 될 것입니다. 해피엔딩으로 이어지지 않을 수도 있습니다.

그에게 있어 AI의 가장 걱정스러운 측면은 인간의 가치관이 바뀔 수 있다는 점이다.

과거에는 사람들이 창의성, 독창성, 혁신에 대해 경외감을 느꼈을 것입니다. 그러나 AI가 등장한 이후에는 이러한 것들이 많이 사라졌습니다.

모든 사람이 이 말에 동의하는 것은 아닙니다.

인간-기계 공동 창조의 시대

AI는 바둑 세계의 기존 질서를 모두 파괴한 후 다시 재건하기 시작했습니다.

코넬대학교에서 인공지능을 연구하고 있는 바둑 애호가 허지헝(Jiuheng He)은 이렇게 말했습니다.

많은 바둑 학원에서 AI를 활용해 바둑을 배우는 것은 거의 모든 선수들이 거쳐야 하는 과정이다.

홍콩의 바둑 아카데미에서 Ng Chee Man은 학생들에게 AI를 사용하여 바둑을 배울 수 있는 아이패드를 제공합니다.

학생이 체스를 둘 때마다 AI는 '최고의 수' 제안을 표시하는 동시에 학생이 잘한 수와 좋지 않은 수를 기록합니다.

지난해 미국 국립과학원회보(Proceedings of the National Academy of Sciences)에 발표된 연구에서는 AI가 바둑계에 진출한 이후 인간 선수들의 판단력이 향상됐다고 지적했다.

알파고가 이세돌을 꺾기 전인 2016년 초 비공개 테스트에서 알파고와 맞붙었던 판희도 비슷한 경험을 했다.

비록 패했지만 판후이는 알파고가 바둑을 새로운 시각으로 바라볼 수 있게 해주고, 실력도 향상시키며, 세계 랭킹도 빠르게 뛰어오를 수 있게 해준다고 말했다.

2023년 연구는 580만 개의 핸드에 대한 데이터를 포함해 1950년부터 2021년까지 누적된 체스 기록을 기반으로 한다.

연구진은 알파고가 이세돌을 꺾기 전 인간 체스 선수들의 판단력은 66년 동안 안정적으로 유지됐지만, 2016년과 2017년에는 체스 선수들의 판단력이 상승하기 시작했다는 사실을 발견했다.

즉, 인간 체스 선수가 AI 체스 선수를 이길 수는 없더라도 판단 능력은 확실히 향상되었습니다.

인간 체스 선수들이 이러한 새로운 움직임을 얼마나 빨리 적응하고 자신의 방법에 통합할 수 있는지 보는 것은 매우 고무적입니다. 이러한 결과는 인간이 이러한 발견에 적응하고 이를 기반으로 잠재력을 크게 향상시킬 것임을 시사합니다.

DeepMind의 수석 연구 과학자이자 AlphaGo 프로젝트의 리더인 David Silver는 이 연구에 대해 논평했습니다.

2017년 알파고에게 패한 커제(Ke Jie) 역시 2023년 대회를 제외하고는 실제 사람들과 연습을 거의 하지 않으며 AI가 바둑 창의성의 원천이 되었다고 믿기도 한다고 말했습니다.

창의력은 단지 뭔가 다른 것을 하는 것이 아니라 실제 전투에 투입되고 테스트되어야 합니다. 이제 바둑의 혁신은 대부분 AI에 의해 이루어집니다. AI가 실제 전투를 많이 통과하고, 이전과 다른 생각이 떠오르기 때문에 우리는 지게 된다. 이것이 창의성이다.

또한, 또 다른 프로 체스 선수의 활약도 특히 흥미롭다.

한국의 체스 선수 신진진은 2000년 이후 세계 선수권 대회에서 우승한 최초의 체스 선수입니다. 그는 장기간의 AI 훈련과 연구로 유명하기 때문에 체스 팬들로부터 종종 "심공 지능"이라고 불립니다.

신진석은 올해 2월 제25회 농심배에서 중국 주장 구쯔하오를 꺾고 단일 시즌 6연승, 시즌 통산 16연승을 달성하며 전임 이창호를 제쳤다. 올해 3월 그는 AI와의 관계에 대해 다음과 같이 말했다.

이제 AI와 친구가 된 것 같아요. 나보다 나은 AI들과 함께 공부했다. AI와 인간의 사고는 전혀 다릅니다. AI는 수학적 알고리즘을 통해 문제를 해결합니다. AI의 사고를 통해 많은 유익을 얻었습니다.

이제 중국, 한국, 일본의 프로 선수들은 AI를 사용하여 훈련할 것입니다.

"AI 맛" 종말

제너레이티브 AI 시대와 마찬가지로 일부 디자이너와 작가는 오랫동안 AI와 융합되어 온 바둑의 세계, 소위 'AI 풍미' 때문에 복잡한 자체 인증을 수행해야 합니다. 'AI 플레이버'의 등장도 다양한 이슈에 직면해 있다.

현재 바둑 게임에서는 AI를 활용해 승률을 예측하고 AI가 최선의 수를 추천하는 경우가 많습니다. 따라서 청중은 게임을 시청하는 과정에서 일종의 "주도성"을 얻을 수 있으며 다양한 시야각을 가질 수 있습니다.

2022년 심젠전(Shen Zhenzhen)과의 경기에서 중국 체스 선수 리쉬안하오(Li Xuanhao)는 AI의 최적 판단이 예측한 상위 3개에 부합하는 많은 결정을 내렸기 때문에 그의 팀 동료인 양딩신(Yang Dingxin)은 AI와의 부정행위 의혹에 의문을 제기했습니다.

1995년에 태어난 Li Xuanhao는 AI 훈련에 "9시부터 9시까지 일하며 정말 열심히 일합니다". 따라서 체스 게임은 소위 "기계 풍미"가 있다고 간주되기도 합니다.

해당 의혹에 대해 중국 바둑협회가 조사를 진행한 뒤 최종적으로 혐의에 대한 증거가 없다고 판단해 양딩신이 벌금을 부과했다.

그러나 AI를 이용한 부정행위 사례는 존재합니다.

2020년 대한민국의 프로 체스 선수 김은치(13세)의 온라인 경기 수법과 AI 추천이 92% 중복되는 것으로 밝혀졌다. 조사 결과, 결국 부정행위를 한 것으로 확인되어(그리고 이를 인정) 벌금을 부과하고 자격정지 1년을 선고받았습니다.

2022년 중국 체스 선수 Liu Ruizhi는 AI 부정 행위로 유죄 판결을 받았으며 중국에서 AI 부정 행위로 공식 처벌을 받은 최초의 프로 체스 선수였습니다. 김은치에 비해 유서지는 'AI 성향'을 피하는 법을 배웠고 일부 핵심 포인트에만 AI를 활용했다.

이에 대응하여 다양한 국가의 대회에서는 AI 부정 행위 방지 메커니즘이 지속적으로 개선되고 있습니다.

동시에 일부 사람들은 AI를 물리치기 위해 "AI 풍미"를 사용했습니다.

2023년에는 미국 아마추어 체스 선수 켈린 펠린(Kellin Pelrine)이 바둑 AI 카타고(KataGo)를 이겼습니다.

KataGo는 사용 가능한 가장 강력한 오픈 소스 Go AI 중 하나이며, 한국에서도 이를 사용하여 Go 선수를 교육할 예정입니다.

Pelrine은 FAR AI라는 프로그램을 사용하여 KataGo와 100만 개가 넘는 게임을 대결했습니다. 마침내 FAR AI는 KataGo의 약점을 발견하고 이를 인간-기계 결투에서 연습하여 승리했습니다.

그 전략은 그다지 유치하지는 않지만 배우기가 특별히 어렵지도 않습니다.

그런 다음 그는 또 다른 상대적으로 강력한 Go AI인 Leela Zero를 물리치기 위해 동일한 방법을 사용했습니다.

전략의 핵심은 상대방의 체스 말 그룹을 둘러싸는 큰 "원"을 만든 다음 갑자기 말을 관련 없는 다른 모서리로 이동하여 AI를 방해하는 것입니다.

펠린은 인간 체스 선수라면 원을 보면 분명 뭔가 잘못됐음을 알겠지만 AI는 이를 눈치채지 못할 것이라고 말했다.

이 약점은 조금 "까다롭다"고 생각됩니다. AI가 표적 훈련을 하게 하면 패치될 수 있을까요?

지난주 네이처(Nature)의 한 보고서는 올해의 사전 인쇄 논문을 인용하고 AI 약점을 특별히 찾는 프로그램 앞에서 모델 취약점은 생각만큼 해결하기 쉽지 않다고 지적했습니다.

이번에 "타겟"이 된 것은 KataGo였습니다. 연구원들은 KataGo의 반격 능력을 높이기 위해 세 가지 전략을 사용했습니다.

KataGo가 셀프 플레이를 통해 공격에 대응하는 방법을 배우게 하세요.
반복 훈련, 공격 프로그램을 사용하여 KataGo를 공격하고, 취약성을 KataGo에 다시 피드백하고, 자체 플레이 또는 기타 방법을 통해 이를 처리하는 방법을 학습한 다음, 공격 프로그램을 사용하여 KataGo를 공격하고, 이 주기를 반복합니다.
다른 신경망 모델을 사용하여 새로운 Go AI 시스템을 처음부터 훈련합니다.

이러한 훈련을 통해 KataGo의 방어 능력이 어느 정도 향상되었지만 공격 프로그램은 여전히 허점을 찾아 각각 91%, 81%, 78%의 승률로 KataGo를 물리칠 수 있습니다.

이러한 공격 프로그램 자체는 뛰어난 Go AI가 아니며 인간이 쉽게 물리칠 수 있습니다.

물론 여기서 핵심은 인간이 더 나은지 AI가 더 나은지 경쟁하는 것이 아니다.

요점은 AI가 "전복"한 분야인 바둑의 경우 수년 간의 적용과 개선에도 불구하고 AI에는 여전히 많은 문제가 있다는 것입니다. 논문의 저자인 Adam Gleave는 다음과 같이 말했습니다.

Go와 같은 단일 도메인에서 이 문제를 해결할 수 없다면 단기적으로 ChatGPT와 같은 모델에서 탈옥을 수정할 가능성은 희박해 보입니다.

소식

알파고에게 패한 이세돌, 무너진 세계를 재건하는 데 8년 걸렸다

소개

내 연락처 정보