Ο Lee Sedol, νικημένος από την AlphaGo, πέρασε 8 χρόνια για να ανοικοδομήσει τον κατεστραμμένο world

Ο Lee Sedol, νικημένος από το AlphaGo, πέρασε 8 χρόνια για να ξαναχτίσει τον κόσμο που είχε καταρρεύσει

2024-07-22

Χάνοντας από την τεχνητή νοημοσύνη, νιώθω ότι ολόκληρος ο κόσμος μου έχει καταρρεύσει.

είπε ο Λι Σέντολ σε πρόσφατη συνέντευξή του στους New York Times.

Το 2016, ο 14 φορές παγκόσμιος πρωταθλητής Κορεάτης σκακιστής εκπροσώπησε τους ανθρώπους σε έναν αγώνα εναντίον του AlphaGo της Google και τελικά έχασε με 1:4.

Όταν αποδέχτηκε την πρόσκληση, σκέφτηκε ότι θα ήταν μια «διασκεδαστική» εμπειρία:

Η προϋπόθεση της διασκέδασης είναι ότι πιστεύω ότι θα κερδίσω. Δεν πίστευα ποτέ ότι θα χάσω.

Αυτό ήταν ίσως ένα από τα πιο σημαντικά σημεία πριν από την εμφάνιση της τεχνολογίας AI στο ChatGPT.

Τώρα έχουν περάσει λιγότερο από δύο χρόνια από την κυκλοφορία του ChatGPT Έχουμε δει πολλά πεδία να επηρεάζονται από την τεχνητή νοημοσύνη και περισσότερες πτυχές της ζωής φαίνεται να έχουν προβλεφθεί για αλλαγή. ΟΛΑ ΣΥΜΠΕΡΙΛΑΜΒΑΝΟΝΤΑΙ.

Σε αυτό το πλαίσιο, ο κόσμος του Go, ο οποίος επηρεάστηκε από την τεχνητή νοημοσύνη νωρίτερα από άλλους κλάδους και τομείς, μπορεί να μας βοηθήσει να δούμε μια πιθανότητα που έχει ήδη συμβεί.

Αφού νικήσει τους ανθρώπους, η ισχυρότερη τεχνητή νοημοσύνη απο-ανθρωπίζεται περαιτέρω

Δεν μπορούσα να απολαύσω άλλο το Go, οπότε αποσύρθηκα.

Τρία χρόνια μετά τον αγώνα με την AlphaGo, ο Lee Sedol ανακοίνωσε επίσημα την αποχώρησή του.

Για τον Lee Sedol, ο οποίος ξεκίνησε να μαθαίνει το Go σε ηλικία 5 ετών, το Go δεν είναι απλώς ένας διαγωνισμός, αλλά μια τέχνη, μια επέκταση της προσωπικότητας και του στυλ του παίκτη, ωστόσο, στην εποχή της τεχνητής νοημοσύνης, έχει «μειωθεί». ένα παιχνίδι αλγοριθμικής απόδοσης.

Μέσα σε αυτά τα τρία χρόνια συνέβη ένα άλλο πράγμα.

Το 2017, η DeepMind ανακοίνωσε μια νέα έκδοση του AlphaGo - AlphaGo Zero.

Το AlphaGo γεννήθηκε από τη μάθηση και την αυτο-εξάσκηση του νευρωνικού δικτύου για περισσότερες από 30 εκατομμύρια κινήσεις από ανθρώπινους δασκάλους, αλλά το AlphaGo Zero διαχωρίστηκε από την «ανθρώπινη επαφή» από την αρχή Κατά τη διάρκεια της περιόδου εκπαίδευσης, δεν ήρθε σε επαφή με καμία ανθρώπινα ρεκόρ σκακιού και βασίστηκε αποκλειστικά στον εαυτό του και στη δική του σκακιστική εκπαίδευση.

Σε μόλις τρεις ημέρες, το AlphaGo Zero κέρδισε ήδη με 100:0 το AlphaGo.

Ο Ατλαντικός το αποκαλεί «AI που δεν χρειάζεται να μάθει τίποτα από τους ανθρώπους».

Στο Go, υπάρχει μια τεχνική που φαίνεται απλή ή ασήμαντη, αλλά μπορεί να αποτελέσει μοιραία απειλή μακροπρόθεσμα.

Τα αρχεία παιχνιδιών του AlphaGo και του AlphaGo Zero είναι τόσο δύσκολο να κατανοηθούν που θεωρούνται άμεσα ως "ένας μυστηριώδης οδηγός που έπεσε από έναν εξωγήινο πολιτισμό."

Ο Αμερικανός επαγγελματίας σκακιστής Μάικλ Ρέντμοντ είπε το 2017 ότι ένα από τα σημαντικά μέσα για να μάθουν οι άνθρωποι το Go είναι να χτίσουν μια ιστορία: "Έτσι επικοινωνούμε. Είναι πολύ ανθρώπινο πράγμα."

Αυτό μπορεί επίσης να απηχεί την άποψη του Lee Sedol ότι όταν παίζουν σκάκι, οι σκακιστές δείχνουν επίσης μέρος του εαυτού τους ως ανθρώπινα όντα.

Ο Ρέντμοντ πρόσθεσε ότι με βάση τις δικές του παρατηρήσεις, οι άνθρωποι σκακιστές είναι πιθανό να «σηκώσουν τα χέρια τους και να παραδοθούν» όταν θα δουν για πρώτη φορά σκάκι «με γεύση AI»:

Ο τρόπος με τον οποίο το AlphaGo παίζει σκάκι αισθάνεται πάντα πολύ «απάνθρωπος».

Ως ένας από τους πρώτους δασκάλους του Go που επηρεάστηκε, ο Lee Sedol δεν μπορούσε να το αφήσει να φύγει για μεγάλο χρονικό διάστημα.

Έγινε εμμονή με την AI.

Μετά τη συνταξιοδότηση, εκτός από το άνοιγμα της δικής του ακαδημίας Go, την έκδοση βιβλίων και την κυκλοφορία επιτραπέζιων παιχνιδιών με βάση το Go, ο Lee Sedol άρχισε επίσης να δίνει διαλέξεις για την τεχνητή νοημοσύνη:

Άρχισα να αντιμετωπίζω προβλήματα τεχνητής νοημοσύνης πολύ νωρίς και θα τα αντιμετωπίσουν και άλλοι. Αυτό μπορεί να μην οδηγήσει σε αίσιο τέλος.

Για αυτόν, η πιο ανησυχητική πτυχή της τεχνητής νοημοσύνης είναι ότι μπορεί να αλλάξει τις ανθρώπινες αξίες:

Στο παρελθόν, οι άνθρωποι θα ένιωθαν δέος για τη δημιουργικότητα, την πρωτοτυπία και την καινοτομία, αλλά από την εμφάνιση της τεχνητής νοημοσύνης, πολλά από αυτά έχουν εξαφανιστεί.

Δεν συμφωνούν όλοι με αυτή τη δήλωση.

Η εποχή της συνδημιουργίας ανθρώπου-μηχανής

Η τεχνητή νοημοσύνη κατέστρεψε όλη την υπάρχουσα τάξη στον κόσμο του Go και μετά άρχισε να την ξαναχτίζει.

είπε ο Jiuheng He, ένας λάτρης του Go που σπουδάζει τεχνητή νοημοσύνη στο Πανεπιστήμιο Cornell.

Σε πολλές ακαδημίες Go, η χρήση της τεχνητής νοημοσύνης για την εκμάθηση του Go είναι μια διαδικασία που πρέπει να περάσουν σχεδόν όλοι οι παίκτες.

Σε μια ακαδημία Go στο Χονγκ Κονγκ, ο Ng Chee Man παρέχει στους μαθητές iPads για να μάθουν το Go χρησιμοποιώντας AI.

Κάθε φορά που ένας μαθητής παίζει σκάκι, η τεχνητή νοημοσύνη θα δείχνει τις προτάσεις "καλύτερης κίνησης". Ταυτόχρονα, το σύστημα θα καταγράφει επίσης ποιες κινήσεις έκανε καλά ο μαθητής και ποιες κινήσεις δεν ήταν καλές.

Πέρυσι, μια μελέτη που δημοσιεύτηκε στο Proceedings of the National Academy of Sciences τόνισε ότι από τότε που η τεχνητή νοημοσύνη εισήλθε στον κύκλο του Go, η ικανότητα κρίσης των ανθρώπινων παικτών έχει βελτιωθεί.

Ήδη από το 2016, πριν ο AlphaGo νικήσει τον Lee Sedol, ο Fan Hui, ο οποίος είχε παίξει εναντίον του AlphaGo σε ιδιωτικό τεστ, είχε παρόμοια εμπειρία.

Αν και έχασε, ο Fan Hui είπε ότι το AlphaGo του επέτρεψε να δει το Go με έναν νέο τρόπο, βελτίωσε τις δεξιότητές του και του επέτρεψε να ανέβει γρήγορα στην παγκόσμια κατάταξη.

Η μελέτη του 2023 βασίζεται σε ρεκόρ σκακιού που συγκεντρώθηκαν από το 1950 έως το 2021, συμπεριλαμβανομένων στοιχείων για 5,8 εκατομμύρια χέρια.

Οι ερευνητές διαπίστωσαν ότι προτού η AlphaGo νικήσει τον Lee Sedol, η ποιότητα των κρίσεων των ανθρώπινων σκακιστών είχε παραμείνει σταθερή και βασικά αμετάβλητη για 66 χρόνια, ωστόσο, κατά το 2016 και το 2017, η ποιότητα των κρίσεων των σκακιστών άρχισε να ανεβαίνει.

Με άλλα λόγια, αν και οι άνθρωποι σκακιστές μπορεί να μην είναι σε θέση να νικήσουν τους σκακιστές με τεχνητή νοημοσύνη, οι ικανότητές τους στην κρίση έχουν πράγματι βελτιωθεί.

Είναι πολύ εμπνευσμένο να βλέπεις πόσο γρήγορα οι άνθρωποι σκακιστές μπορούν να προσαρμοστούν και να ενσωματώσουν αυτές τις νέες κινήσεις στις δικές τους μεθόδους. Αυτά τα αποτελέσματα υποδηλώνουν ότι οι άνθρωποι θα προσαρμοστούν σε αυτές τις ανακαλύψεις και θα βασιστούν σε αυτές για να βελτιώσουν σημαντικά τις δυνατότητές μας.

Ο David Silver, επικεφαλής ερευνητής στο DeepMind και επικεφαλής του έργου AlphaGo, σχολίασε αυτή την έρευνα.

Ο Ke Jie, ο οποίος ηττήθηκε από την AlphaGo το 2017, είπε επίσης το 2023 ότι σπάνια εξασκείται με πραγματικούς ανθρώπους εκτός από αγώνες και πιστεύει ότι η AI έχει γίνει ακόμη και η πηγή δημιουργικότητας στο Go:

Η δημιουργικότητα δεν είναι απλώς να κάνεις κάτι διαφορετικό. Η δημιουργικότητα πρέπει να τεθεί σε πραγματική μάχη και να δοκιμαστεί σήμερα, το μεγαλύτερο μέρος της καινοτομίας στο Go γίνεται από την τεχνητή νοημοσύνη ότι θα χάσουμε επειδή η τεχνητή νοημοσύνη περνά από πολλές πραγματικές μάχες και το να βρίσκεις διαφορετική σκέψη από πριν, αυτό είναι δημιουργικότητα.

Επιπλέον, ιδιαίτερο ενδιαφέρον παρουσιάζει και η απόδοση ενός άλλου επαγγελματία σκακιστή.

Ο Κορεάτης σκακιστής Shin Jin-jin είναι ο πρώτος σκακιστής μετά το 2000 που κέρδισε ένα παγκόσμιο πρωτάθλημα.

Τον Φεβρουάριο του τρέχοντος έτους, ο Shin Jin-seok νίκησε τον Κινέζο αρχηγό Gu Zihao στο 25ο Nongshim Cup, πετυχαίνοντας έξι διαδοχικές νίκες σε μία μόνο σεζόν και 16 διαδοχικές νίκες σε κάθε σεζόν, ξεπερνώντας τον προκάτοχό του Lee Chang-ho. Τον Μάρτιο του τρέχοντος έτους, μίλησε για τη σχέση του με την τεχνητή νοημοσύνη:

Νιώθω σαν AI και είμαι φίλοι τώρα. Σπούδασα με AI που ήταν καλύτεροι από εμένα. Η τεχνητή νοημοσύνη και η ανθρώπινη σκέψη είναι τελείως διαφορετικές για την επίλυση προβλημάτων μέσω μαθηματικών αλγορίθμων.

Τώρα, επαγγελματίες παίκτες στην Κίνα, τη Νότια Κορέα και την Ιαπωνία θα χρησιμοποιούν την τεχνητή νοημοσύνη για να προπονηθούν.

Αποκάλυψη «AI Flavor».

Ακριβώς όπως στην εποχή της γενεσιουργής τεχνητής νοημοσύνης, ορισμένοι σχεδιαστές και συγγραφείς πρέπει να διεξάγουν περίπλοκες αυτοπιστοποιήσεις λόγω της λεγόμενης «γεύσης AI» που περιέχεται στα έργα τους, η οποία έχει ενσωματωθεί με την τεχνητή νοημοσύνη για μεγάλο χρονικό διάστημα. αντιμετώπισε επίσης την εμφάνιση του "AI flavor".

Στα τρέχοντα παιχνίδια Go, το AI χρησιμοποιείται συχνά για την πρόβλεψη του ποσοστού νίκης και το AI συνιστά την καλύτερη κίνηση. Το κοινό μπορεί λοιπόν να αποκτήσει ένα είδος «πρωτοβουλίας» στη διαδικασία παρακολούθησης του παιχνιδιού και να έχει πολλαπλές γωνίες θέασης.

Το 2022, κατά τη διάρκεια του αγώνα εναντίον του Shen Zhenzhen, ο Κινέζος σκακιστής Li Xuanhao πήρε πολλές αποφάσεις που ήταν σύμφωνες με τους τρεις πρώτους που προέβλεπε η βέλτιστη κρίση του AI.

Ο Li Xuanhao, ο οποίος γεννήθηκε το 1995, "εργάζεται από τις εννέα έως τις εννέα, όλο το χρόνο και εργάζεται πραγματικά σκληρά" στην εκπαίδευση τεχνητής νοημοσύνης. Ως εκ τούτου, το παιχνίδι σκακιού μερικές φορές θεωρείται ότι έχει τη λεγόμενη "γεύση μηχανής".

Όσον αφορά τις αμφιβολίες, η κινεζική ένωση Go διενήργησε έρευνα και τελικά διαπίστωσε ότι δεν υπήρχαν στοιχεία για την κατηγορία και ο Yang Dingxin επέβαλε κυρώσεις.

Υπάρχουν όμως περιπτώσεις εξαπάτησης με AI.

Το 2020, ο 13χρονος επαγγελματίας σκακιστής της Νότιας Κορέας Kim Eun-chi βρέθηκε να έχει 92% επικάλυψη μεταξύ των κινήσεών του σε διαδικτυακούς αγώνες και των συστάσεων AI. Μετά από έρευνα, τελικά διαπιστώθηκε ότι είχε απατήσει (και το παραδέχτηκε) και του επιβλήθηκε πρόστιμο και αναστολή για ένα χρόνο.

Το 2022, ο Κινέζος σκακιστής Liu Ruizhi καταδικάστηκε για εξαπάτηση AI και ήταν ο πρώτος επαγγελματίας σκακιστής στην Κίνα που τιμωρήθηκε επίσημα για εξαπάτηση AI. Σε σύγκριση με την Kim Eun-chi, ο Liu Ruizhi έχει μάθει να αποφεύγει τη «γεύση AI» και χρησιμοποιεί AI μόνο σε ορισμένα βασικά σημεία.

Σε απάντηση, οι διαγωνισμοί σε διάφορες χώρες βελτιώνουν συνεχώς τους μηχανισμούς εξαπάτησης κατά της τεχνητής νοημοσύνης.

Ταυτόχρονα, μερικοί άνθρωποι έχουν χρησιμοποιήσει το "AI flavor" για να νικήσουν την AI.

Το 2023, ο Αμερικανός ερασιτέχνης σκακιστής Kellin Pelrine νίκησε το Go AI KataGo.

Το KataGo είναι ένα από τα πιο ισχυρά διαθέσιμα Go AI ανοιχτού κώδικα και η Νότια Κορέα θα το χρησιμοποιήσει επίσης για να εκπαιδεύσει τους παίκτες του Go.

Η Pelrine χρησιμοποίησε ένα πρόγραμμα που ονομάζεται FAR AI για να παίξει ενάντια στο KataGo για περισσότερα από 1 εκατομμύριο παιχνίδια Τέλος, η FAR AI βρήκε τις αδυναμίες του KataGo, τις εξασκήθηκε στη μονομαχία ανθρώπου-μηχανής και κέρδισε:

Αυτή η στρατηγική δεν είναι ακριβώς παιδαριώδης, αλλά δεν είναι και ιδιαίτερα δύσκολο να τη μάθεις.

Στη συνέχεια, χρησιμοποίησε επίσης την ίδια μέθοδο για να νικήσει τη Leela Zero, ένα άλλο σχετικά ισχυρό Go AI.

Το κλειδί για τη στρατηγική είναι να δημιουργήσετε έναν μεγάλο «κύκλο» που θα περιβάλλει την ομάδα των κομματιών σκακιού του αντιπάλου και στη συνέχεια να μετακινήσετε ξαφνικά ένα κομμάτι σε μια άλλη άσχετη γωνία για να παρέμβετε στο AI.

Ο Πελρίν είπε ότι αν ήταν άνθρωπος σκακιστής, σίγουρα θα ήξερε ότι κάτι δεν πήγαινε καλά όταν έβλεπε τον κύκλο, αλλά το AI δεν θα το προσέξει.

Αυτή η αδυναμία φαίνεται λίγο «δύσκολο».

Μια αναφορά στο Nature την περασμένη εβδομάδα παρέθεσε ένα προεκτυπωμένο έγγραφο από φέτος και επεσήμανε ότι ενόψει προγραμμάτων που αναζητούν ειδικά αδυναμίες της τεχνητής νοημοσύνης, τα τρωτά σημεία του μοντέλου δεν είναι τόσο εύκολο να διορθωθούν όσο φανταζόμαστε.

Αυτή τη φορά ήταν το KataGo που «στοχοποιήθηκε». Οι ερευνητές χρησιμοποίησαν τρεις διαφορετικές στρατηγικές για να κάνουν το KataGo πιο ικανό στην αντεπίθεση:

Αφήστε το KataGo να μάθει πώς να ανταποκρίνεται σε επιθέσεις μέσω αυτοπαιχνιδιών.
Επαναληπτική εκπαίδευση, χρησιμοποιήστε το πρόγραμμα επίθεσης για να επιτεθείτε στο KataGo, τροφοδοτήστε την ευπάθεια πίσω στο KataGo, αφήστε το να μάθει να το αντιμετωπίζει μέσω αυτοπαιχνιδιών ή άλλων μεθόδων και, στη συνέχεια, χρησιμοποιήστε το πρόγραμμα επίθεσης για να επιτεθείτε στο KataGo, επαναλαμβάνοντας τον κύκλο.
Εκπαιδεύστε ένα νέο σύστημα Go AI από την αρχή, χρησιμοποιώντας ένα διαφορετικό μοντέλο νευρωνικού δικτύου.

Αν και αυτές οι προπονήσεις έχουν βοηθήσει το KataGo να βελτιώσει τις αμυντικές του ικανότητες σε κάποιο βαθμό, το πρόγραμμα επίθεσης μπορεί να βρει κενά και να νικήσει το KataGo με 91%, 81% και 78% ποσοστά νίκης αντίστοιχα.

Αυτά τα προγράμματα επίθεσης δεν είναι εξαιρετικά Go AI και μπορούν εύκολα να νικηθούν από τους ανθρώπους.

Φυσικά, το κλειδί εδώ δεν είναι να ανταγωνιστούμε εάν οι άνθρωποι ή η τεχνητή νοημοσύνη είναι καλύτεροι.

Το θέμα είναι ότι για το Go, ένα πεδίο που η AI έχει «ανατρέψει», και μετά από τόσα χρόνια εφαρμογής και βελτίωσης, η AI της εξακολουθεί να έχει πολλά προβλήματα. Ο Adam Gleave, συγγραφέας της εργασίας, είπε:

Εάν δεν μπορούμε να λύσουμε αυτό το πρόβλημα σε έναν μόνο τομέα όπως το Go, τότε βραχυπρόθεσμα, η δυνατότητα διόρθωσης του jailbreak σε μοντέλα όπως το ChatGPT φαίνεται μικρή.

Νέα

Ο Lee Sedol, νικημένος από το AlphaGo, πέρασε 8 χρόνια για να ξαναχτίσει τον κόσμο που είχε καταρρεύσει

Εισαγωγή

τα στοιχεία επικοινωνίας μου