berita

Pakar robotika Google: AI juga akan menemui hambatan yang sama seperti yang dihadapi robot di dunia nyata

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Laporan Jantung Mesin

Penyunting: Zhang Qian

“Pembelajaran mesin telah hidup dalam gelembung yang membuat iri para ahli robotik, ahli kimia, ahli biologi, dan ahli saraf, dan ketika hal ini benar-benar mulai terjadi, kita semua akan menghadapi masalah yang sama yang telah dihadapi semua orang selama bertahun-tahun. .hambatan yang realistis.”

Beberapa orang mengatakan bahwa kemajuan di bidang robotika lambat, atau bahkan tidak mengalami kemajuan dibandingkan dengan subbidang pembelajaran mesin lainnya.

Alex Irpan, seorang ilmuwan robotika di Google DeepMind dan peserta dalam proyek intelijen seperti SayCan, RT-1, dan RT-2, setuju. Namun ia percaya bahwa hal ini terjadi karena robotika adalah bidang yang terkait erat dengan kenyataan, dan kompleksitas realitas menentukan bahwa robotika pasti akan menemui jalan buntu. Dia juga mencatat bahwa masalah ini tidak hanya terjadi pada robotika. Masalah yang sama berlaku untuk teknik seperti model bahasa besar (LLM). Model-model ini menghadapi kompleksitas yang serupa dengan robotika ketika dihadapkan pada dunia nyata.

Baru-baru ini, dia menulis blog berjudul “Tragedi Realitas Akan Datang untuk Anda” untuk menggambarkan hal ini.



Tragedi realitas sedang mendatangi Anda

Pada tahun 2023, saya menghadiri konferensi ML. Ye Weiyang sedang mabuk, dan topiknya beralih ke pertanyaan: "Jika Anda dapat memberikan sumber daya dari subbidang pembelajaran mesin apa pun ke subbidang lain, subbidang mana yang akan Anda hentikan, dan kepada siapa Anda akan memberikan sumber daya tersebut?"

Saya tidak ingat apa yang dikatakan orang, tetapi satu orang mengatakan mereka akan menebang robot-robot itu. Ketika saya menekan lebih jauh, mereka mengatakan robotika berkembang terlalu lambat dan tidak ada yang terjadi dibandingkan bidang lain.

Mereka mengatakan bahwa robotika telah berkembang lebih lambat daripada subbidang perangkat lunak pembelajaran mesin murni, dan menurut saya mereka benar, tetapi saya ingin menambahkan dua poin lagi:

  • Alasan robot belajar lebih lambat adalah karena sulitnya membuat perbedaan tanpa memecahkan masalah yang sulit.
  • Tantangan robotika tidak hanya terjadi pada robot.

Di bidang robotika, pepatah umum mengatakan "realitas itu berantakan". Sehubungan dengan kode, saya akan memperluas ini ke "realitas itu kompleks". Dalam robotika, Anda cenderung mendorong realitas yang berantakan ke tingkat abstraksi yang cukup baik sehingga kode dapat mengatasinya. Sebagai sebuah bidang, ilmu komputer telah menghabiskan waktu puluhan tahun untuk menciptakan lapisan abstraksi yang baik antara perangkat keras dan perangkat lunak. Kode tersebut menjelaskan cara menyalurkan daya ke hard drive, prosesor, dan layar, dan cukup andal sehingga saya bahkan tidak perlu memikirkannya.



Ada banyak manfaat melakukan hal ini. Setelah Anda menyelesaikan kerja keras dan memindahkan kemajuan pekerjaan Anda ke ruang abstrak dan logis, segalanya menjadi lebih mudah. Kode dan datanya sangat dapat direproduksi. Saya menyinkronkan salinan file yang mewakili draf postingan blog ini di 3 perangkat tanpa berpikir panjang.

Namun, seperti yang dikatakan Joel Spolsky, semua abstraksi memiliki lubang pada tingkat tertentu, dan saya menemukan bahwa lubang dalam robotika cenderung lebih besar lagi. Ada banyak kemungkinan terjadinya kesalahan yang tidak ada hubungannya dengan kebenaran kode Anda.

Apakah ini ada hubungannya dengan beberapa prinsip dasar subjek? Sedikit. Banyak perangkat keras robotika yang lebih eksperimental daripada laptop atau server Linux. Robotika konsumen belum menjadi industri besar. "Eksperimental" sering kali berarti "keadaan yang aneh dan lebih rawan kegagalan".

Namun, menurut saya perangkat keras bukanlah penyebab utama masalahnya. Kenyataan adalah akar masalahnya. Benjamin Holson mengungkapkannya dengan sangat baik dalam artikelnya “Mythical Non-Roboticist”:

Kesulitan pertama adalah robot harus menghadapi persepsi yang tidak sempurna dan eksekusi yang tidak sempurna di dunia nyata. Keadaan yang bisa berubah secara global adalah gaya pemrograman yang buruk karena sangat sulit untuk ditangani, tetapi untuk perangkat lunak robot, seluruh dunia fisik adalah keadaan yang bisa berubah secara global dan Anda hanya dapat mengamatinya dengan tidak dapat diandalkan dan berharap bahwa Tindakan Anda membawa Anda lebih dekat ke apa yang ingin Anda capai.

Penelitian robotika bergantung pada pembangunan jembatan baru antara realitas dan perangkat lunak, namun hal ini juga terjadi di luar penelitian robotika. Perangkat lunak apa pun yang berinteraksi dengan kenyataan memiliki pemahaman yang tidak sempurna tentang kenyataan. Perangkat lunak apa pun yang berupaya mempengaruhi perubahan di dunia nyata harus menghadapi keadaan realitas yang bisa berubah secara global. Perangkat lunak apa pun yang perilakunya bergantung pada apa yang terjadi dalam kenyataan akan mengundang kebisingan dan kompleksitas yang merugikan.

Game AI adalah contoh yang bagus. AI catur sangat dapat diandalkan. Namun, beberapa Go AI manusia super dapat dikalahkan jika Anda bermain catur dengan cara tertentu, seperti yang ditemukan Tony T. Wang dkk dalam makalah ICML 2023 "Kebijakan Adversarial Mengalahkan Go AI Manusia Super". Teknik permusuhan menemukan strategi yang cukup jelas sehingga manusia dapat menirunya.

Pada Lampiran G.2, salah satu penulis kami, seorang pakar Go, mampu menerapkan serangan [siklik] ini dengan mempelajari rekor permainan lawan tanpa bantuan algoritmik apa pun. Mereka bermain dalam kondisi manusia standar di server Go online KGS dan mencapai tingkat kemenangan lebih dari 90% di game robot KataGo teratas yang tidak terkait dengan penulisnya.
Penulis bahkan berhasil menang dengan memberikan robot 9 handicap, yang merupakan keuntungan besar: pemain catur profesional manusia dengan handicap ini akan memiliki tingkat kemenangan hampir 100% melawan lawan mana pun, manusia atau AI%. Mereka juga mengalahkan KataGo dan Leela Zero, keduanya melakukan 100.000 pencarian per game, yang biasanya jauh melampaui kemampuan manusia. Sejak itu, manusia lain telah menggunakan serangan siklik untuk mengalahkan berbagai Go AI top lainnya.

Sementara itu, beberapa tahun lalu, OpenAI menciptakan sistem yang mengalahkan juara bertahan dunia Dota 2. Setelah membuka sistem kepada publik untuk menguji ketangguhannya, satu tim menyusun strategi yang menghasilkan 10 kemenangan beruntun.



Berdasarkan hal ini, Anda mungkin mengambil pandangan pesimis bahwa bahkan "realitas" sederhana seperti menghubungkan papan Go 19 x 19 atau Dota 2 memiliki kompleksitas tambahan yang cukup untuk membuat perilaku yang kuat menjadi menantang. Menurut saya pandangan ini tidak adil, karena tidak ada sistem yang menjadikan ketahanan sebagai tujuan tertinggi, namun menurut saya keduanya merupakan studi kasus yang menarik.

Akhir-akhir ini, ada gelombang hype seputar LLM – apa yang bisa mereka lakukan dan di mana mereka bisa diterapkan. Tersirat dalam hal ini adalah keyakinan bahwa LLM dapat secara dramatis mengubah cara orang berinteraksi dengan teknologi di tempat kerja dan waktu luang. Dengan kata lain, LLM akan mengubah cara kita berinteraksi dengan kenyataan. Faktanya, saya telah ikut-ikutan dalam tren hype, khususnya kecurigaan saya bahwa model yang mendasarinya telah dilebih-lebihkan dalam jangka pendek dan diremehkan dalam jangka panjang. Namun, hal ini juga berarti bahwa, dalam bidang yang secara historis buruk dalam mempertimbangkan realitas, segala kekacauan dalam realitas akan datang.

Pada konferensi ML yang sama di mana orang ini mengatakan robotika adalah pemborosan sumber daya, saya menyebutkan bahwa kami melakukan eksperimen model dasar dengan robot sungguhan. Beberapa orang mengatakan ini tampak sedikit menakutkan dan saya meyakinkan mereka bahwa itu hanyalah prototipe penelitian. Namun menurut saya perangkat lunak pembuatan dan eksekusi LLM agak menakutkan, dan menurut saya menarik bahwa mereka secara samar-samar mengkhawatirkan satu hal tetapi tidak pada yang lain. Orang-orang di Silicon Valley memiliki sedikit kontradiksi. Mereka percaya bahwa perangkat lunak dapat mendorong perusahaan rintisan untuk mencapai perubahan luar biasa dan bahwa perangkat lunak mereka tidak layak untuk dipikirkan atau direnungkan. Saya percaya bahwa dunia keping merupakan bagian dari realitas seperti halnya dunia atom. Mereka beroperasi pada tingkat yang berbeda, namun semuanya merupakan bagian dari kenyataan.

Saya telah memperhatikan (dengan beberapa schadenfreude) bahwa praktisi LLM mulai menghadapi masalah yang sama seperti yang dialami robotika sebelumnya. Misalnya, "Kami tidak dapat meniru pelatihan ini karena biayanya terlalu mahal." Ya, isu ini sudah dibahas di bidang robotika setidaknya selama sepuluh tahun. Contoh lain: “Saya tidak dapat meminta Bing memberi tahu saya tanggal rilis Avatar 2 karena Bing terus-menerus mengambil laporan berita tentang dirinya sendiri dan mengoreksi dirinya sendiri sebelum membuatnya.”

Kita sekarang hidup di dunia di mana setiap teks yang tersedia untuk umum di Internet mempengaruhi generasi peningkatan pengambilan secara permanen. Selamat datang di kondisi global yang bisa berubah. Setiap kali saya melihat seseorang menyatakan bahwa perilaku ChatGPT telah mengalami kemunduran, saya memikirkan berbagai "teori konspirasi" yang saya dan orang lain kemukakan untuk menjelaskan penurunan kinerja robot yang tiba-tiba dan tidak dapat dijelaskan, dan apakah masalahnya terletak pada model atau lingkungan. . Atau apakah itu kesimpulan kita yang berlebihan.

Seperti kata pepatah, "semua demo robot bohong", orang menganggap semua demo LLM juga bohong. Saya pikir, pada dasarnya, hal ini tidak dapat dihindari karena rentang perhatian manusia terbatas. Penting untuk menilai jenis, ukuran dan pentingnya kebohongan. Apakah mereka menunjukkan bagaimana model/bot menggeneralisasi? Apakah mereka menyebutkan betapa cermatnya pemilihan contoh-contoh ini? Persoalan-persoalan ini menjadi lebih kompleks ketika kenyataan dihubungkan. Messi terlihat seperti pemain bagus saat ini, tapi “bisakah dia melakukannya di malam yang dingin dan hujan di Stoke City”?

Yang lebih rumit lagi, jawaban atas pertanyaan-pertanyaan ini tidak selalu “tidak”. Messi bisa melakukannya pada malam yang dingin dan hujan di Stoke City. Dia cukup baik. Hal ini membuat pertanyaan menjadi sulit karena jauh lebih penting menjawab "ya" dengan benar daripada menjawab "tidak" dengan benar. Ketika LLM menjadi lebih baik dan lebih baik, dan ketika AI menjadi lebih umum dalam kehidupan sehari-hari, sebagai masyarakat kita perlu menjadi lebih baik dan lebih baik lagi dalam menilai apakah suatu model telah terbukti berhasil. Salah satu kekhawatiran utama saya tentang masa depan adalah kita tidak pandai mengevaluasi apakah model telah membuktikan dirinya.

Namun, saya berharap para robotika akan menjadi yang terdepan. Kami mengeluh tentang masalah evaluasi sebelum saran bahwa LLM memanipulasi tolok ukur umum muncul. Jauh sebelum "kita membutuhkan cakupan data yang lebih baik" menjadi slogan tim pra-pelatihan model dasar, kami bekerja keras untuk mendapatkan data yang cukup guna menangkap dampak jangka panjang dari mengemudi otonom. Pembelajaran mesin telah hidup dalam gelembung yang membuat iri para ahli robotik, ahli kimia, ahli biologi, dan ahli saraf, dan ketika hal ini benar-benar mulai terjadi, kita semua akan menghadapi masalah yang sama yang telah dihadapi semua orang selama bertahun-tahun. Hambatan yang realistis. Tantangan-tantangan ini dapat diatasi, namun akan sulit. Selamat Datang di dunia nyata. Selamat datang di dunia kesakitan.

Tautan asli: https://www.alexirpan.com/2024/07/08/tragedies-of-reality.html