berita

Ketua ACL: ACL bukanlah konferensi AI

2024-08-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Laporan Jantung Mesin

Departemen Editorial Jantung Mesin

Bunyikan alarm atau bergerak menuju penutupan?

“ACL bukan konferensi AI (ACL bukan konferensi AI)”, pada ACL 2024 yang diadakan di Bangkok, Thailand, Ketua ACL tahun ini Emily M. Bender memberikan kesimpulan yang sangat kontroversial.



Konferensi ACL adalah konferensi internasional terkemuka di bidang linguistik komputasi dan pemrosesan bahasa alami. Konferensi ini diselenggarakan oleh Asosiasi Internasional untuk Linguistik Komputasi dan diadakan setiap tahun. Konferensi ACL selalu menduduki peringkat pertama dalam pengaruh akademis di bidang NLP, dan juga merupakan konferensi yang direkomendasikan CCF-A.

Dalam beberapa tahun terakhir, ketika pembelajaran mendalam dan metode lain telah menjadi arus utama penelitian NLP, semakin banyak orang yang menganggap konferensi ini sebagai konferensi AI, dan sebagian besar kiriman terkait dengan AI. Emily M. Bender tampaknya melihat beberapa kelemahan dari kecenderungan ini.

Dalam sambutannya beliau menekankan bahwa ACL merupakan Pertemuan Tahunan Association for Computational Linguistics yang intinya bukanlah kecerdasan buatan, namun lebih fokus pada teknologi bahasa dan linguistik komputasi.



Bender menjelaskan bahwa dia tidak menggunakan AI (kecerdasan buatan) sebagai sinonim untuk ML (pembelajaran mesin). Dia percaya bahwa pembelajaran mesin (termasuk pembelajaran mendalam) menyediakan banyak teknik yang berguna untuk teknologi bahasa dan linguistik komputasi, namun masalah muncul ketika fokusnya beralih ke AI.



Linguistik komputasional dan pemrosesan bahasa alami (CL/NLP) fokus pada persamaan/perbedaan bahasa, bagaimana informasi direpresentasikan dalam bahasa, bagaimana membangun teknologi untuk membantu transkripsi, terjemahan, ringkasan, perolehan informasi, dll. dalam berbagai bahasa, dan Cara mengevaluasi teknik-teknik ini, representasi perantara mana yang berguna untuk teknik ini, seberapa efektif teknik ML yang berbeda untuk tugas yang berbeda, dan bagaimana teknik bahasa berinteraksi dengan sistem kekuatan yang ada.



Permasalahan di bidang AI meliputi bagaimana membangun mesin berpikir yang dapat melakukan penalaran seperti manusia, bagaimana membuat mesin ini melampaui manusia dalam tugas-tugas kognitif, bagaimana mengotomatisasi metode ilmiah, dan bagaimana mengotomatisasi tugas-tugas kreatif.



Bidang AI juga memunculkan beberapa gagasan, seperti takdir umat manusia adalah bergabung dengan mesin untuk menjadi manusia super, bahwa kedatangan singularitas tidak bisa dihindari, dan bahwa AI (sebenarnya mesin teks sintetis) dapat menggantikan layanan yang harus kita berikan kepada setiap orang. lainnya (pendidikan, kesehatan, perwakilan hukum).



Ada banyak masalah di bidang AI, termasuk minat yang besar dari modal ventura dan miliarder.



Bender juga mengkritik beberapa praktik penelitian buruk di bidang AI, seperti penggunaan tolok ukur yang tidak tepat, persyaratan evaluasi komparatif dengan model tertutup SOTA, dan kumpulan data yang terlalu besar sehingga mengakibatkan kurangnya data yang disimpan. Bender mengatakan jika pertanyaan penelitian Anda berfokus pada "Bagaimana cara membuktikan bahwa mesin saya cerdas?" maka fokus ini dapat mendistorsi praktik penelitian.



Dia juga mencatat bahwa fokus pada AI telah menyebabkan praktik peninjauan yang buruk, sehingga makalah yang tidak menggunakan model bahasa besar (LLM) atau tidak memberikan hasil LLM berukuran SOTA mungkin dianggap tidak menarik.



Berbeda dengan praktik buruk di bidang AI, praktik terbaik penelitian di bidang CL/NLP mencakup penerapan teknologi, pemahaman perilaku bahasa manusia, penilaian yang terdefinisi dengan baik, penilaian intrinsik dan ekstrinsik, dasar yang kuat, data pengujian yang disimpan, dan detail. analisis kesalahan.





Bender mengatakan penelitian CL/NLP dibangun berdasarkan pemahaman data, termasuk pengetahuan tentang cara kerja bahasa (yaitu linguistik) dan dokumentasi kumpulan data.



Dalam hal replikasi dan reproduktifitas, Bender menekankan bahwa sains adalah tentang membangun penelitian sebelumnya, bukan hanya mencoba mencapainya.



Dalam hal dampak sosial, penelitian CL/NLP berfokus pada dampak teknologinya terhadap masyarakat, termasuk etika dan sejarah penelitian NLP, serta pemahaman kepada siapa bahasa dan teknologi tersebut akan digunakan, untuk siapa, dan untuk siapa, dan yang mungkin dikecualikan atau termasuk dan dirugikan.



Bender percaya bahwa ACL harus menjadi tempat yang berfokus pada teknologi bahasa, komunitas yang mempromosikan penelitian interdisipliner, bidang penelitian yang peduli terhadap komunitas bahasa, dan ruang di mana kita dapat mendiskusikan secara rasional dampak penelitian dan teknologi kita terhadap masyarakat.



Pandangan ini telah menimbulkan kontroversi besar di platform sosial.

Beberapa orang berpendapat bahwa ini adalah tanda kurang inklusif. “Momen terbaik dalam sejarah NLP terjadi ketika orang terbuka terhadap ide-ide dari disiplin lain: mempelajari metode statistik dari peneliti bahasa, belajar berpikir dari ilmuwan sosial dunia. Slide ini membuat saya berpikir bahwa beberapa orang ingin kami tutup."





Yang lain percaya bahwa pemisahan ini sama sekali tidak diperlukan karena keduanya telah terintegrasi secara organik.



Namun, beberapa orang mengungkapkan pemahaman mereka. Bagaimanapun, AI terlalu populer. Begitu sebuah konferensi "dikontrak" oleh makalah AI, penelitian di bidang lain pasti akan ditinggalkan, yang akan membuat konferensi tersebut kehilangan minat aslinya.





Mengenai sinyal yang dikirimkan oleh pidato ini, semua orang mulai berspekulasi: Apakah ini berarti ACL tidak menerima makalah AI?



Apa pendapat Anda tentang ini?

Tautan referensi: https://faculty.washington.edu/ebender/papers/ACL_2024_Presidential_Address.pdf