Percakapan Miss A dengan Serge Belongie: Memberi Anda “peluru” yang dapat dipalsukan

Percakapan Miss A dengan Serge Belongie: Memberi Anda “peluru” yang dapat dipalsukan |

2024-07-31

Kepalsuan adalah malaikat sekaligus iblis, pada akhirnya kepalsuan adalah jabat tangan yang menyelaraskan dunia.

Penulis｜Zhang Yijia Sukhoi‍‍

Sepuluh tahun yang lalu, seorang akademisi Eropa berkata kepada saya: "Ada tidak kurang dari seratus jalur yang terbagi dalam kecerdasan buatan, dan Amerika Serikat akan menentukan satu atau dua jalur yang populer. , dan kemudian para pengusaha dan investor global bergegas mengejar kedua jalur tersebut. "

Dalam sepuluh tahun berikutnya, tren kecerdasan buatan telah berputar, dan kecerdasan buatan telah berubah dari non-konsensus menjadi konsensus kecil, dan dari konsensus kecil menjadi konsensus besar, namun kalimat ini tidak pernah muncul begitu saja.

Percakapan dengan Serge ini dimulai dengan review makalah yang dia tulis bersama dua tahun lalu."Mencari Struktur dalam Klaim yang Tidak Dapat Difalsifikasi" kepentingan. Sayangnya artikel ini hampir tidak mendapat perhatian selama ini Google CendekiaHanya dikutip 2 kali。

Ini mengejutkan.

"Jiazi Guangnian" percaya bahwa,esai initerlalu diremehkan。

Alasan 1: Masalah yang dihadapi artikel ini sangat kritis (narasi yang mendasari data yang tidak dapat dipalsukan di media sosial);

Alasan kedua, artikel ini memberikan inovasi teoretis yang penting (metode anotasi terner dan kumpulan SNaCK);

Alasan ketiga: Artikel ini memberikan hasil rekayasa praktis (konstruksi kumpulan data dan perbandingan eksperimental terperinci).

Penulis makalah Peter Ebert Christensen, Frederik Warburg, Menglin Jia dan Serge Belongie;

Makalah ini tidak sulit untuk dipahamiKepalsuanKonsepnya mulai diperkenalkan.

Kepalsuan disebut juga sanggahan.Filsafat ilmu sering menggunakan istilah yang ketatmetode pemalsuanUntuk menentukan apakah suatu teori itu ilmiah, yaitu“Kesimpulan ini harus memungkinkanlogikaAdanya contoh tandingan terhadap。

Karl Popper mengusulkan pada tahun 1934 bahwa jika suatu teori atau hipotesis dapat dibantah secara logis melalui pengujian empiris terhadap teknik yang ada, maka hal tersebut dapat dibenarkan.Dapat dipalsukan dari. Dan jika suatu ungkapan begitu sempurna sehingga dunia tidak mempunyai ruang untuk berkomentar, sering kali hal tersebut hanya akan menjaga jarak dari semua orang, dan hal ini tidak membantu dalam mendorong kemajuan ilmu pengetahuan.

Permasalahan yang dapat atau harus dipelajari oleh para ilmuwan harus dibatasi, sehingga memberikan kesempatan kepada pihak lain untuk menyerang atau bahkan membalikkan permasalahan tersebut. Tujuan dari falsifiabilitas adalah untuk membuat teori menjadi prediktif dan dapat diuji.sehingga berguna dalam praktik。

makalah Serge"Mencari Struktur dalam Klaim yang Tidak Dapat Difalsifikasi"dibahasKompleksitas dalam menafsirkan klaim yang tidak dapat dipalsukan di media sosial。

Gagasan utama makalah ini:

Platform media sosial dibanjiri dengan postingan dan komentar, dan banyak klaim yang tidak dapat disangkal. Namun,Alat pengecekan fakta yang tidak memadai, kurangnya struktur dalam diskusi jaringan sosial, kesulitan dalam mengidentifikasi narasi, dan kurangnya kualitas dalam diskusi publikdll., menyebabkan banyak masalah.

Makalah ini mengkaji bagaimana mengidentifikasi dan memahami orang-orang di media sosialklaim yang tidak dapat dipalsukan, dan rangkum klaim ini sebagaiSejumlah narasi terbatas, untuk lebih memfasilitasi diskusi dan perdebatan di media sosial.

Menariknya, penulis membangun sebuah alat bernamaKERTASKumpulan data berisi perdebatan mengenai metode pengeringan tangan di toilet umum (handuk kertas vs. pengering udara), 600 kutipan teks pendek, 31 narasi, dan 4 superkategori untuk memahami dan menemukan narasi dominan dalam diskusi online.

Makalah ini memperkenalkanSebuah pendekatan baru yang melampaui kemampuan teknologi pengecekan fakta yang ada, memberikan kontribusi penting dalam mengelola dan memahami dampak klaim yang tidak dapat dipalsukan dalam lingkungan komunikasi digital - menggunakan proses ini untuk menemukan narasi dominan, dan menunjukkan bahwa proses ini mengungguli model transformasi skala besar terkini dan model subjek tanpa pengawasan yang canggih .

melalui eksperimen,Penulis menemukanGunakan konverter kalimat modern(seperti model T5)Penyematan kalimat awaladalah kuncinya .Mereka juga menemukan bahwa strategi pengambilan sampel sangat penting untuk menghasilkan penyematan berkualitas tinggiStrategi "Jarak-Rnd".Performa terbaik.

Hasil eksperimen menunjukkan bahwa menggabungkan anotasi manusiakembar tigadapat mengungkapkan kepatuhannarasi yang mengkristalpengelompokan yang menarik.

Hanya 2 kutipan

"Jiazi Guangnian" percaya bahwa kemungkinan alasan mengapa makalah ini kurang mendapat perhatian industri sejauh ini termasuk namun tidak terbatas pada:

(1) Analisis teoritis relatif lemah, dan analisis hasil eksperimen masih bersifat kualitatif (teks setebal 11 halaman hanya berisi rumus setengah halaman);

(2) Hampir tidak ada pengenalan beberapa algoritma yang digunakan untuk perbandingan;

(3) Belum adanya kesatuan data civitas akademika dalam bidang ini, sehingga tidak terjadi “out of the Circle” di kalangan sivitas akademika;

(4) Penulis menekankan pentingnya T5, namun tidak menjelaskan secara jelas keunggulan algoritmanya.

Sharing akademis Serge Belongie di CVPR2024, sumber: Difoto oleh "Jiazi Guangnian"

Meskipun makalah-makalah yang disebutkan di atas kurang diketahui, Serge sendiri adalah seorang ilmuwan yang sangat berpengaruh di bidang visi komputer dan pembelajaran mesin. Ia terutama mempelajari pengenalan objek dan segmentasi gambar. Berbagai makalahnya telah dikutip sebanyak 1.789,71 juta kali.

Serge Belongie adalah profesor ilmu komputer di Universitas Kopenhagen dan direktur The Danish Pioneer Center for Artificial Intelligence. Sebelumnya, dia menjabat sebagai dekan dan Profesor Ilmu Komputer Andrew H. dan Ann R. Tisch di Cornell Tech.

Yang paling layak untuk diperkenalkan adalahSerge adalah penulis utama MSCOCO。

Kumpulan data MSCOCO adalah salah satu kumpulan data berskala besar yang paling terkenal untuk visi komputer.Pada tahun 2000, Serge dan Jitendra Malik (sekarang profesor ilmu komputer di Universitas California, Berkeley, dan seorang sarjana terkenal di bidang visi komputer)bersama-sama mengusulkan konsep “Konteks Bentuk”,Ini adalah metode deskripsi fitur bentuk yang banyak digunakan di bidang visi komputer dan pengenalan objek.

Pada tahun 2004, Serge dinobatkan sebagai Inovator Teknologi Muda di bawah 35 tahun oleh MIT Technology Review pada tahun 2007, ia dan Jitendra Malik menerima penghargaan terhormat untuk Marr Prize pada tahun 2015, Serge menerima ICCV Helmholtz Award, penghargaan ini terutama diberikan kepada penulis makalah yang telah memberikan kontribusi mendasar di bidang visi komputer.

Serge juga merupakan salah satu pendiri beberapa perusahaan, termasuk Digital Persona (bergabung dengan CrossMatch pada tahun 2014), CarCode (diakuisisi oleh Transport Data Systems), Anchovi Labs (diakuisisi oleh Dropbox pada tahun 2012), dan Orpix.

Saat ini, tim SergeMembuka dimensi baru dalam analisis jaringan sosial——Berawal dari banyaknya komentar-komentar sepele yang selama ini tidak diperhatikan dan tidak cocok untuk pengecekan fakta secara tradisional,Analisis pengaturan masalah dan“manipulasi narasi”。

Hal ini mempunyai arti khusus pada saat ini:

Setelah Perang Anti-Fasis Dunia, tidak peduli apakah terobosan teknologi atau kemacetan terjadi secara bergantian, semuanya mengalami naik turunnya gambaran sejarah seiring berjalannya waktu. Sama seperti "Sepanjang Sungai Selama Festival Qingming" yang dibuka dalam sistem koordinat ruang dan waktu, film ini penuh dengan ribuan pemandangan dan penampakan makhluk purba dan modern.

Berikut perbincangan Miss A dengan Serge.

Ikuti akun publik "Jiazi Guangnian" dan balas "dapat dipalsukan" di latar belakang untuk mendapatkan informasi yang disebutkan dalam artikel"Mencari Struktur dalam Klaim yang Tidak Dapat Difalsifikasi"DanKumpulan data MSCOCODua makalah.

1. Kepalsuan sedang ditantang

Peneliti dalam praktiknya sering kali dipengaruhi oleh narasi yang mereka suka atau tidak suka—agak mirip dengan topik yang sedang tren di Instagram.

Merindukan sebuah: “Jika tidak dapat dipalsukan, maka tidak dapat bersifat ilmiah” telah menjadi konsensus umum dalam komunitas ilmiah. Namun banyak filsuf yang mempertanyakan hal ini, dengan alasan bahwa prinsip falsifiabilitas dapat menimbulkan perdebatan ilmiah yang tiada akhir.Apakah falsifiabilitas merupakan kondisi yang diperlukan untuk kemajuan ilmu pengetahuan?

sersan：Menurut pendapat umum, teori ilmiah harus dapat dipalsukan.

Merindukan sebuah:Ini adalah pandangan yang populer, namun apakah falsifiabilitas merupakan paradigma yang berlaku?

Sersan： Literatur pembelajaran mesin telah berkembang pesat dalam 15 tahun terakhir, dengan sejumlah besar makalah diterbitkan dan dikutip setiap hari. Dalam makalah ini, bagian karya terkait sering kali mengutip literatur lain, namun kutipan tersebut belum tentu merupakan literatur yang paling relevan dengan karyanya. Hal ini karena jumlah lekturnya sangat banyak;Peneliti sebenarnya sedang merespons narasi dominan di lapangan.

Kita sering menganggap diri kita sebagai ilmuwan dalam tradisi Karl Popper, dan hanya tunduk pada pernyataan yang bisa dipalsukan. Namun, ada juga tren dalam penelitian ilmiah, seperti teknologi seperti jaringan generatif permusuhan generatif dan Transformers. Meskipun makalah ini bertujuan untuk mengikuti tradisi ilmiah,Dalam praktiknya, para peneliti sering kali dipengaruhi oleh narasi yang mereka suka atau tidak suka——Mirip seperti trending topik di Instagram。

Merindukan sebuah:Maksud Anda, sejak pembelajaran mesin, para ilmuwan mulai menyimpang dari norma kepalsuan?

Sersan：Para ilmuwan sering kali mengaku kebal terhadap pengaruh-pengaruh ini dan menganggap diri mereka objektif, namun mereka adalah manusia dan akan terpengaruh oleh pendapat-pendapat populer ini.Ini adalah sesuatu yang kami anggap tidak ilmiah dan lebih merupakan firasat dan opini.

Merindukan sebuah:Bagaimana Anda mendefinisikan klaim yang tidak dapat dipalsukan di media sosial?

Sersan： Pertama-tama kita perlu mendiskusikan literatur mengenai pengecekan fakta. Profesor Isabelle Augenstein dari Universitas Kopenhagen, misalnya, telah mengembangkan metode yang dimulai dengan menentukan nilai verifikasi suatu pernyataan. Kami akan memeriksa pernyataan,dan tentukan nilai verifikasinya dalam rentang 0 hingga 1。

Misalnya, pernyataan bahwa ibu kota California adalah Sacramento sangat ideal untuk pemeriksaan tata bahasa dan sintaksis karena dapat ditemukan di berbagai basis pengetahuan terstruktur. Kita dapat memeriksa pernyataan seperti: "Ibu kota Kalifornia adalah Sacramento" dan memberinya skor kemampuan uji yang mungkin mendekati 0,99. Kami kemudian mengirimkannya ke basis pengetahuan terstruktur untuk mengonfirmasi jawabannya. Sistem pengujian berbasis pembelajaran mendalam ini memproses klaim dalam jumlah besar dan data pelatihan untuk mengevaluasi nilai verifikasi berbagai klaim.

Namun beberapa pernyataan,Misalnya, "Imigrasi ke California itu buruk" lebih mencerminkan opini pribadi dan tidak cocok untuk pengecekan fakta.Sebaliknya, pernyataan seperti “Sejak tahun 2020, jumlah imigran di California terus meningkat” memiliki nilai verifikasi yang tinggi.

JadiKami memberikan perhatian khusus pada klaim yang sulit diverifikasi——Klaim-klaim ini tidak dapat diverifikasi secara langsung, namun diskusi yang dipicunya di media sosial sangatlah penting.。Beberapa pemeriksaan dapat membantu kami membuat penilaian yang lebih baik.

Merindukan sebuah:Dalam penelitian Anda, teknik atau alat spesifik apa yang digunakan untuk mengidentifikasi dan menganalisis klaim yang tidak dapat dipalsukan?

Sersan：Kami menggunakan teknik pemrosesan bahasa alami (NLP), algoritma pengelompokan dan pengelompokan, dan metode pembelajaran mesin.

target kami adalahMenciptakan Fasilitas Informasi Narasi Global (GNIF), untuk meneliti dan mengatur konten media sosial。

Kombinasi teknologi dan alat ini memungkinkan kami memahami dan memproses konten naratif dalam jumlah besar dengan lebih baik,Secara tidak langsung membantu mengidentifikasi klaim yang tidak dapat dipalsukan。

Kita mampu menganalisis berbagai bentuk teks.Entah itu tweet atau komentar Reddit, kami menggunakan teknologi NLP untuk mengekstrak dan memahami narasi dan tema dalam konten ini.

Kedua, kami menggunakanAlgoritma pengelompokan dan pengelompokan . Algoritme ini membantu kami mengatur konten media sosial dalam jumlah besar ke dalam tema atau narasi berbeda.

Misalnya,Kita dapat menemukan ribuan tweet dari jutaan tweet yang sangat mirip karena semuanya membahas narasi mendasar yang sama.

lulusPengelompokan naratif dan pengelompokan pernyataan , kami mengatur konten dalam jumlah besar ke dalam kelompok yang lebih kecil, sehingga pemeriksa fakta dapat memprosesnya dengan lebih efisien tanpa harus memeriksa setiap item satu per satu. Dengan cara ini, bahkan klaim yang tidak dapat dipalsukan pun dapat diidentifikasi dan diklasifikasikan melalui pengelompokan dan pengelompokan untuk memfasilitasi analisis dan pemrosesan lebih lanjut.

Kami mempertimbangkan dua masukan, misalnya dua tweet, dan mengukur kesamaannya berdasarkan aspek narasi yang berbeda -Ini mungkin mencakup topik seperti perdebatan nuklir versus energi hijau, atau diskusi tentang susu formula versus susu sapi.

Ada banyak topik hangat yang diperdebatkan secara online, sering kali merupakan akibat dari kampanye disinformasi。 Kegiatan-kegiatan ini bisa sangat samar-samar. Apa yang kami coba pahami adalah bagaimana pernyataan-pernyataan berbeda ini terwujud dalam bentuk bahasa atau meme, yang mungkin berisi gambar, teks, pernyataan audio, dan lain-lain.Sepertinya konten yang sangat berbeda . Anda mungkin mengumpulkan jutaan diskusi tentang suatu topik di platform media sosial, namun semua data mungkin hanya mewakili beberapa lusin opini. Kami mencoba memahami fenomena ini melalui teknologi seperti model bahasa besar dan pembelajaran metrik mendalam.

Visualisasi Pasangan Beranotasi Manusia, Subgambar (a) menunjukkan pasangan positif, yaitu pasangan naratif yang serupa atau konsisten yang diberi anotasi oleh manusia. Subgambar (b) menunjukkan pasangan negatif, yaitu pasangan narasi yang berbeda atau tidak konsisten yang diberi label oleh manusia. Sumber: "Mencari Struktur dalam Klaim yang Tidak Dapat Difalsifikasi"

2. Melampaui “benar dan salah”

Tidak semua klaim layak dilakukan pengecekan fakta, dan tidak semua pengecekan fakta memberikan hasil yang benar atau salah.

Merindukan sebuah: Kumpulan data MSCOCO yang Anda buat adalah salah satu kumpulan data visi komputer berskala besar yang paling terkenal. Bagaimana awalnya?

Sersan： Kami memulai penelitian deteksi objek 15 tahun lalu, dimulai dengan kumpulan data kecil CUB200 yang berisi lebih dari 200 spesies burung. Kumpulan data COCO awalnya merupakan proyek magang musim panas mahasiswa doktoral saya Tsung-Yi Lin di Microsoft Research. Mentornya pada saat itu adalah mahasiswa doktoral saya yang lain, Piotr Dollá. Proyek ini berkembang menjadi konsorsium peneliti dari akademisi dan industri. Mereka berharap dapat membuat kumpulan data yang merinci objek sehari-hari di lingkungan alam dan secara akurat memberi anotasi pada nama dan lokasi spasialnya.

Merindukan sebuah: Anda menamai kumpulan data tersebut MSCOCO. Saya sangat menyukai "Coco", dan nama Inggrisnya juga Coco.

Sersan：Ya, kita semua menyukai nama "COCO", menyenangkan dan mudah diingat.

Merindukan sebuah:Setelah munculnya kumpulan data MSCOCO, perkembangan bidang computer vision seperti menaiki roket.

Sersan：Ya, kami telah mengorganisir lebih banyak komunitas pengetahuan di sekitarnya, dan COCO telah digunakan oleh jutaan orang.Kami memulai dari hal kecil dan akhirnya mengembangkan bidang penelitian yang mempunyai dampak besar.

Konferensi visi komputer pertama yang saya hadiri adalah CVPR 1994, juga di Seattle. Itu terjadi tiga puluh tahun yang lalu, dan ada sekitar 300 orang yang hadir. Kini, di CVPR Seattle pada tahun 2024, terdapat 12.000 orang yang menghadiri konferensi tersebut.

Merindukan sebuah:Sudah 30 tahun berlalu, apa yang mendorong hasrat Anda yang konsisten terhadap penelitian visi komputer dan kecerdasan buatan?

Sersan： Sepanjang yang saya ingat, saya tertarik pada pola dan mengkategorikan sesuatu. Di sekolah menengah saya mengerjakan proyek kelas tentang mengklasifikasikan sekrup, baut, dan pengencang lainnya. Saat kuliah saya mulai tertarik dengan pola audio, khususnya bioakustik, seperti suara burung atau ikan paus.Dari segi gambar, sidik jari dan wajahlah yang menarik perhatian saya.

Saya telah meneliti cara membaca bibir dari video. Semua aspek dari masalah ini membuat saya terpesona: perpaduan audio dan penglihatan, perbedaan antara berbagai speaker, dan tantangan komputasi. Pada awal tahun 1990-an, kamera digital baru saja keluar, namun belum memiliki pemahaman komputasi apa pun. Saat ini, Anda mungkin menganggap remeh bahwa Anda memiliki bingkai pendeteksi wajah di jendela bidik, atau perangkat lunak album foto yang secara cerdas mengatur foto seluruh keluarga Anda, namun hal itu belum ada pada saat itu.

Saya merasa pada saat itu permintaan akan teknologi ini akan sangat besar, dan pada saat yang samaSaya juga menyukai matematika di balik teknologi . Saya menyukai teknologi yang digunakan dalam bidang ini, tetapi saya tidak ingin mengambil jurusan matematika atau fisika. Seperti penggunaan metode matematika yang kompleks untuk memecahkan masalah pengolahan suara, video, dan gambar.

Saya selalu merasa bahwa misi saya di dunia ini adalah melakukan pekerjaan seperti ini.

Merindukan sebuah:Sharing akademik apa yang Anda lakukan di CVPR tahun ini?

Sersan： Tim saya mengirimkan banyak makalah pada konferensi utama CVPR, dan saya juga membagikannya di dua seminar. Salah satu laporannya adalah tentang sejarah penelitian visi komputer, terutama untuk membantu para sarjana muda memahami teknologi visi komputer klasik, yaitu teknologi sebelum pembelajaran mendalam dan transformator. Saya juga memperkenalkan proyek Visipedia, yang dimulai dengan peluncuran versi dataset CUB200 yang diperluas pada tahun 2011. Saat ini, konten penelitian Visipedia telah diperluas hingga puluhan ribu tanaman, hewan, dan jamur, memberikan landasan penelitian penting bagi pengenalan objek di alam.

Laporan lain yang ingin saya fokuskan untuk dibagikan dalam wawancara hari ini adalah terkait narasi, opini publik, dan informasi palsu, terutama dalam konteks perkembangan media sosial.

Merindukan sebuah:Inovasi apa yang dibawa karya Anda ke lapangan?

Serge: Masalah klasik dalam dunia disinformasi dan media sosial adalah pengecekan fakta。 Misalnya, Universitas Kopenhagen mempunyai banyak pekerjaan terkait. Pendekatan umumnya adalah untuk pernyataan tertentu yang perlu diverifikasi, kami menggunakan sistem kecerdasan buatan untuk mencari fakta yang relevan dan memprediksi skor keaslian antara 0 dan 1 berdasarkan fakta tersebut.

Merindukan sebuah:Apa tantangan dari pendekatan ini?

Sersan：Tidak banyak masalah dengan metode ini sendiri, tantangannya datang dari masalah itu sendiri.Tidak semua klaim layak dilakukan pengecekan fakta, dan tidak semua pengecekan fakta memberikan hasil yang benar atau salah. Misalnya, "Panda adalah harta nasional Tiongkok" adalah pernyataan yang dapat digunakan untuk melatih model dan memverifikasi keaslian melalui basis pengetahuan terstruktur dan data dalam jumlah besar. Tidak demikian halnya dengan kalimat "pindah ke California".

Merindukan sebuah:Jadi Anda melihat potensi penelitian dalam pernyataan seperti yang terakhir?

Serge: Pernyataan yang terakhir ini belum dipelajari secara ekstensif, namun merupakan isu yang sama pentingnya. Pernyataan-pernyataan ini mungkin tidak memiliki definisi yang tegas tentang benar/salah, namun menimbulkan banyak diskusi di media sosial. Tantangan ini tidak terjadi di era ketika hanya media berita yang perlu diperiksa faktanya. Namun, di media sosial yang sangat maju saat ini, jenis topik yang memicu diskusi panas, sulit dikarakterisasi secara ilmiah, atau tidak dapat dipalsukan telah menjadi hal yang sangat penting. layak untuk diteliti.

Merindukan sebuah:Bisakah Anda memberi saya sebuah kasus yang berdampak nyata atau bahkan menimbulkan konflik serius?

Sersan： Saya senang Anda menanyakan pertanyaan ini, mari kita berikan contoh yang menarik. Setelah Anda mencuci tangan di toilet umum, Anda memiliki dua pilihan untuk mengeringkannya. Saya tidak yakin metode apa yang umum digunakan di Tiongkok, di Eropa Anda bisa mengeluarkan tisu atau menggunakan pengering udara panas.

Merindukan sebuah:Kedua metode ini juga paling umum di Tiongkok.

Sersan： Produsen pengering dan handuk kertas dapat menghasilkan banyak uang dengan menandatangani kontrak dengan jaringan hotel mana pun, dan seluruh pasar mungkin akan menghasilkan pendapatan miliaran dolar. Namun banyak orang di Eropa kini memiliki pandangan yang sangat kuat mengenai perbedaan antara kedua metode tersebut. Banyak orang mengatakan bahwa salah satu metode ini dapat menyebarkan penyakit, sementara yang lain mengatakan bahwa penggunaan listrik dalam jumlah besar atau pembuatan kertas akan menyebabkan kerusakan lingkungan karena hilangnya pohon. Kebanyakan orang yang menganut pandangan ini bukanlah pakar kesehatan masyarakat atau lingkungan.

Merindukan sebuah:Apakah klaim tersebut benar?

Serge: Kami sebenarnya tidak peduli dengan keaslian pernyataan kami, karena banyak topik di media sosial yang tidak dapat dibuktikan atau dipalsukan secara tegas. Namun topik ini diangkat karena sekelompok kecil orang ingin meyakinkan masyarakat bahwa satu cara lebih baik dari yang lain. Mereka mungkin membuat ratusan ribu konten yang dihasilkan bot. Jika Anda mencari diskusi tentang handuk kertas dan pengering udara di jejaring sosial akhir-akhir ini, Anda akan menemukan jutaan komentar. Studi kami tidak berfokus pada membandingkan secara ketat pro dan kontra dari kedua pendekatan tersebut dan menyajikan hasil pengecekan fakta.Kami lebih mementingkan pendeteksian masalah yang dirancang ini.

3. Kumpulan data “COCO” di media sosial

Hindari membuat keputusan tergesa-gesa.

Nona A: Penelitian Anda telah membuka dimensi lain.Pemeriksaan fakta tradisional berfokus pada kebenaran semantik, sedangkan penelitian Anda berfokus pada kebenaran pernyataan atau klaim.jernihpragmatis——Tujuan dari prediksi tidak terbatas pada benar atau tidaknya prediksi tersebut, namun meluas ke topik diskusi yang dibuat oleh beberapa pengguna atau sejumlah besar robot di jejaring sosial untuk mencapai tujuan tertentu.Tahukah Anda apa maksud penelitian ini?

Sersan： Ya, kami menciptakan sesuatu yang benar-benar baru. Sebagian besar penelitian relevan yang kami ketahui hanya berfokus pada pengecekan fakta. Namun kami mencoba menggunakan teknologi bahasa alami terkait topik untuk mengelompokkan dan mengelompokkan diskusi di media sosial guna membantu individu, bisnis, dan pembuat strategi memahami apa yang terjadi di media sosial.Kami tidak melakukan penilaian nilai terhadap topik dan isi diskusi tersebut, namun hanya menampilkan secara obyektif bentuk pengungkapan setiap isu.

Merindukan sebuah: Untuk mencapai tujuan ini, pertama-tama kita memerlukan kumpulan data. Membangun kumpulan data ini seharusnya menjadi tantangan besar. Saat Anda memelopori penelitian visi komputer, Anda berkembang dari kumpulan data burung kecil menjadi COCO. Bagaimana pendekatan Anda kali ini?

Sersan： Jenis perilaku jejaring sosial ini sering kali dicirikan oleh satu ciri. Mungkin ada jutaan tweet tentang suatu topik, dengan ribuan akun yang berpartisipasi dalam diskusi.Namun melalui analisis, kita mungkin menemukan bahwa ratusan ribu tweet tersebut sebenarnya memposting hal yang sama, dengan narasi yang sangat mirip atau bahkan identik. Namun, perlu diingat bahwa ini tidak berarti diskusi ini benar atau salah. Kami memungkinkan pengguna untuk melihat kelompok dan pengelompokan pernyataan yang berbeda, sehingga memudahkan pemeriksa fakta dan analis jaringan sosial untuk memproses dan memahami konten dalam jumlah besar tanpa harus menghadapi jutaan tweet yang masuk secara tiba-tiba.

Merindukan sebuah:Apakah sistem ini mampu menangani berbagai topik kontroversial di media sosial secara real time?

Sersan：Saya rasa bisa, dan saya harap demikian. Misalkan di Mediterania, dua kapal, Rusia dan Amerika, bertemu. Diskusi dimulai di jejaring sosial dan sebuah narasi pun lahir. Informasi baru muncul setiap beberapa jam, termasuk pernyataan kapten atau rekaman ponsel. Dalam kasus ini, beberapa narasi dan isu mendapat perhatian sementara yang lain mungkin menjadi tidak relevan.

Nona A: Anda berharapwaktu sebenarnyaAmbil masalah？

Sersan：dan informasi lainnya.Untuk membantu diplomat profesional, kami ingin menciptakan apapan dasbor(Dasbor) , memberikan informasi relevan yang komprehensif dan juga menempatkan peristiwa-peristiwa ini dalam konteks dunia.Sistem ini bisaMencegah masyarakat mengambil keputusan secara tergesa-gesa . Saya ingin menekankan bahwa sistem itu sendiri tidak memutuskan pihak mana yang benar, melainkan mengatur informasi secara komprehensif.

Merindukan sebuah:Masalah apa yang perlu diatasi untuk mencapai fungsionalitas yang andal?

Serge: Ada tantangan tradisional dan tantangan baru . Tantangan tradisional mencakup dampak bahasa, budaya, dan bias emosional.

Misalnya, "The Little Mermaid" dan "The Ugly Duckling" keduanya merupakan karya penulis Denmark, namun cerita versi film Disney mereka telah disesuaikan agar sesuai dengan budaya Amerika. Karena dominasi narasi Amerika yang lebih besar dibandingkan narasi Denmark di jejaring sosial, versi asli cerita Andersen hampir tidak dikenal di kalangan pengguna Internet di banyak negara lain.

Dalam proses anotasi data, khususnya anotasi data jaringan sosial, akan dipengaruhi oleh bahasa dan budaya. Contoh lainnya adalah analisis sentimen sudah menjadi bagian penting dalam pengecekan fakta, dan model prediksi sentimen itu sendiri mungkin memiliki banyak bias dan stereotip dalam pelatihannya.Pelatihan model AI adalah proses masuk dan keluarnya sampah. Sulit untuk menyelesaikan masalah yang disebabkan oleh data pelatihan.Dapat dikatakan bahwa pengecekan fakta tanpa keterlibatan manusia adalah tidak ada (tidak dapat diandalkan).

Merindukan sebuah:Apa saja tantangan barunya?

Serge: Konten palsu yang dihasilkan oleh model bahasa adalah tantangan baru yang kami hadapi. Akun media sosial palsu sebelumnya seringkali memiliki pola yang sangat sederhana untuk diikuti. Namun dengan model GPT dan pembuatan gambar, pembuat akun palsu dapat menghasilkan profil palsu yang lebih kompleks dan alami, lalu memalsukan akun media sosial yang terlihat asli. Akun-akun ini tidak mudah ditemukan dengan model identifikasi akun palsu tradisional. Model AI generatif ini juga menghadirkan tantangan serupa pada tugas pengecekan fakta tradisional. Karena itu,AI generatif menciptakan dan mengidentifikasi informasi palsu, yang akan menjadi permainan kucing-kucingan di era ini.

4.AI masa depan

Mereka (OpenAI) mungkin belum mengetahui rencana kami.

Merindukan sebuah:Tampaknya tantangan-tantangan ini tidak dapat diselesaikan hanya melalui model saja, namun dapat meningkat ke dimensi kerja sama antara AI dan manusia.AndaterlihatSelalu temukan masalah baru dalam dimensi baru dan kemudian selesaikan dari sudut pandang sederhana.

Sersan：Ya.Ide baru kami dapat dibandingkan dengan Wikipedia. Orang pernah mengira bahwa simpul Wikipedia yang sama hanya membutuhkan halaman dalam bahasa berbeda dengan semantik yang sama. Kenyataannya bukan hanya bahasanya saja yang berbeda.

Bahasa, budaya, nilai-nilai, tradisi, semua faktor dicampur menjadi satu di halaman berbeda dalam entri yang sama. Energi atom dan bahan bakar fosil, misalnya, dibahas dengan sangat berbeda dalam berbagai bahasa dan di berbagai belahan dunia. Jadi ini mengingatkan kita bahwa sistem AI yang coba kita bangun tidak sepenuhnya otomatis, juga bukan model yang berdiri sendiri. Ini adalah sistem yang melibatkan manusia, yang berarti Anda memerlukan banyak komunitas manusia berbeda di seluruh dunia untuk memberi label dan mengatur data serta memperhitungkan semua bagian yang berbeda.Ini adalah masalah yang besar dan mendalam karena prasangka akan selalu ada.

Merindukan sebuah:Jadi seperti MSCOCO, pengorganisasian data sekomprehensif dan seadil-adilnya merupakan ambisi penelitian ini.

Sersan： Ini adalah proses pengorganisasian semua jenis komunitas yang berbeda. Di berbagai belahan dunia, orang-orang dari berbagai usia mempelajari berbagai jurusan seperti sastra, sejarah, sains, dll, dan setiap bidang memiliki ceritanya masing-masing. Agar penelitian yang saya uraikan berhasil,Kami membutuhkan banyak anotasi yang memahami berbagai topikOleh。 Mereka tidak harus menjadi ahli, namun mereka perlu memiliki pengetahuan tentang konten yang akan diberi tag, seperti energi nuklir, kewirausahaan, atau mata uang kripto, untuk mengetahui kesamaan dalam narasi dan isu. Oleh karena itu, tantangan terbesarnya adalah pengorganisasian komunitas, bukan fasilitas komputasi dan penyimpanan AI dasar.

Merindukan sebuah:Apakah Sam Altman atau Yann Lecun mengomentari pemikiran Anda?

Serge: Mereka mungkin belum mengetahui rencana kita.

Merindukan sebuah:Saya sepertinya menyaksikan tahap pertama dari sebuah inisiatif:Temukan masalah dalam dimensi yang lebih tinggi dan temukan titik masuk paling langsung.

Serge: Jika kita mengembangkan infrastruktur untuk deteksi masalah ini, seperti banyak teknologi lainnya, infrastruktur ini dapat digunakan untuk kebaikan atau keburukan.Oleh karena itu, tidak seperti kebanyakan AI komersial,Kami mencoba mengembangkan sistem manajemen yang terbuka, transparan, dan dapat diaudit . Oleh karena itu, kami akan memiliki basis pengetahuan yang sepenuhnya transparan, dan pengguna dapat melihat riwayat pengeditan data, termasuk kapan data dimasukkan dan anotator mana yang memberi anotasi pada data tersebut.

Merindukan sebuah:Bagaimana cara memastikan keakuratan dan objektivitas data?

Sersan：Jawaban sederhananya adalah,kami tidak dapat menjamin。

Namun hal terbaik yang bisa kita lakukan adalah menciptakan sistem yang menarik puluhan ribu orang yang tertarik pada berbagai bidang diskusi untuk memberi anotasi pada sistem tersebut. Memiliki anotator sebanyak mungkin dapat membantu kami menghadirkan objektivitas statistik. Wikipedia juga memiliki mekanisme yang dirancang untuk transparansi dan akuntabilitas, dan kami akan melakukan hal yang sama.

Merindukan sebuah:Bagaimana dampak penelitian ini terhadap pembuat kebijakan, pendidik, dan ahli teknologi?

Serge: Pikirkan apa yang kita lakukan sebagai pelengkap penalaran logis atau faktual.

Katakanlah sebuah perusahaan ingin meningkatkan keberagaman, kesetaraan, dan inklusi. Jadi dewan direksi mereka mengadakan pertemuan untuk membahas perekrutan lebih banyak perempuan atau minoritas. Diskusi seperti ini biasa terjadi di banyak perusahaan, dan di satu universitas, misalnya, mungkin tidak banyak perempuan yang mempelajari teknik elektro, dan departemen ingin mengambil langkah untuk mengubahnya. Dalam pertemuan-pertemuan tersebut, bisa saja terjadi banyak diskusi yang tidak didukung oleh pengetahuan atau informasi.

Beberapa orang mengungkapkan pendapat yang bias bahwa perempuan tidak pandai matematika. Yang dibutuhkan adalah sebuah sistem yang dapat membantu ketua departemen, CEO, atau guru yang perlu memimpin diskusi ini, dan mereka dapat mengekstrak serangkaian narasi dari sistem untuk menyusun diskusi. Selain itu, setelah sistem mulai bekerja, sistem akan mengindeks dan menguraikan pernyataan ke dalam narasi yang sudah ada sebelumnya. Dengan cara ini, CEO, pengajar, atau fasilitator rapat dapat menghindari percakapan berkualitas rendah atau membingungkan serta memiliki struktur dan sistem klasifikasi yang efektif yang memandu diskusi dan mencegah percakapan yang berlebihan.

Merindukan sebuah:Untuk narasi media sosial dan analisis isu di masa depan, menurut Anda apa arah penelitian yang potensial untuk pengembangan teknologi?

Sersan： Bidang yang berbeda memiliki tantangan uniknya masing-masing. Beberapa di antaranya merupakan masalah klasik seperti pengolahan data dalam jumlah besar dan cara memberi label, cara memitigasi bias, dll. Namun kami juga menghadapi tantangan besar dalam hal visualisasi.

Kami baru saja menyebutkan perbedaan yang dihadapi oleh berbagai bahasa dan budaya. Setiap topik tertentu memiliki banyak perspektif berbeda, dan anotator yang berbeda akan memberikan anotasi berbeda karena biasnya masing-masing. Dari perspektif teori informasi, upaya untuk memampatkan berbagai laporan ini dapat mengakibatkan hilangnya atau rusaknya informasi. Pertanyaan-pertanyaan seperti ini akan muncul sepanjang proyek, dan kami akan sering menjumpainya.

Merindukan: Menurut Anda, perkembangan terkini teknologi visual manakah yang akan memberikan dampak besar di masa depan?

Sersan： Kini semakin banyak peneliti yang mulai memperhatikan data multimodal, memproses beberapa tipe data seperti gambar, teks, dan audio secara bersamaan dalam satu model. Metode ini biasanya menggunakan arsitektur model seperti Transformer untuk memecahkan masalah praktis yang kompleks . Saya yakin tren ini akan terus berlanjut, dan para pendatang baru di bidang kecerdasan buatan di masa depan akan merasa lebih alami untuk menguasai beberapa keterampilan profesional pada saat yang sama dibandingkan mendalami satu bidang saja, seperti pemrosesan bahasa alami atau visi komputer.

Secara pribadi, menurut saya meskipun beberapa orang mengklaim bahwa kecerdasan buatan akan sepenuhnya menggantikan dokter, pernyataan ini berlebihan. Namun saya yakin bahwa di bidang-bidang seperti radiologi, dermatologi, dan histopatologi, sistem yang dibantu AI akan tersebar luas dan bermanfaat bagi semua orang.

Mengenai mobil self-driving, meskipun ada prediksi di masa lalu bahwa kemajuan teknologi penglihatan dan kecerdasan buatan akan memungkinkan adopsi mobil self-driving secara luas, saya rasa hal ini tidak mungkin terjadi. Kecuali jika pemerintah mengambil langkah-langkah untuk membatasi mobil konvensional beroperasi di jalur tertentu atau melarangnya sama sekali, kecil kemungkinan mobil tanpa pengemudi akan menjadi sebuah norma di Amerika Serikat.

Merindukan : Saya suka makalah Anda. Pikiranku serupa.Perkembangan teknologi secara bersamaan membuka dimensi kognitif baru. Metodologi yang paling berharga adalah metodologi yang memiliki titik masuk yang minimalis namun dapat mencerminkan situasi secara keseluruhan.

Sersan：Metodologi apa yang paling Anda minati?

Merindukan sebuah:Berikan contoh kecil.Sepanjang jalur falsifiabilitas, sains akan memulai jalur berulang negasi dari negasi...kembali ke struktur revolusi ilmiah yang kita semua kenal.

*Hang Zhou juga berkontribusi pada artikel ini.

Karena artikel ini melibatkan diskusi akademis, berikut pengenalan singkat penulisnya:

Zhang Yijia, pendiri Jiazi Guangnian, lulus dari Sekolah Ilmu Matematika Universitas Peking pada tahun 2013 dan menerima gelar ganda di bidang ekonomi dari Institut Pembangunan Nasional; ia memenangkan medali emas di Olimpiade Matematika Tiongkok dan terpilih untuk itu tim pelatihan nasional; minat penelitiannya adalah matematika keuangan dan teori permainan, dan ia juga menjabat sebagai Direktur Sekolah Ilmu Matematika, Universitas Peking.
Zhou Hang, penanggung jawab Jiazi Brain, lulus dari Fakultas Ilmu Matematika Universitas Peking pada tahun 2019; arah penelitiannya adalah optimasi renggang dan optimasi non-cembung.

*Referensi

Mencari Struktur dalam Klaim yang Tidak Dapat Dipalsukan.pdf
978-3-319-10602-1_48.pdf "Microsoft COCO: Objek Umum dalam Konteks" Kumpulan data MSCOCO: Makalah Serge yang paling banyak dikutip.
Thomas Samuel Kuhn "Struktur Revolusi Ilmiah"

|MerindukanReview Seri Dialog|

berita

Percakapan Miss A dengan Serge Belongie: Memberi Anda “peluru” yang dapat dipalsukan |

Kenalan

informasi kontak saya