berita

CNKI "menuduh" MITA melakukan pelanggaran pencarian AI: segera putuskan tautan website kami

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

(Sumber gambar: unsplash)

Berita Aplikasi Titanium Media pada 16 AgustusStartup AI dalam negeri "Shanghai MiTa Network Technology Co., Ltd." (disebut sebagai "MiTa Technology") mengeluarkan pernyataan yang mengatakan bahwa CNKI baru-baru ini mengeluarkan surat yang memperingatkan startup pencarian AI MiTa Technology karena menyajikan informasi akademis dalam hasil pencarian AI tanpa izin. Judul, daftar isi dan abstrak dokumen merupakan pelanggaran berat, dan surat pemberitahuan pelanggaran sepanjang 28 halaman.

Teknologi Menara Rahasia menekankan,Meski tidak memahami perilaku tersebut, perusahaan menghormati pilihan CNKI. Mulai sekarang, Pencarian AI Menara Rahasia tidak lagi menyertakan data bibliografi dan abstrak dari dokumen CNKI, melainkan akan menyertakan data bibliografi dan abstrak dari basis pengetahuan resmi Tiongkok dan Inggris lainnya.

MiTa Technology dikabarkan didirikan pada tahun 2018. CEO perusahaan tersebut, Min Kerui, sebelumnya adalah kepala ilmuwan Cheetah Mobile dan saat ini menjabat sebagai kepala ilmuwan cerdas di Laboratorium Kecerdasan Buatan Hukum Universitas Peking.

Pada tahun 2018, MiTa berturut-turut meluncurkan produk terjemahan AI legal "MiTa Translation" dan produk koreksi kesalahan dan pengoreksian "MiTa Writing Cat"; untuk online.

Sejak Maret tahun ini, “Mita AI Search” yang dibuat oleh Mita Technology tiba-tiba menjadi populer dan menarik perhatian pasar lebih dari 7 juta kali pada bulan itu. Menurut Same Web, platform pemantauan data akses situs web, jumlah kunjungan ke MiTa Search pada bulan Maret menempati peringkat ketiga di antara kelompok produk AI di Tiongkok, kedua setelah Baidu Wenxin Yiyanhe.sisi gelap bulanKimi;Tingkat pertumbuhan bulan ini mencapai 550%.

Pada bulan Agustus tahun ini, MiTa Technology mengumumkan penyelesaian pembiayaan Seri A senilai lebih dari RMB 100 juta, dipimpin oleh Ant Group, dengan penilaian pasca-uang sebesar US$150 juta (sekitar RMB 1,077 miliar). Pemegang saham lama Secret Tower sebelumnya termasuk Mingshi Capital, Cheetah Mobile, dan Fengyuan Capital.

Dari perspektif produk, dibandingkan dengan mesin pencari tradisional, pencarian AI secara langsung memberikan jawaban atas pertanyaan kepada pengguna dan melampirkan tautan sumber. Situs web resmi pencarian MiTa AI menyediakan tiga mode jawaban: "ringkas", "mendalam" dan "penelitian", dan cakupan pencarian dapat diatur ke "seluruh jaringan", "perpustakaan", "akademik", "podcast" dan sumber lain.

Terkait tindak lanjut surat pemberitahuan tersebut, menurut Southern Metropolis Daily, Wang Yiwei, chief operating officer Mita Technology, menyatakan bahwa CNKI tidak merinci dalam surat pemberitahuan hak apa saja yang dilanggar. Pencarian MiTa AI untuk bagian "akademik" CNKI juga dapat mendatangkan traffic ke CNKI. Beberapa pengguna mengaktifkan akun CNKI mereka melalui pencarian MiTA AI dan membayar CNKI, yang dengan sendirinya merupakan keuntungan bagi CNKI. Mengingat persyaratan CNKI untuk memutuskan sambungan, “kami tidak akan memaksakan persimpangan apa pun.”

Menurut Wang Yiwei, hasil pencarian AI sebelumnya tidak hanya tertaut ke CNKI, namun database resmi berbahasa Mandarin dan Inggris lainnya belum meminta untuk diputuskan.Namun, memutus tautan CNKI tidak akan mempengaruhi pengalaman produk MiTa.

Aplikasi Titanium Media mengetahui bahwa,Tongfang CNKI (Beijing) Technology Co., Ltd., perusahaan induk CNKI, baru-baru ini bekerja sama dengan Huawei untuk menciptakan model yang disebut Model Besar Pengetahuan Tiongkok (Huazhi Big Model), yang dapat mendukung layanan pengetahuan, penelitian ilmiah, pembelajaran inkuiri, produksi dan operasi, diagnosis dan pengobatan tambahan, Skenario di bidang seperti keadilan cerdas.

Zhang Hongwei, manajer umum Tongfang CNKI, mengungkapkan pada bulan Juli tahun ini bahwa CNKI adalah perusahaan penerbitan digital dan layanan pengetahuan terkemuka di industri dengan pengguna di lebih dari 90 negara di seluruh dunia, termasuk pendidikan, penelitian ilmiah, lembaga pemikir, pemerintah, perusahaan. , dan lembaga penelitian ilmiah. Pengguna CNKI, khususnya lembaga pendidikan dan penelitian dalam negeri, pada dasarnya memiliki pangsa pasar 100%. Saat ini, Tongfang CNKI berafiliasi dengan China National Nuclear Corporation dan merupakan perusahaan milik negara. Organisasi tersebut telah menjalin hubungan kerja sama dengan lebih dari 20.000 organisasi penerbitan di lebih dari 70 negara di seluruh dunia sistem dan mengoperasikan perpustakaan sumber pengetahuan Tiongkok terbesar di dunia.

Zhang Hongwei menunjukkan bahwa berdasarkan model besar Huazhi, perusahaan telah melakukan transformasi mendalam pada seluruh lini produk CNKI, mulai dari pemrosesan dan anotasi hingga penambahan alat ini ke platform layanan untuk berbagai industri. Sejak resmi dibuka untuk umum pada pertengahan Mei tahun ini, jumlah pengguna Huazhi telah berkembang pesat, dan jumlah pengguna individu saat ini telah melampaui 10 juta.

Namun, CNKI telah didenda berkali-kali, dan industri ini meragukan model pengembangannya. Pada tanggal 26 Desember 2022, Administrasi Negara untuk Pengaturan Pasar mengambil keputusan sanksi administratif sesuai dengan undang-undang, memerintahkan CNKI untuk menghentikan kegiatan ilegal, dan mengenakan denda sebesar 5% dari penjualan domestiknya di Tiongkok sebesar 1,752 miliar yuan pada tahun 2021, berjumlah 87,6 juta yuan; pada bulan September 2023, Administrasi Ruang Siber Tiongkok mengambil keputusan mengenai sanksi administratif terkait peninjauan keamanan jaringan pada CNKI sesuai dengan hukum, memerintahkannya untuk menghentikan pemrosesan ilegal informasi pribadi, dan mengenakan denda sebesar RMB 50 juta, mengutip operasi seluler CNKI dan CNKI yang dioperasikannya. Ke-14 aplikasi tersebut dituduh memiliki masalah terkait, termasuk mengumpulkan informasi pribadi yang melanggar prinsip keharusan, mengumpulkan informasi pribadi tanpa persetujuan, tidak mengungkapkan atau secara eksplisit menyatakan aturan pengumpulan dan penggunaan. , tidak menyediakan fungsi pembatalan akun, dan tidak menghapus informasi pribadi pengguna tepat waktu setelah pengguna membatalkan Informasi, dll.

Liu Wenjie, seorang profesor di Institute of Comparative Law di China University of Political Science and Law, berpendapat bahwa abstrak adalah ringkasan terkonsentrasi dari isi sebuah makalah, terutama pemikiran dan ide jika layanan pencarian disediakan untuk pengguna Internet dan merayapi data publik di Internet untuk menyediakan abstrak makalah, hal ini harus dianggap sebagai penggunaan wajar menurut undang-undang hak cipta, umumnya bukan merupakan pelanggaran hak cipta.

Baru-baru ini, Elizabeth Gibney, editor jurnal Nature yang terkenal secara internasional, menerbitkan sebuah artikel yang menyatakan bahwa semakin banyak penerbit akademis yang melisensikan makalah penelitian kepada perusahaan teknologi untuk melatih Model AI. Salah satu penerbit akademis menghasilkan $23 juta dari ini, sedangkan penulis tidak mendapat penghasilan sama sekali. Transaksi-transaksi ini, dalam banyak kasus tanpa berkonsultasi dengan penulisnya, telah memicu ketidakpuasan yang kuat di antara beberapa peneliti.

“Jika makalah Anda belum digunakan sebagai data pelatihan AI, kemungkinan besar makalah tersebut akan segera menjadi bagian dari pelatihan.” Elizabeth Jipney menunjukkan dalam artikel tersebut bahwa saat ini penulis makalah akademis hampir tidak punya pilihan ketika menghadapi penerbit yang menjual karya berhak cipta mereka. gangguan. Untuk artikel yang dipublikasikan secara publik, tidak ada mekanisme untuk mengonfirmasi apakah konten tersebut digunakan sebagai data pelatihan AI. Dalam penggunaan model bahasa yang luas, bagaimana membangun mekanisme yang lebih adil untuk melindungi hak dan kepentingan pencipta layak untuk didiskusikan secara luas di kalangan akademisi dan hak cipta.

Model bahasa besar (Magister Hukum) biasanya mengandalkan sejumlah besar data yang diambil dari Internet untuk pelatihan. Data ini mencakup miliaran informasi linguistik (disebut "tokens"), dan dengan menganalisis pola di antara token-token ini, model tersebut mampu menghasilkan teks yang lancar. Karena kontennya yang kaya dan kepadatan informasi yang tinggi, makalah akademis lebih berharga daripada data biasa dalam jumlah besar dan merupakan sumber data penting dalam pelatihan AI. Analis data Mozilla Foundation Stefan Baack menganalisis bahwa makalah ilmiah sangat membantu untuk pelatihan model bahasa besar, terutama dalam hal kemampuan penalaran pada topik ilmiah. Justru karena tingginya nilai data, perusahaan teknologi besar menghabiskan banyak uang untuk membeli kumpulan data.

You Yunting, mitra senior dan pengacara di Firma Hukum Shanghai Dabang, mengatakan bahwa masalah terbesar dengan bagian "akademik" pencarian MiTa AI adalah ia dapat menampilkan konten artikel secara penuh. "PDF makalah disertakan di dalamnya hasil penelitiannya. Meskipun tidak dapat diunduh, pengguna dapat menemukannya di halaman hasil." Anda dapat melihat teks lengkap artikel ini dengan mengklik tautan PDF, yang melanggar hak artikel untuk menyebarkan informasi secara online. "Tetapi jika AI menyerap esensi artikel dan menyampaikannya kepada pengguna dengan caranya sendiri, menurut Undang-Undang Hak Cipta, ini menetapkan bahwa kutipan yang wajar dari sebagian karya untuk menjelaskan masalah tertentu dianggap penggunaan wajar.

Mengenai penggunaan data kertas untuk pelatihan model besar, You Yunting mengatakan bahwa perilaku ini tidak melanggar Infrastruktur Pengetahuan Nasional Tiongkok. Menurut UU Hak Cipta, proses pelatihan adalah penyalinan dan pembelajaran. Penyalinan adalah penyalinan artikel dari Internet ke server untuk pelatihan. Saat ini belum ada penilaian hukum yang jelas untuk menentukan apakah pembelajaran merupakan pelanggaran. Namun baik itu hak perbanyakan, hak pengkajian, maupun hak lain yang berkaitan dengan hak cipta, CNKI bukanlah pemegang hak atas karya tersebut.

Zhang Hongwei terus terang mengatakan bahwa di era model AI besar, CNKI perlu membangun ekosistem dan kerja sama.

“Jika tidak ada industri hulu, tidak ada industri penerbitan, dan tidak ada pasokan data berkualitas tinggi yang berkelanjutan dari industri data, sebenarnya akan sulit bagi industri kecerdasan buatan kita untuk mempertahankan pembangunan berkualitas tinggi. Untuk mengatasi masalah seperti itu, kami sebenarnya membutuhkan seluruh industri kita untuk menguji kebijaksanaannya. Kita perlu bekerja sama untuk membangun aAIGCEkologi yang baik pada masa ini akan bersama-sama mendorong perkembangan industri ini yang berkualitas tinggi. Kami, CNKI, bersedia bekerja sama dengan semua orang dalam aspek ini untuk mendorong pembangunan industri yang berkelanjutan dan berkualitas tinggi. "kata Zhang Hongwei.