berita

The New York Times dan banyak situs berita top lainnya memblokir perayap web SearchGPT

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Whip Bullsman melaporkan bahwa pada tanggal 3 Agustus, menurut laporan asing, diBuka AISekitar seminggu setelah peluncuran SearchGPT, beberapa penerbit berita terkemuka telah menegaskan bahwa mereka tidak ingin berurusan dengan mesin pencari baru startup tersebut.

The New York Times dan setidaknya 13 situs berita lainnya telah memblokir OAI-SearchBot. Ini adalah perayap web yang mengindeks informasi sehingga OpenAI dapat mengambil dan menampilkan hasil yang relevan kepada pengguna SearchGPT.

Originality.ai melacak konten ini dan menemukan bahwa 14 dari 1.000 penerbit situs web teratas telah memblokir OAI-SearchBot. Publikasi lain dalam daftar termasuk Wired, The New Yorker, Vogue, Vanity Fair, dan GQ.

Ini agak membingungkan, kata Jon Gillham, CEO Originality.ai.

“Saya tidak yakin mengapa penerbit memblokirnya,” katanya kepada Business Insider. "Inilah lalu lintas yang diinginkan dan dibutuhkan penerbit."

Ketika OpenAI merilis SearchGPT minggu lalu, mereka menekankan bahwa OAI-SearchBot tidak akan merayapi jaringan untuk mengumpulkan data guna melatih GPT-5 dan model AI lainnya. Disarankan agar pemilik situs web mengizinkan bot baru untuk memastikan situs web Anda muncul di hasil pencarian.

Tanpa kewenangan untuk meng-crawl setiap website, layanan SearchGPT OpenAI mungkin tidak akan selengkap mesin pencari Google. BI bertanya kepada Gillham apakah ada penerbit berita besar yang memblokir bot pencarian Google, dan Gillham menjawab bahwa dia tidak tahu ada penerbit berita besar yang memblokir bot pencarian tersebut.

Kurangnya kepercayaan atau kecurigaan tentang lalu lintas pencarian

OpenAI juga memiliki perayap web lain yang disebut GPTbot yang dapat mengumpulkan data online untuk pelatihan model AI. Ratusan situs web telah memblokirnya. Ini lebih masuk akal: Anda menginginkan lalu lintas dari mesin pencari, tetapi Anda tidak ingin memberikan konten Anda untuk melatih model AI yang mungkin bersaing dengan Anda.

Namun, OpenAI telah mengumpulkan data online tanpa izin selama bertahun-tahun. Ketika OpenAI mengatakan bot pencarian barunya tidak akan diam-diam mencuri konten mereka sebagai data pelatihan AI, mungkin penerbit tidak mempercayainya?

"Saya kira begitu," kata Guillam.

Teori lain: Hasil pencarian saat ini tidak selalu mengarahkan pengguna ke situs yang bekerja keras untuk membuat konten asli. Salah satu tujuan mesin pencari AI baru adalah mempertahankan pengguna dengan menampilkan cuplikan kepada mereka. Jika penerbit tidak lagi melihat lalu lintas yang signifikan dari mesin telusur, mengapa mereka mengizinkan perayap web mereka melakukannya?

Keluhan dari New York Times

Gillum juga mencatat bahwa OpenAI tahun ini sibuk membuat kesepakatan dengan penerbit untuk menggunakan arsip konten mereka. (Perusahaan induk Business Insider, Axel Springer, menandatangani salah satu perjanjian.)

Gillum menambahkan: Tampaknya ini merupakan serangkaian langkah yang ingin diambil OpenAI, pertama membangun hubungan dengan penerbit, menandatangani semua perjanjian kerja sama ini, dan kemudian mengumumkan SearchGPT.

Penentang terbesar di antara penerbit adalah The New York Times. Mereka telah menggugat OpenAI dan Microsoft, menuduh kedua perusahaan teknologi tersebut secara ilegal menggunakan karyanya untuk menciptakan produk pesaing.

Charlie Stadtlander, juru bicara The New York Times, mengatakan dalam sebuah pernyataan: "Terlepas dari apakah kami memblokir atau membatasi bot tertentu untuk merayapi konten kami tanpa persetujuan tertulis, The New York Times Tidak ada lisensi untuk menggunakan karya kami untuk generatif tujuan pelatihan pencarian atau kecerdasan buatan.

Dalam keluhannya terhadap OpenAI dan Microsoft, New York Times membahas masalah mesin pencari yang menjadi lebih cerdas secara artifisial dan berpotensi menyedot lalu lintas dari penerbit.

“Terdakwa juga menggunakan indeks pencarian Bing Microsoft, yang mereplikasi dan mengkatalogkan konten online The New York Times, menghasilkan tanggapan yang berisi kutipan kata demi kata dan ringkasan rinci artikel New York Times,” tulis penerbit dalam pengaduan lebih rinci daripada apa yang dikembalikan oleh mesin pencari tradisional. Alat-alat yang digunakan oleh terdakwa menayangkan konten New York Times tanpa izin atau otorisasi dari The New York Times, mengganggu dan membahayakan hubungan The Times dengan pembaca, dan mencabut pendapatan berlangganan, lisensi, iklan, dan afiliasi The New York Times.

OpenAI belum menanggapi permintaan komentar.