Новости

The New York Times и многие другие ведущие новостные сайты блокируют веб-сканеры SearchGPT.

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Whip Bullsman сообщил, что 3 августа, по зарубежным данным, вOpenAIПримерно через неделю после запуска SearchGPT некоторые ведущие издатели новостей дали понять, что не хотят иметь ничего общего с новой поисковой системой стартапа.

The New York Times и как минимум 13 других новостных сайтов заблокировали OAI-SearchBot. Это веб-сканер, который индексирует информацию, чтобы OpenAI мог извлекать и отображать релевантные результаты для пользователей SearchGPT.

Originality.ai отследил этот контент и обнаружил, что 14 из 1000 крупнейших издателей веб-сайтов заблокировали OAI-SearchBot. Другие издания в списке включают Wired, The New Yorker, Vogue, Vanity Fair и GQ.

«Это немного озадачивает», — сказал Джон Гиллхэм, генеральный директор Originality.ai.

«Я не уверен, почему издатели заблокировали это», — сказал он Business Insider. «Это тот трафик, который издатели хотят и в котором нуждаются».

Когда OpenAI выпустила SearchGPT на прошлой неделе, она подчеркнула, что OAI-SearchBot не будет сканировать сеть для сбора данных для обучения GPT-5 и других моделей искусственного интеллекта. Он рекомендует владельцам веб-сайтов разрешить новым ботам обеспечивать появление вашего веб-сайта в результатах поиска.

Без полномочий на сканирование каждого веб-сайта служба OpenAI SearchGPT может быть не такой полной, как поисковая система Google. BI спросила Гиллхэма, блокировали ли какие-либо крупные издатели новостей поисковые боты Google, и он ответил, что не знает ни одного из них.

Отсутствие доверия или подозрений в отношении поискового трафика.

У OpenAI также есть еще один веб-сканер под названием GPTbot, который может собирать онлайн-данные для обучения модели ИИ. Сотни веб-сайтов заблокировали его. Это имеет больше смысла: вам нужен трафик из поисковых систем, но вы не хотите отдавать свой контент для обучения модели ИИ, которая может конкурировать с вашей.

Однако OpenAI уже много лет собирает онлайн-данные без разрешения. Когда OpenAI заявляет, что ее новый поисковый бот не будет тайно красть их контент в качестве данных для обучения ИИ, возможно, издатели просто ему не доверяют?

«Я так думаю», — сказал Гиллем.

Другая теория: сегодняшние результаты поиска не всегда направляют пользователей на сайты, которые усердно работают над созданием оригинального контента. Одна из целей новой поисковой системы с искусственным интеллектом — удержать пользователей, показывая им фрагменты. Если издатели больше не видят значительного трафика из поисковых систем, зачем им позволять это своим веб-сканерам?

Жалоба от New York Times

Гиллум также отметил, что OpenAI в этом году была занята заключением сделок с издателями на использование их архивов контента. (Одно из соглашений подписала материнская компания Business Insider Axel Springer.)

Гиллум добавил: «Похоже, что OpenAI намерена предпринять ряд шагов: сначала построить отношения с издателями, подписать все эти соглашения о сотрудничестве, а затем анонсировать SearchGPT.

Самым большим несогласным среди издателей является The New York Times. Компания подала в суд на OpenAI и Microsoft, обвинив две технологические компании в незаконном использовании ее разработок для создания конкурирующих продуктов.

Чарли Штадтландер, представитель The New York Times, заявил в своем заявлении: «Независимо от того, блокируем ли мы или ограничиваем сканирование нашего контента каким-либо конкретным ботом, The New York Times не будет иметь лицензии на использование нашей работы для генеративного поиска или искусственного поиска». для целей подготовки разведки.

В своей жалобе на OpenAI и Microsoft газета New York Times затронула проблему того, что поисковые системы становятся более искусственными и потенциально отбирают трафик у издателей.

«Обвиняемые также используют поисковый индекс Microsoft Bing, который копирует и каталогизирует онлайн-контент The New York Times, генерируя ответы, содержащие дословные выдержки и подробные изложения статей New York Times», — написал издатель в исковом заявлении. более подробно, чем то, что возвращают традиционные поисковые системы. Инструменты ответчиков обслуживают контент New York Times без разрешения или разрешения The New York Times, нарушают и вредят отношениям The Times с читателями, а также лишают The New York Times подписки, лицензирования, рекламы и партнерских доходов.

OpenAI пока не ответила на запрос о комментариях.