ニュース

ニューヨーク タイムズや他の多くのトップ ニュース Web サイトが SearchGPT Web クローラーをブロックしています

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

海外報道によると、ウィップ・ブルズマン氏は8月3日、こう報じた。オープンAISearchGPTの立ち上げから約1週間後、一部のトップニュース出版社は、このスタートアップの新しい検索エンジンとは一切関わりたくないことを明らかにした。

ニューヨーク タイムズと他の少なくとも 13 のニュース Web サイトが OAI-SearchBot をブロックしました。これは、OpenAI が関連する結果を取得して SearchGPT ユーザーに表示できるように、情報にインデックスを付ける Web クローラーです。

Originality.ai がこのコンテンツを追跡したところ、上位 1,000 の Web サイト発行者のうち 14 社が OAI-SearchBot をブロックしていることが判明しました。リストには他の出版物として、Wired、The New Yorker、Vogue、Vanity Fair、GQ などがあります。

それは少し不可解だと、Originality.ai の CEO であるジョン・ギラム氏は言います。

「なぜ出版社がそれをブロックするのか分かりません」と彼はBusiness Insiderに語った。 「これはパブリッシャーが望んでいる、必要としているトラフィックです。」

OpenAIが先週SearchGPTをリリースしたとき、OAI-SearchBotはGPT-5や他のAIモデルをトレーニングするためのデータを収集するためにネットワークをクロールしないことを強調した。 Web サイトの所有者は、Web サイトが検索結果に確実に表示されるように新しいボットを許可することを推奨しています。

すべての Web サイトをクロールする権限がなければ、OpenAI の SearchGPT サービスは Google の検索エンジンほど完全ではない可能性があります。 BIはギラム氏に、大手ニュース出版社がGoogleの検索ボットをブロックしたかどうか尋ねたが、ブロックした企業はないと答えた。

検索トラフィックに対する信頼または疑惑の欠如

OpenAI には、AI モデルのトレーニング用のオンライン データを収集できる GPTbot と呼ばれる別の Web クローラーもあります。何百ものウェブサイトがそれをブロックしました。これはより理にかなっています。検索エンジンからのトラフィックは必要ですが、自分のコンテンツと競合する可能性のある AI モデルをトレーニングするためにコンテンツを提供したくないのです。

しかし、OpenAI は何年もの間、許可なくオンライン データを収集してきました。 OpenAI が、新しい検索ボットはコンテンツを AI トレーニング データとして密かに盗むことはないと述べていますが、おそらくパブリッシャーはそれを信頼していないのではないでしょうか?

「私もそう思います」とギラム氏は言った。

もう 1 つの理論: 今日の検索結果は、オリジナル コンテンツの作成に熱心に取り組んでいるサイトにユーザーを誘導するとは限りません。新しい AI 検索エンジンの目標の 1 つは、スニペットを表示することでユーザーを維持することです。サイト運営者が検索エンジンからの大量のトラフィックを確認できなくなった場合、なぜ Web クローラーにそれを許可するのでしょうか?

ニューヨーク・タイムズからの苦情

ギラム氏はまた、OpenAIが今年、パブリッシャーとコンテンツアーカイブを使用する契約を結ぶのに忙しいと指摘した。 (Business Insider の親会社であるアクセル・シュプリンガーが契約の 1 つに署名しました。)

Gillum 氏は次のように付け加えました。「これは、OpenAI が取ろうとしている一連のステップのようです。最初にパブリッシャーとの関係を構築し、これらすべての協力協定に署名し、次に SearchGPT を発表します。

出版社の中で最大の反対者はニューヨーク・タイムズだ。同社はOpenAIとMicrosoftを告訴し、両テクノロジー企業が自社の作品を違法に利用して競合製品を開発したとして非難した。

ニューヨーク・タイムズ紙の広報担当チャーリー・シュタットレンダー氏は声明で、「特定のボットによるコンテンツのクロールを当社がブロックまたは制限するかどうかに関係なく、ニューヨーク・タイムズ紙は当社の著作物を生成検索や人為的目的で使用するライセンスはない」と述べた。知能訓練の目的。

ニューヨーク・タイムズ紙は、OpenAIとMicrosoftに対する訴状の中で、検索エンジンが人工知能を高め、パブリッシャーからトラフィックを吸い取る可能性があるという問題を取り上げた。

「被告らは、ニューヨーク・タイムズのオンラインコンテンツを複製してカタログ化するマイクロソフトのBing検索インデックスも使用しており、ニューヨーク・タイムズの記事の逐語的な抜粋と詳細な要約を含む回答を生成している」と同出版社は訴状の中で書いている。従来の検索エンジンが返すものよりも詳細な情報が得られます。被告のツールは、ニューヨーク・タイムズからの許可や認可なしにニューヨーク・タイムズのコンテンツを提供し、ニューヨーク・タイムズと読者との関係を混乱させ、損害を与え、ニューヨーク・タイムズから購読、ライセンス、広告、およびアフィリエイト収入を奪います。

OpenAIはコメント要請にまだ応じていない。