ニュース

Google検索エンジンの全貌が明らかに! 100件近くの文書が流出し、ブロガーたちは数週間をかけてリバースエンジニアリングを行った。

2024-08-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

新しい知恵のレポート

編集者:編集部

【新しい知恵の紹介】5月の文書漏洩を受けて、Googleの検索エンジンは再びひっくり返った。 DeepMind が Vizier システムのメカニズムを説明する論文を発表しただけでなく、ブロガーの Mario Fischer は、このインターネット巨大企業の全体像を復元するために、100 近くの文書の徹底的な調査と分析も行いました。

Googleが発表した論文で、同社のテクノロジーの秘密が再び明らかになり始めた。

DeepMind の上級研究科学者である Xingyou (Richard) Song 氏らが発表した最近の論文では、Google の Vizier サービスの背後にあるアルゴリズムの秘密が説明されています。

Vizier は、何百万回も実行されているブラック ボックス オプティマイザーとして、Google の多くの社内研究やシステムの最適化を支援してきました。同時に、Google Cloud と Vertex も、研究者や開発者がハイパーパラメータ調整やブラック ボックスの最適化を実行できるようにするための Vizier サービスを開始しました。 。

Song 氏は、Axe/BoTorch、HEBO、Optuna、HyperOpt、SkOpt などの他の業界ベースラインと比較して、Vizier は高次元、バッチ クエリ、多目的問題などの多くのユーザー シナリオでより堅牢なパフォーマンスを発揮すると述べました。

論文の公開を機に、Googleのベテラン、ジェフ・ディーン氏もツイートしてVizierシステムを称賛した。

彼が言及した Vizier のオープンソース バージョンは GitHub リポジトリでホストされており、非常に詳細なドキュメントがあり、最近も継続的に保守および更新されています。

ウェアハウスのアドレス: https://github.com/google/vizier

OSS Vizier の分散クライアントサーバー システム

Google Research は、2017 年には Vizier システム全体について論じた記事を公開しましたが、その内容は最新の記事よりもはるかに詳細ではありません。

この技術レポートには、大量の調査作業の結果とユーザーからのフィードバックが含まれており、オープンソースの Vizier アルゴリズムの実装の詳細と設計上の選択について説明するとともに、標準化されたベンチマークでの実験を使用して、さまざまな環境における Vizier の堅牢性と多用途性を実証しています。実用的なモード。

その中には、Vizier システムの反復プロセスから得られた経験や教訓も 1 つずつ表示されており、学術界や産業界にとって非常に参考になる意義があり、注目に値します。

Vizier システムで使用されるベイジアン アルゴリズムのコア コンポーネント

この記事の主な貢献は次のとおりです。

- 現在のバージョンの Vizier のデフォルト アルゴリズムの正式な確認と、その機能、設計上の選択、反復プロセスを通じて学んだ教訓の説明

- オリジナルの C++ 実装に基づいたオープンソースの Python および JAX フレームワーク実装を提供します

- 一般的な業界ベンチマークを使用してテストされ、高次元、分類、バッチ、および多目的最適化モードにおける Vizier の堅牢性が実証されています

- 0 次進化的獲得オプティマイザーの型破りな設計選択に関するアブレーション実験が実行され、主要な利点が実証され、議論されます。

この論文の著者リストの上位 2 人は 2 人のリチャードです —

Xingyou (Richard) Song は、OpenAI で強化学習一般化の研究者として働いており、2019 年に上級研究員として Google Brain に入社し、2023 年から DeepMind の上級研究員として GenAI に取り組んでいます。

Qiuyi (Richard) Zhang は現在、DeepMind Vizier チームに所属しており、Vizier のオープンソース バージョンの共同作成者でもあります。また、彼の研究は主にハイパーパラメータの最適化、ベイジアン キャリブレーション、および理論的な機械学習の方向に焦点を当てています。 AI の調整には、反事実/公平性 セックスやその他の側面も関係します。

Zhang は、2014 年にプリンストン大学で学士号を首席で取得し、その後カリフォルニア大学バークレー校で応用数学とコンピューター サイエンスの博士号を取得しました。

検索エンジンの仕組みは下から始まる

業界の絶対的巨人である Google の未公開の中核技術の多くは、長い間、検索エンジンなど外部の世界の好奇心を掻き立ててきました。

10 年以上にわたり 90% 以上の市場シェアを誇る Google 検索は、おそらくインターネット全体で最も影響力のあるシステムとなり、Web サイトとオンライン コンテンツのプレゼンテーションの死活を決定します。

しかし、Google がウェブサイトをどのようにランク付けするかという具体的な詳細は常に「ブラックボックス」でした。

Vizier のような製品とは異なり、検索エンジンは Google の資産コードであり、ハウスキーピング テクノロジーでもあるため、公式文書で公開することは不可能です。

一部のメディア、研究者、検索エンジンの最適化に携わる人々はさまざまな推測をしていますが、それらは象の正体を解明しようとしている盲目の人々にすぎません。

長期化しているグーグルの独占禁止法訴訟は最近、米国のあらゆるレベルの検察当局が約500万ページの文書を収集し、公開証拠とした。

しかし、Google の内部文書の漏洩や独占禁止法公聴会での公開資料などからは、ランキングがどのように機能するのか正確にはわかりません。

また、機械学習の利用により、オーガニック検索結果の構造は非常に複雑になっており、ランキングアルゴリズムの開発に携わったGoogle社員もこう語っています。彼らは、特定の結果が 1 位または 2 位にランクされる理由を説明するための多くの信号の重みの相互作用を完全には理解していません。

5 月 27 日、匿名の情報源 (後に検索エンジン最適化業界のベテラン実践者 Erfan Azimi であることが判明) が 2,500 ページにわたる Google Search API リーク文書を SparkToro CEO の Rand Fishkin に提供し、Google 検索エンジンの内部情報の詳細が明らかになりました。ランキングアルゴリズム。

しかし、それだけではありません。

検索エンジン業界のレポートを専門とするニュース Web サイトである Search Engine Land は、最近、Google のオンライン検索ランキングの中核となる技術原則を初めて明らかにするために、漏洩した数千件の Google 法廷文書をリバースエンジニアリングしたブログを公開しました。

このブログ投稿は、元の著者が数週間の作業で 100 近くのドキュメントを何度もレビュー、分析、構造化、破棄、再編成した後に生まれました。必ずしも厳密に正確または包括的ではありませんが、Google についての理解であると言えます。他の検索エンジンにはない包括的かつ詳細な情報。

著者のフローセービングバージョンの構成図は次のとおりです。

Google 検索エンジンが大規模かつ複雑なプロジェクトであることは疑いの余地がありません。クローラー システム、リポジトリ Alexandria、大まかなランキングの Mustang から、ページの最終的なレンダリングを担当するフィルタリングおよび詳細なランキング システムの Superroot および GWS に至るまで、これらは Web サイト ページの最終的なプレゼンテーションと露出に影響します。

新しいファイル: Googlebot のアクセスを待機しています

新しい Web サイトが公開されても、すぐには Google によってインデックスに登録されません。Google はどのようにして Web ページの情報を収集し、更新しますか?

最初のステップはクロールとデータ収集です。Google はまず Web サイトの URL の存在を知る必要があります。サイト マップを更新するか URL リンクを配置すると、Google は新しい Web サイトをクロールできるようになります。

さらに、頻繁にアクセスするページへのリンクは、より早く Google の注目を集めることができます。

クローラー システムは、新しいコンテンツをクロールし、Web サイトの更新をチェックするために URL が再アクセスされたときに記録します。これは、スケジューラーと呼ばれるコンポーネントによって管理されます。

次に、ストレージ サーバーは、URL を転送するかサンドボックスに置くかを決定します。

Googleはこれまでサンドボックスの存在を否定してきたが、最近のリークによると、(疑いのある)スパムWebサイトや価値の低いWebサイトもサンドボックスに配置されており、おそらくコンテンツとトレーニングアルゴリズムのさらなる分析のために、Googleは一部のスパムWebサイトを転送するようだ。

画像リンクは、後続の検索呼び出しのために ImageBot に転送されますが、場合によっては遅延が発生します。ImageBot には、同一または類似の画像を画像コンテナに配置する並べ替え機能があります。

クローラー システムは、独自の PageRank を使用して情報のクロール頻度を調整しているようです。Web サイトのトラフィックが多い場合、このクロール頻度は増加します (ClientTrafficFraction)。

アレクサンドリア: Google インデックス システム

Alexandria と呼ばれる Google のインデックス システムは、各 Web ページのコンテンツに一意の DocID を割り当てます。コンテンツが重複した場合、新しい ID は作成されませんが、URL は既存の DocID にリンクされます。

Google は URL とドキュメントを明確に区別しています。ドキュメントは、異なる言語バージョンを含む同様のコンテンツを含む複数の URL で構成され、それらはすべて同じ DocID によって呼び出されます。

異なるドメイン名からの重複コンテンツが見つかった場合、Google は検索ランキングに正規バージョンを表示することを選択します。これは、他の URL が同様にランク付けされる場合がある理由も説明します。さらに、URL のいわゆる「正規」バージョンは 1 回限りの契約ではなく、時間の経過とともに変更されます。

アレクサンドリア コレクションのドキュメント URL

オンライン上には作成者のドキュメントのバージョンが 1 つだけあるため、システムによって独自の DocID が与えられます。

DocID を使用すると、文書の各部分がキーワードで検索され、検索インデックスに要約されます。 「ヒット リスト」は、各ページで複数回出現するキーワードをまとめたもので、最初に直接インデックスに送信されます。

作成者の Web ページを例に挙げると、「pencil」という単語が何度も登場するため、DocID は単語インデックスの「pencil」エントリの下にリストされます。

このアルゴリズムは、さまざまなテキストの特徴に基づいて文書内の単語「鉛筆」の IR (情報検索) スコアを計算し、それを DocID に割り当てます。これは、後で投稿リストで使用されます。

たとえば、ドキュメント内の単語「pencil」は太字で表示され、第 1 レベルの見出し (AvrTermWeight に保存されます) に含まれます。このような信号は IR スコアを増加させます。

Google は重要なドキュメントをメイン メモリ システムである HiveMind に移動します。このとき、高速 SSD と従来の HDD (TeraGoogle と呼ばれます) の両方を使用して、すぐにアクセスする必要のない情報を長期保存します。

注目すべきことに、専門家らは、最近の AI ブームの前には、Google が世界の Web サーバーの約半分を支配していたと推定しています。

相互接続されたクラスタの巨大なネットワークにより、何百万ものメイン メモリ ユニットが連携して動作できるようになり、理論的には Google のメイン メモリにネットワーク全体を保存できると、ある Google エンジニアがかつてカンファレンスで指摘しました。

興味深いことに、HiveMind に保存されている重要なドキュメントへのリンクやバックリンクは重みが高いように見えますが、HDD (TeraGoogle) 内の URL リンクは重みが低く、考慮されない可能性もあります。

各 DocID の追加情報とシグナルは、各ドキュメントの最新 20 バージョンを (CrawlerChangerateURLHistory 経由で) 保持するリポジトリである PerDocData に動的に保存され、多くのシステムが関連性を調整するときにアクセスします。

また、Google には、時間の経過とともにさまざまなバージョンを評価する機能があります。ドキュメントの内容やテーマを完全に変更したい場合、理論的には、古いバージョンを完全に上書きするには、20 個の移行バージョンを作成する必要があります。

このため、期限切れのドメイン (かつてはアクティブであったが、破産またはその他の理由で放棄または売却されたドメイン) を復元しても、元のドメインのランキング上の優位性が保持されなくなります。

ドメインの Admin-C とそのサブジェクトのコンテンツが同時に変更された場合、マシンはこれを簡単に識別できます。

この時点で、Google はすべてのシグナルをゼロに設定し、かつてトラフィック価値があった古いドメイン名には何のメリットもなくなります。古いドメイン名を引き継ぐことは、新しいドメイン名を引き継ぐことを意味しません。元のトラフィックとランキングを超えます。

漏洩に加えて、Google に対する米国の司法公聴会や裁判で得られた証拠文書は、内部電子メールも含めて有用な研究源です。

QBST: 誰かが「鉛筆」を検索しています

誰かが Google に検索語「pencil」を入力すると、QBST (クエリベースの顕著な用語) が機能し始めます。

QBST は、ユーザーが入力した検索用語を分析し、その中に含まれる各単語に重要性と関連性に基づいて異なる重みを割り当て、関連する DocID クエリをそれぞれ実行する責任を負います。

語彙の重み付けプロセスは非常に複雑で、RankBrain、DeepRank (旧 BERT)、RankEmbeddedBERT などのシステムが関係します。

QBST は、Google による検索結果のランク付け、つまり Web サイトが獲得できるトラフィックと可視性の量に影響を与えるため、SEO にとって重要です。

QBST は、ユーザーのクエリに一致する最も一般的に使用される用語が含まれている Web サイトをより上位にランク付けします。

QBST の後、「鉛筆」などの関連単語は、さらなる処理のために Ascorer に渡されます。

アスコーラー: 「緑のリング」を作成します。

Ascorer は、転置インデックス (つまり、語彙インデックス) から「pencil」エントリの下の上位 1000 件の DocID を抽出し、IR スコアによってランク付けします。

内部文書によると、このリストは「グリーンリング」と呼ばれている。業界ではこれを投稿リストと呼びます。

「鉛筆」の例では、対応するドキュメントは公開リストで 132 位にランクされています。他のシステムの介入がなければ、これが最終的な位置になります。

スーパールート: 「1000 マイルから 10 マイル」

スーパールートは、Mustang によって選別されたばかりの 1,000 の候補 Web ページを再ランク付けし、1,000 個の DocID の「緑のリング」を 10 個の結果の「青のリング」に減らす責任があります。

このタスクは特に Twiddlers と NavBoost によって実行されます。他のシステムも関与している可能性がありますが、情報が不正確であるため、具体的な詳細は不明です。

Mustang は 1000 件の潜在的な結果を生成しますが、Superroot はそれらを 10 件までフィルタリングします。

Twiddlers: フィルタリングのレイヤー

さまざまな文書によると、Google は何百もの Twiddler システムを使用しています。これは、WordPress プラグインのフィルターに似ていると考えることができます。

各 Twiddler には独自の特定のフィルタリング目標があり、IR スコアやランキングの位置を調整できます。

Twiddler は比較的簡単に作成でき、Ascorer の複雑なランキング アルゴリズムを変更する必要がないため、このように設計されています。

ランキング アルゴリズムの変更は、副作用が伴う可能性があるため非常に困難であり、広範な計画とプログラミングが必要です。対照的に、複数の Twiddler は並行または順次に動作し、他の Twiddler のアクティビティを認識しません。

トゥイドラーは基本的に 2 つのタイプに分類できます。

-PreDoc Twiddlers は追加情報をほとんど必要としないため、数百の DocID のコレクションを処理できます。

-逆に、「Lazy」タイプの Twiddler は、PerDocData データベースからの情報など、より多くの情報を必要とするため、比較的長い時間とより複雑な処理を必要とします。

したがって、PreDocs はまずパブリケーション リストを受信して​​ Web ページのエントリを減らし、次に低速の「Lazy」タイプのフィルターを使用することで、計算能力と時間を大幅に節約します。

100 を超える 2 種類の Twiddler が、潜在的な検索結果の数を減らし、それらを並べ替える役割を果たします。

テスト後、開発者は新しいフィルター、乗算器、または特定の位置制限を試したり、特定の検索結果を別の結果の前後にランク付けしたりすることもできます。

流出した Google の内部文書により、Twiddler の特定の機能は、コア検索チームと協議した専門家のみが使用すべきであることが明らかになりました。

Twidder がどのように機能するかを知っていると思っている場合は、信じてください。実際はわかっていません。理解できるかどうかわかりません

注釈を作成し、それらの注釈を DocID に追加するためだけの Twiddler もあります。

COIVD期間中、あなたの国の保健局が常に新型コロナウイルス感染症に関する検索リストのトップにあるのはなぜですか?

これは、Twiddler が queriesForWhichOfficial を使用して、言語と地域に基づいた公式リソースの正確な配布を容易にするためです。

開発者は Twiddler の再ランキングの結果を制御することはできませんが、そのメカニズムを理解することで、ランキングの変動や「説明のつかないランキング」をよりよく説明できるようになります。

品質評価者と RankLab

世界中には、Google の検索結果を評価し、新しいアルゴリズムやフィルターを公開前にテストする品質評価者が何千人もいます。

Googleは、評価は参考のみであり、順位には直接影響しないとしている。

これは基本的に真実ですが、評価と入札チケットはランキングに間接的に大きな影響を与えます。

評価者は通常、モバイル デバイスで評価を実施し、システムから URL または検索フレーズを受け取り、事前に設定された質問に答えます。

たとえば、「このコンテンツの作成者と創作活動は明確ですか? 作成者はそのトピックに関する専門知識を持っていますか?」と質問されます。

これらの回答は保存され、機械学習アルゴリズムをトレーニングして、高品質で信頼できるページと信頼性の低いページをより適切に識別するために使用されます。

言い換えれば、人間の評価者によって提供される結果がディープラーニング アルゴリズムの重要な基準となり、Google の検索チームが作成したランキング基準はそれほど重要ではありません。

人間の評価者によってどのような Web ページが信頼できるとみなされるかを想像してみてください。

通常、ページには著者の写真、フルネーム、LinkedIn リンクが含まれていれば説得力があるように見えます。逆に、これらの特徴が欠けている Web ページは信頼性が低いと判断されます。

ニューラル ネットワークはこの特徴を重要な要素として識別し、少なくとも 30 日間のアクティブなテストの実行後、モデルはこの特徴をランキング基準として自動的に使用し始める可能性があります。

したがって、著者の写真、フルネーム、および LinkedIn リンクを含むページは、Twiddler メカニズムを通じてランキングが上昇する可能性がありますが、これらの特徴がないページはランキングが低下します。

さらに、Googleが漏洩した情報によると、isAuthor属性とAuthorVectors属性(「作者の指紋識別」と同様)を通じて、システムは作者の固有の単語や表現(つまり個人の言語特性)を識別して区別することができます。

評価者の評価は「情報満足度」(IS) スコアに集約されます。多くの評価者が参加していますが、IS スコアリングは少数の URL にのみ適用されます。

Googleは、クリックされない多くのドキュメントも重要である可能性があると指摘しています。システムが推論できない場合、文書は自動的に評価者に送信され、スコアが生成されます。

「ゴールド」という用語は評価者関連の用語で言及されており、特定の文書には「ゴールド スタンダード」がある可能性があり、人間の評価者の期待を満たすことが文書が「ゴールド」スタンダードに到達するのに役立つ可能性があることを示唆しています。

さらに、1 つ以上の Twiddler システムが、「ゴールド スタンダード」を満たす DocID をトップ 10 に昇格させる可能性があります。

品質審査担当者は通常、Google の正社員ではなく、アウトソーシング会社に所属しています。

対照的に、Google の専門家は RankLab で働いており、実験を実施し、新しい Twiddler を開発し、Twiddler が結果の品質を向上させるのか、それとも単にスパムをフィルタリングするのかを評価および改善しています。

その後、実証済みの効果的な Twiddler が、複雑で相互接続された計算集約型のアルゴリズムを使用して Mustang システムに統合されました。

NavBoost: ユーザーは何を好みますか?

Superroot では、別のコア システムである NavBoost も検索結果のランク付けに重要な役割を果たします。

Navboost は主に、ユーザーの検索結果とのやり取り、特にさまざまなクエリ結果のクリックに関するデータを収集するために使用されます。

Googleはユーザーのクリックデータをランキングに使用することを公式に否定しているが、米連邦取引委員会(FTC)が公開した内部電子メールでは、クリックデータの取り扱い方法は機密にしておく必要があると指示している。

Google は 2 つの理由でこれを否定しています。

まずユーザーの観点から見ると、Google は検索プラットフォームとしてユーザーのオンライン活動を常に監視しているため、プライバシー問題に関してメディアの怒りを買うことになるでしょう。

しかし、Google の観点から見ると、クリック データを使用する目的は、統計的に重要なデータ指標を取得することであり、個々のユーザーを監視することではありません。

FTC文書では、クリックデータがランキングに影響を与えることを確認し、NavBoostシステムについて頻繁に言及しており(2023年4月18日の公聴会では54回)、これは2012年の公式公聴会でも確認されている。

2012 年 8 月以来、当局はクリック データがランキングに影響を与えることを明らかにしてきました。

検索、クリック、繰り返し検索、繰り返しクリックなどの検索結果ページでのさまざまなユーザー行動や、Web サイトや Web ページへのトラフィックはすべてランキングに影響します。

ユーザーのプライバシーに対する懸念は理由の 1 つにすぎません。もう 1 つの懸念は、クリック データとトラフィックを通じて評価することで、スパマーや詐欺師がボット システムを使用してトラフィックを偽装し、ランキングを操作することを奨励する可能性があることです。

Googleは、複数の評価によってユーザーのクリックを悪いクリックと良いクリックに区別するなど、この状況に対抗する方法も備えています。

使用される指標には、対象ページの滞在時間、ページが表示された期間、検索の開始ページ、ユーザーの検索履歴内の最新の「グッド クリック」レコードなどが含まれます。

検索結果ページ (SERP) の各ランキングには、ベースラインとして平均予想クリックスルー率 (CTR) があります。

たとえば、ベルリンで今年開催された CAMPIXX カンファレンスでの Johannes Beus 氏の分析によると、自然検索結果の最初の位置は平均 26.2% のクリックを獲得し、2 番目の位置は 15.5% のクリックを獲得しました。

CTR が予想レートより大幅に低い場合、NavBoost システムはこのギャップを認識し、それに応じて DocID のランキングを調整します。

「expected_CRT」が実際の値から大きく乖離している場合、それに応じてランキングが調整されます

ユーザーのクリックは基本的に、タイトル、説明、ドメイン名などの結果の関連性に関するユーザーの意見を表します。

SEO の専門家やデータ アナリストのレポートによると、クリックスルー率を包括的に監視したところ、次の現象に気づきました。

ドキュメントが検索クエリでトップ 10 に入り、CTR が予想よりも大幅に低い場合、(検索量に応じて) 数日以内にランキングが下がることが観察されます。

逆に、CTR がランキングに比べてはるかに高ければ、通常はランキングも上がります。 CTR が低い場合、Web サイトはより多くのクリックを獲得するために、タイトルとコンテンツの説明を短期間で調整および最適化する必要があります。

PageRank の計算と更新には時間がかかり、計算量が多くかかるため、PageRank_NS メトリクスが使用されます。 NS は「最も近いシード」の略で、関連するページのグループが PageRank 値を共有し、新しいページに一時的または永続的に適用されます。

Googleは最新情報の提供方法に関する公聴会で良い例を示した。たとえば、ユーザーが「Stanley Cup」を検索すると、通常、検索結果には水のグラスが表示されます。

ただし、スタンレー カップ ホッケーの試合が進行中である場合、NavBoost は試合に関するリアルタイム情報を優先するように結果を調整します。

最新の調査結果によると、このドキュメントのクリック指標は 13 か月分のデータをカバーしており、前年との比較を可能にするために 1 か月分の重複が含まれています。

驚くべきことに、Google は実際にはパーソナライズされた検索結果をあまり提供していません。テスト結果は、ユーザーの行動をモデル化して調整する方が、個々のユーザーの個人的な好みを評価するよりも良い結果につながる可能性があることを示しています。

ただし、検索やビデオ コンテンツの設定などの個人的な設定は、パーソナライズされた結果に引き続き含まれます。

GWS: 検索の終わりと始まり

Google Web Server (GWS) は、10 個の「青いリンク」のほか、広告、画像、Google マップのビュー、「People also ask」などの要素を含む検索結果ページ (SERP) のレンダリングを担当します。

FreshnessNode、InstantGlue (約 10 分の遅延ありで 24 時間以内に反応)、InstantNavBoost などのこれらのコンポーネントは、ページが表示される直前にランキングを調整できます。

FreshnessNode は、ユーザーの検索行動の変化をリアルタイムで監視し、これらの変化に基づいてランキングを調整して、検索結果が最新の検索意図と一致していることを確認できます。

InstantNavBoost と InstantGlue は、最新ニュースや話題のトピックに基づいてランキングを調整するなど、検索結果を最終的にレンダリングする前にランキングの最終調整を行います。

したがって、高いランキングを獲得するには、優れたドキュメント コンテンツと正しい SEO 対策を組み合わせる必要があります。

ランキングは、検索動作の変化、追加ドキュメントの存在、リアルタイム情報の更新など、さまざまな要因の影響を受ける可能性があります。したがって、高品質のコンテンツを用意し、優れた SEO を実行することは、動的ランキングの一部にすぎないことを認識することが重要です。

Googleのジョン・ミューラー氏は、ランキングの低下は通常、コンテンツの品質が低いことを意味するわけではなく、ユーザーの行動やその他の要因の変化によって結果のパフォーマンスが変わる可能性があると強調した。

たとえば、ユーザーが短いテキストを好むようになった場合、NavBoost はそれに応じてランキングを自動的に調整します。ただし、Alexandria システムまたは Ascorer の IR スコアは変更されません。

このことから分かることは、SEO はより広い意味で理解される必要があるということです。ドキュメントの内容がユーザーの検索意図と一致しない場合、タイトルや内容を単に最適化するだけでは効果がありません。