ニュース

Microsoft のオープンソース GraphRAG が爆発的に人気、生成 AI はナレッジ グラフの時代に入ったのか?

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

マシンハートレポート

編集者:パンダW

ナレッジグラフは環境から決して後退しません。

LLM は非常に強力ですが、幻覚の問題、解釈の困難さ、問題の焦点の把握の失敗、プライバシーとセキュリティの問題など、いくつかの明らかな欠点もあります。検索拡張生成 (RAG) は、LLM の生成品質と結果の有用性を大幅に向上させることができます。

今月初めに、Microsoft は最も強力なオープンソース RAG ナレッジ ベース ソリューションである GraphRAG をリリースしました。このプロジェクトはオンラインになった直後に人気が高まり、現在では星の数が 10.5k に達しています。



  • プロジェクトアドレス: https://github.com/microsoft/graphrag
  • 公式ドキュメント: https://microsoft.github.io/graphrag/

通常の RAG よりも強力であると言う人もいます。



GraphRAG は LLM を使用してナレッジ グラフを生成します。これにより、複雑な情報に対するドキュメント分析を実行するとき、特にプライベート データを扱うときの質問と回答のパフォーマンスが大幅に向上します。



GraphRAGと従来のRAGの比較結果

現在、RAG は実世界の情報を使用して LLM 出力を改善する手法であり、一般に、RAG はベースライン RAG と呼ばれるベクトルの類似性を検索として使用します。ただし、Baseline RAG は状況によっては完全に機能しないことがあります。例えば:

  • ベースライン RAG は点と点を結びつけるのに苦労しています。これは、質問に答えるために共有属性を通じてさまざまな情報を調べて、新しい総合的な洞察を提供する必要がある場合に発生します。
  • ベースライン RAG は、大規模なデータセットまたは単一の大きなドキュメント内で要約された意味概念を包括的に理解するように求められた場合、パフォーマンスが低くなります。

Microsoft が提案する GraphRAG は、LLM を使用して、入力されたテキスト ライブラリに基づいてナレッジ グラフを作成します。このグラフは、コミュニティの概要とグラフ機械学習の出力を組み合わせて、クエリ時のヒントを強化します。 GraphRAG は、両方の種類の質問への回答において大幅な改善を示し、プライベート データセットに対する以前の方法よりも優れたパフォーマンスを示しています。

しかし、GraphRAG についての理解を深めていくと、その原理や内容が非常にわかりにくいことがわかりました。



最近、Neo4j Company の CTO、Philip Rathle が「GraphRAG Manifesto: Adding Knowledge to Generative AI」というタイトルのブログ記事を公開し、GraphRAG の原理と従来の RAG との違いを分かりやすい言葉で詳しく紹介しました。 GraphRAG など。

同氏は、「あなたの次の生成 AI アプリケーションでは、おそらくナレッジ グラフが使用されるでしょう。」と述べました。



Neo4j CTO フィリップ・ラスル

以下の記事をお読みください。

私たちは、生成 AI で本当に意味のあることを行うには、自己回帰 LLM に頼って意思決定を行うだけではいけないということに気づき始めています。

「RAG を使用するか、微調整するか、GPT-5 を待つか」という考えはわかります。

はい。ベクトルベースの検索拡張生成 (RAG) や微調整などの技術が役に立ちます。そして、特定のユースケースを十分に解決します。しかし、これらすべてのテクノロジーを停止させるユースケースが 1 つあります。

多くの問題では、ベクトルベースの RAG (および微調整) の解決策は、基本的に正解の確率を高めることです。しかし、どちらの手法も、正しい答えについてある程度の確実性を提供するものではありません。多くの場合、背景が欠如しており、すでに知っているものと結び付けることが困難になります。さらに、これらのツールは、特定の決定が行われた理由についての手掛かりを提供しません。

2012 年に目を戻しましょう。このとき、Google は第 2 世代の検索エンジンを発表し、象徴的なブログ投稿「ナレッジ グラフの紹介: 文字列ではなく物」を公開しました。彼らは、さまざまな文字列処理を実行することに加えて、Web ページ内で文字列として表現されるすべてのものをナレッジ グラフを使用して整理すれば、検索が大幅に向上する可能性があることを発見しました。

現在、同様のパターンが生成 AI の分野でも現れています。多くの生成 AI プロジェクトは、ソリューションが物ではなく文字列を扱うという事実によって結果の品質が制限されるという壁にぶつかります。

今日、最先端の AI エンジニアと学術研究者は、Google がかつて発見したものを再発見しました。このボトルネックを打破する秘密はナレッジ グラフです。つまり、統計学をベースにしたテキスト技術に、物事に関する知識を導入するということです。動作方法は他の RAG と似ていますが、ベクトル インデックス付けに加えてナレッジ グラフも呼び出す点が異なります。つまり、GraphRAG! (GraphRAG = ナレッジグラフ + RAG)

この記事の目的は、GraphRAG について包括的かつわかりやすく紹介することです。調査によると、データをナレッジ グラフに構築し、RAG を通じて使用すると、いくつかの強力な利点がもたらされます。 GraphRAG は、通常のベクトルだけを使用する RAG よりも、LLM に対する質問のほとんどまたはすべてにうまく答えることができることを証明する多くの研究があります。

この利点だけでも、GraphRAG の導入を大きく促進するには十分です。

しかし、それだけではありません。アプリの構築時にデータが表示されるため、開発も簡単になります。

GraphRAG の 3 番目の利点は、人間と機械の両方がグラフをよく理解し、グラフに基づいて推論を実行できることです。その結果、GraphRAG を使用したアプリケーションの構築はより簡単になり、より良い結果が得られると同時に、解釈と監査も容易になります (多くの業界にとって重要です)。

ほとんどのユースケースでは、GraphRAG がベクトルのみの RAG をデフォルトの RAG アーキテクチャとして置き換えると考えています。この記事ではその理由を説明します。

地図とは何ですか?

まず、グラフとは何かを明確にする必要があります。

グラフとも呼ばれるグラフは「グラフ」と訳されることが多いですが、そのため画像や絵などの概念と混同されやすいです。区別しやすくするために、この記事では「图图」という翻訳方法のみを使用します。

グラフはおそらく次のようになります。



地図の例

この図はナレッジ グラフの例としてよく使用されますが、その出典と作成者は現在不明です。

またはこれ:



「ゲーム・オブ・スローンズ」の登場人物関係図、ウィリアム・ライアンより

またはこれ:



ロンドンの地下鉄の地図。興味深い事実: ロンドン交通局は最近、インシデント対応機能を向上させ、混雑を軽減するために、グラフベースのデジタル ツイン アプリケーションを導入しました。

言い換えれば、地図は図ではありません。

ここでは、マップとは何かをすでに理解していることを前提として、定義の問題にはあまり立ち入りません。

上記の図を理解していれば、基になるナレッジ グラフ データ (グラフ データベースに保存されている) をどのようにクエリして、RAG ワークフローの一部として使用できるかがわかるでしょう。それがGraphRAGです。

知識を提示する 2 つの形式: ベクトルとグラフ

一般的な RAG の中核はベクトル検索です。これは、入力テキスト ブロックに基づいて、文書の候補から概念的に類似したテキストを見つけて返します。この種の自動化はうまく機能し、基本的な検索でも便利です。

しかし、検索を実行するたびに、ベクトルとは何か、類似度の計算がどのように実装されるかについて考えたことはないかもしれません。次にアップルを見てみましょう。人間の視点、ベクトルの視点、グラフの視点からさまざまな形式を示します。



人間の視点、ベクトルの視点、地図の視点から見た Apple

人間にとってリンゴの表現は複雑かつ多次元であり、その特徴を紙の上で完全に説明することはできません。ここで私たちは、この赤い写真が知覚的かつ概念的にリンゴを表しているのではないかと詩的に想像することができます。

このリンゴのベクトル表現は配列です。ベクトルの魔法は、それぞれが対応するテキストの本質をエンコードされた形式で取り込むことです。しかし、RAG のコンテキストでは、ベクトルが必要になるのは、あるテキストが別のテキストにどの程度類似しているかを判断する必要がある場合だけです。これを行うには、類似度の計算を実行して一致を確認するだけです。しかし、ベクトル内の意味を理解し、テキストで表現されている内容を理解し、より大きなコンテキストとの関係を洞察したい場合は、ベクトル表現を使用してもうまくいきません。

対照的に、ナレッジ グラフは世界を宣言的な形式、つまり AI 分野の用語で言えば象徴的に表現します。したがって、人間と機械の両方がナレッジ グラフを理解し、それに基づいて推論を実行できます。これは重要なので、後で説明します。

さらに、ナレッジ グラフのクエリ、視覚化、注釈付け、変更、拡張を行うことができます。ナレッジ グラフは、現在の作業分野の世界を表すことができる世界モデルです。

GraphRAG と RAG

両者は競争関係にない。 RAG の場合、ベクトル クエリとグラフ クエリの両方が役立ちます。 LlamaIndex の創設者である Jerry Liu は次のように指摘しています: GraphRAG について考えるとき、ベクトルを含めると役立ちます。これは、テキスト埋め込み間の類似性に完全に基づいた「ベクターのみの RAG」とは異なります。

基本的に、GraphRAG は RAG の一種ですが、検索パスにナレッジ グラフが含まれる点が異なります。以下でわかるように、GraphRAG のコア スキーマは非常にシンプルです。そのアーキテクチャはベクトルを使用する RAG と同じですが、ナレッジ グラフ レイヤーが含まれています。

GraphRAGモード

GraphRAG の一般的なパターン



ご覧のとおり、上の図ではグラフ クエリがトリガーされました。オプションでベクトル類似性コンポーネントを含めることができます。グラフとベクトルを 2 つの異なるデータベースに保存するか、ベクトル検索をサポートする Neo4j などのグラフ データベースを使用するかを選択できます。

GraphRAG を使用する一般的なパターンを以下に示します。

1. ベクトル検索またはキーワード検索を実行して、初期ノードのセットを見つけます。

2. グラフを走査し、関連するノードに関する情報を戻します。

3. (オプション) PageRank などのグラフベースのランキング アルゴリズムを使用してドキュメントを再ランク付けします

ユースケースが異なれば、使用パターンも異なります。今日の AI 分野のすべての研究方向と同様、GraphRAG も研究が豊富な分野であり、毎週新しい発見が生まれています。

GraphRAG ライフサイクル

GraphRAG を使用した生成 AI も、他の RAG アプリケーションのパターンに従います。最初に「グラフの作成」ステップがあります。



GraphRAG ライフサイクル

グラフの作成は、ドキュメントをチャンク化してベクトル データベースにロードすることに似ています。ツールの進歩により、マップの作成は非常に簡単になりました。良いニュースを 3 つ紹介します。

1. マップは非常に反復的です。「実行可能な最小限のマップ」から始めて、それに基づいて拡張できます。

2. データをナレッジ グラフに追加すると、簡単に進化させることができます。さらに多くの種類のデータを追加して、データ ネットワーク効果を獲得し、活用することができます。データの品質を向上させてアプリケーションの価値を高めることもできます。

3. この分野は急速に進化しています。つまり、ツールがより洗練されるにつれて、マップの作成はますます簡単になります。

前の図にマップ作成手順を追加すると、次のようなワークフローになります。



マップ作成手順を追加する

GraphRAGがどのようなメリットをもたらすかを見てみましょう。

GraphRAG を使用する理由

ベクターのみの RAG と比較した場合、GraphRAG の利点は主に 3 つのカテゴリに分類されます。

1. より高い精度とより完全な回答 (実行時/運用上の利点)

2. ナレッジ グラフが作成されると、RAG アプリケーションの構築と保守が容易になります (開発時間の利点)

3. 説明可能性、追跡可能性、アクセス制御の向上 (ガバナンスの利点)

ここでは、これらの利点について詳しく説明します。

1. より正確でより有用な回答

GraphRAG の最初の利点 (そして最もすぐにわかる利点) は、応答の品質が高いことです。学術界でも産業界でも、この観察を裏付ける証拠がたくさんあります。

データ カタログ会社 Data.world のこの例のように。 2023 年末に、GraphRAG が 43 のビジネス質問に対する LLM 応答の精度を平均 3 倍向上させることができることを示す調査レポートを発表しました。このベンチマーク調査は、ナレッジ グラフが応答精度を大幅に向上させることができるという証拠を提供します。



ナレッジ グラフにより、LLM 応答の精度が 54.2 パーセント ポイント向上し、これは約 3 倍になります。

Microsoft はまた、2024 年 2 月の研究ブログ「GraphRAG: Unlocking LLM Discovery onnarrative private data」や関連研究論文「From Local to Global: A Graph RAG Approach to Query-Focused Summarization」などの一連の証拠も提供しました。 https://github.com/microsoft/graphrag (上記の冒頭で説明した GraphRAG)。

その中で、ベクターを使用したベースライン RAG には次の 2 つの問題があることが観察されました。

  • ベースライン RAG では、点と点を結び付けることが困難になります。異なる情報を合成して新しい洞察を得るには、共有属性を介して異なる情報フラグメントを横断する必要があります。現時点では、ベースライン RAG が異なる情報フラグメントを接続することは困難です。
  • ベースライン RAG は、大規模なデータ コレクションや単一の大きなドキュメントにわたって帰納的に要約された意味概念を包括的に理解するように求められた場合、パフォーマンスが低下します。

Microsoft は次のことを発見しました。「LLM によって生成されたナレッジ グラフを使用することで、GraphRAG は RAG の「検索」部分を大幅に改善し、コンテキスト ウィンドウにより関連性の高いコンテンツを入力することで、より適切な回答と証拠ソースを取得できます。 また、他の代替手法と比較して、GraphRAG は必要なトークンが 26% ~ 97% 少ないため、より良い答えが得られるだけでなく、コストが低く、スケーラビリティも優れていることもわかりました。

精度についてもう少し深く掘り下げてみると、答えが正しいことは重要ですが、役立つものである必要もあります。 GraphRAG は、回答をより正確にするだけでなく、回答をより豊富で、より完全で、より有用なものにすることがわかっています。

LinkedIn の最近の論文「顧客サービスの質問応答のためのナレッジ グラフによる検索拡張生成」は、顧客サービス アプリケーションに対する GraphRAG の影響を示す優れた例です。 GraphRAG は、カスタマー サービスの回答の精度と内容を向上させ、回答をより有用なものにし、カスタマー サービス チームが各問題を解決するのにかかる時間の中央値を 28.6% 短縮しました。

Neo4j の Generative AI ワークショップにも同様の例があります。以下に示すように、これは一連の SEC 申請に対して「vector + GraphRAG」および「vector のみ」の方法で得られた回答です。



「ベクターのみ」メソッドと「ベクター + GraphRAG」メソッドの比較

「リチウム不足の影響を受ける可能性のある企業の特徴を説明する」と「影響を受ける可能性のある特定の企業を列挙する」の違いに注意してください。あなたが市場の変化に対応してポートフォリオのリバランスを検討している投資家、または自然災害に対応してサプライチェーンの再調整を検討している企業の場合、上記のグラフの右側にある情報の方が確実に重要です。左に。ここでは、どちらの答えも正確です。しかし、右側の答えの方が明らかに便利です。

Jesus Barrasa の Going Meta エピソード 23 では、別の素晴らしい例が紹介されています。法的文書を扱うためのワード マップから始めます。

また、学界や産業界からの新しい例も時々見かけます。たとえば、Lettria の Charles Borderie は、「ベクターのみ」と「ベクター + GraphRAG」メソッドの比較例を示しました。GraphRAG は、LLM ベースのテキストからグラフへのワークフローに依存して、10,000 の金融記事をナレッジ グラフに編成します。



サーチャーのみのメソッドとグラフサーチャーのメソッド

通常の RAG を使用する場合と比較して、GraphRAG を使用すると、回答の品質が向上するだけでなく、回答内のトークンの数が 3 分の 1 に削減されることがわかります。

Writer の別の例を見てみましょう。彼らは最近、RobustQA フレームワークに基づく RAG ベンチマーク レポートを公開し、GraphRAG ベースの手法を他の同様のツールと比較しました。 GraphRAG によって得られたスコアは 86% であり、他の方法 (33% ~ 76% の範囲) よりも大幅に優れており、レイテンシ パフォーマンスも同等以上です。



RAG法の精度と応答時​​間の評価結果

GraphRAG は、さまざまな生成 AI アプリケーションを支援しています。ナレッジ グラフは、生成 AI の結果をより正確で有用なものにする道を開きます。

2. データ理解の向上と反復の高速化

ナレッジ グラフは概念的にも視覚的にも直感的です。ナレッジ グラフを探索すると、多くの場合、新しい洞察が得られます。

多くのナレッジ グラフ ユーザーがこの予期せぬ結果を共有しています。独自のナレッジ グラフを完成させることに投資すると、予想外の方法で独自の生成 AI アプリケーションを構築およびデバッグするのに役立ちます。その理由の 1 つは、データをグラフの形式で見ることができれば、これらのアプリケーションの基礎となるデータが鮮明なデータ像を示していることがわかるためです。

グラフを使用すると、答えを追跡し、データを見つけ、途中で因果関係の連鎖を追跡できます。

リチウム不足に関する上記の例を見てみましょう。そのベクトルを視覚化すると、下の画像のようなものが得られますが、行と列が増えています。



ベクトルの可視化

データをグラフに変換すると、ベクトル表現では理解できない方法でデータを理解することができます。

以下は、最近の LlamaIndex ウェビナーの例で、「MENTIONS」リレーションシップを使用してベクトル化された単語のチャンク (語彙グラフ) を抽出し、LLM を使用してエンティティのグラフ (ドメイン グラフ) を抽出し、2 つのアビリティを接続する方法を示しています。



ボキャブラリーマップとドメインマップの抽出

(Langchain、Haystack、SpringAI などのツールを使用した例も多数あります。)

この図でデータの豊富な構造を確認し、それによって可能になる新しい開発とデバッグの可能性を想像することができます。各データには独自の値があり、その構造自体が、アプリケーションをよりインテリジェントにするために使用できる追加の意味を保存および伝達します。

単なる視覚化ではありません。これは、データ構造が意味を伝え、保存できるようにすることでもあります。以下は、RAG ワークフローにナレッジ グラフを導入してからわずか 1 週間後の、有名なフィンテック企業の開発者の反応です。



GraphRAG に対する開発者の反応

この開発者の反応は、答えが正しいかどうかを検証する (ただし信頼しない) という「テスト駆動開発」仮説と非常に一致しています。個人的に、意思決定が完全に不透明な AI に私の自律性を 100% 与えるように求められたら、私はぞっとするでしょう。より具体的には、たとえあなたが AI 終末論を信じていなくても、「Apple, Inc.」に関連する単語や文書を「Apple Corps」(この 2 つはまったく異なるものです)会社にマッピングできない場合は、次のことに同意するでしょう。確かに大きな価値があるでしょう。 AI の生成的な意思決定を推進するのは最終的にはデータであるため、データの正確性を評価して保証することが最も重要であることは間違いありません。

3. ガバナンス: 説明可能性、セキュリティなど

生成的 AI の決定の影響が大きくなるほど、その決定が間違った場合に最終的に責任を負う人々を説得する必要があります。これには通常、すべての決定の監査が含まれます。そのためには、信頼性が高く、再現可能な適切な決定の記録が必要です。しかし、これだけでは十分ではありません。決定を採用または放棄するときは、その背後にある理由も説明する必要があります。

LLM 自体はこれをうまく機能しません。はい、この決定に至るために使用されたドキュメントを参照できます。しかし、これらの文書は、LLM が情報源を作成したことは言うまでもなく、決定そのものを説明していません。ナレッジ グラフはまったく別のレベルにあり、生成 AI の推論ロジックがより明確になり、入力の解釈が容易になります。

上記の例を続けてみましょう。Lettria の Charles は、10,000 件の金融記事から抽出したエンティティをナレッジ グラフにロードし、LLM を使用して GraphRAG を実行しました。これにより、より良い答えが得られることがわかります。データを見てみましょう:



10,000 件の金融記事から抽出されたエンティティをナレッジ グラフにロードします

まず、データをグラフとして考えます。さらに、いつでもデータをナビゲートしてクエリしたり、修正したり更新したりできます。ガバナンスの利点は、このデータの「世界モデル」の表示と監査がはるかに簡単になることです。グラフを使用すると、同じデータのベクトル バージョンを使用するよりも、最終的な責任者が決定の背後にある理由を理解できる可能性が高くなります。

品質を確保する場合、データをナレッジ グラフに配置できれば、エラーや意外な点を見つけてソースまで遡ることが容易になります。また、グラフの出所と信頼度の情報を取得して、計算や解釈に使用することもできます。同じデータのベクトルのみのバージョンではこれを行うことはできません。また、前に説明したように、ベクトル化されたデータは平均的な (さらには平均的でない) 人々にとっても理解が困難です。

ナレッジ グラフは、セキュリティとプライバシーを大幅に強化することもできます。

プロトタイプを構築する場合、セキュリティとプライバシーはそれほど重要ではありませんが、製品に組み込む場合には重要です。銀行や医療などの規制された業界では、従業員のデータ アクセスは役職によって異なります。

LLM であってもベクトル データベースであっても、データ アクセスの範囲を制限する良い方法はありません。ナレッジ グラフは、アクセス許可制御を使用して参加者がアクセスできるデータベースの範囲を規制し、閲覧が許可されていないデータが閲覧できないようにする優れたソリューションを提供します。以下は、ナレッジ グラフで詳細な権限制御を実装できる単純なセキュリティ ポリシーです。



ナレッジグラフで実装できるシンプルなセキュリティ戦略

ナレッジグラフを作成する

ナレッジグラフを構築するには何が必要ですか?最初のステップは、生成 AI アプリケーションに最も関連する 2 つのグラフを理解することです。

ドメイン グラフは、現在のアプリケーションに関連するワールド モデルを表します。簡単な例を次に示します。



ドメインマップ

語彙グラフは文書構造のグラフです。最も基本的な語彙グラフは、単語のチャンクで構成されるノードで構成されます。



語彙マップ

チャンク、文書オブジェクト (表など)、章、段落、ページ番号、文書名または文書番号、コレクション、ソースなどの間の関係を含めるように拡張することがよくあります。以下に示すように、ドメイン マップと語彙マップを組み合わせることもできます。



ドメイン層と語彙層を結合する

語彙マップの作成は非常に簡単で、主に単純な解析とチャンク化だけです。ドメイン マップに関しては、データのソース (構造化データ ソース、非構造化データ ソース、またはその両方) に応じて異なる作成パスがあります。幸いなことに、非構造化データ ソースからナレッジ グラフを作成するツールは急速に開発されています。

たとえば、新しい Neo4j Knowledge Graph Builder は、PDF ドキュメント、Web ページ、YouTube ビデオ、Wikipedia の記事を使用してナレッジ グラフを自動的に作成できます。プロセス全体はボタンを数回クリックするだけで簡単で、入力したテキストのドメイン マップと語彙マップを視覚化してクエリできます。このツールは非常に強力で興味深いもので、ナレッジ グラフ作成の敷居を大幅に下げることができます。

構造化データ (会社が顧客、製品、地理的位置などについて保存している構造化データなど) については、ナレッジ グラフに直接マッピングできます。たとえば、リレーショナル データベースに最も一般的に保存される構造化データの場合、いくつかの標準ツールを使用して、実証済みの信頼できるルールに基づいて関係をグラフにマッピングできます。

ナレッジグラフを使用する

ナレッジ グラフを作成したら、GraphRAG を作成できます。LlamaIndex Property Graph Index、Langchain 統合版 Neo4j、Haystack 統合版など、さまざまなフレームワークから選択できます。この分野は急速に発展していますが、現在ではプログラミング方法が非常にシンプルになりつつあります。

同じことがグラフ作成にも当てはまります。Neo4j Importer (グラフィカル インターフェイスを通じて表形式のデータをインポートしてグラフにマッピングできる) や前述の Neo4j Knowledge Graph Builder などのツールが登場しています。以下の図は、ナレッジ グラフを構築する手順をまとめたものです。



生成 AI 用のナレッジ グラフを自動的に構築

ナレッジ グラフを使用すると、人間の言語での質問をグラフ データベースのクエリにマッピングすることもできます。 Neo4j は、自然言語を使用してナレッジ グラフをクエリするのに役立つオープンソース ツール NeoConverse をリリースしました: https://neo4j.com/labs/genai-ecosystem/neoconverse/

グラフを使い始めるにはある程度の学習が必要ですが、幸いなことに、ツールが進化するにつれて、それはより簡単になります。

概要: GraphRAG は RAG の避けられない未来です

LLM 固有のワードベースのコンピューティングおよび言語スキルとベクトルベースの RAG を組み合わせることで、非常に優れた結果が得られます。安定して良い結果を得るには、文字列レベルを超えて、ワードモデルの上にワールドモデルを構築する必要があります。同様に、Google は、検索をマスターするには、単なるテキスト分析を超えて、文字列が表すもの間の関係をマッピングする必要があることに気付きました。 AI の世界でも同じパターンが現れ始めています。このモードはGraphRAGです。

テクノロジーの発展曲線はS字型で、あるテクノロジーが頂点に達した後、別のテクノロジーが進歩を促進し、前者を追い越します。生成 AI が発展するにつれて、関連アプリケーションの要件も増加し、高品質な回答から説明可能性、データ アクセス許可、プライバシー、セキュリティのきめ細かい制御まで、ナレッジ グラフの価値も高まります。



生成型 AI の進化

次の生成 AI アプリケーションでは、おそらくナレッジ グラフを使用することになるでしょう。

参考リンク:https://neo4j.com/blog/graphrag-manifesto/