Microsofts Open-Source-GraphRAG erfreut sich immer größerer Beliebtheit. Ist die generative KI in die Ära der Wissensgraphen eingetreten?

2024-07-15

Maschinenherzbericht

Herausgeber: Panda W

Der Wissensgraph weicht niemals von der Umgebung ab!

LLM ist sehr leistungsfähig, weist aber auch einige offensichtliche Mängel auf, wie z. B. Halluzinationsprobleme, schlechte Interpretierbarkeit, Unfähigkeit, den Schwerpunkt des Problems zu erfassen, Datenschutz- und Sicherheitsprobleme usw. Retrieval-Augmented Generation (RAG) kann die Generierungsqualität und den Ergebnisnutzen von LLM erheblich verbessern.

Anfang dieses Monats veröffentlichte Microsoft GraphRAG, die leistungsstärkste Open-Source-RAG-Wissensdatenbanklösung. Das Projekt erfreute sich unmittelbar nach seiner Online-Veröffentlichung großer Beliebtheit und hat mittlerweile 10,5.000 Sterne erreicht.

Projektadresse: https://github.com/microsoft/graphrag
Offizielle Dokumentation: https://microsoft.github.io/graphrag/

Manche Leute sagen, dass es leistungsfähiger ist als gewöhnliches RAG:

GraphRAG verwendet LLM zur Generierung von Wissensgraphen, die die Frage- und Antwortleistung bei der Dokumentenanalyse komplexer Informationen, insbesondere beim Umgang mit privaten Daten, erheblich verbessern können.

Vergleichsergebnisse zwischen GraphRAG und traditionellem RAG

Heutzutage ist RAG eine Technik, die reale Informationen zur Verbesserung der LLM-Ausgabe verwendet und ein wichtiger Bestandteil der meisten LLM-basierten Tools ist. Im Allgemeinen verwendet RAG die Vektorähnlichkeit als Suche, die als Baseline-RAG bezeichnet wird. Aber Baseline RAG funktioniert in manchen Situationen nicht perfekt. Zum Beispiel:

Baseline RAG hat Schwierigkeiten, die Zusammenhänge zu verstehen. Dies geschieht, wenn die Beantwortung einer Frage die Durchquerung verschiedener Informationen über gemeinsame Attribute erfordert, um neue kombinierte Erkenntnisse zu liefern.
Baseline RAG schneidet schlecht ab, wenn es darum geht, zusammengefasste semantische Konzepte in großen Datensätzen oder sogar in einem einzelnen großen Dokument umfassend zu verstehen.

Das von Microsoft vorgeschlagene GraphRAG verwendet LLM, um ein Wissensdiagramm basierend auf der Eingabetextbibliothek zu erstellen. Dieses Diagramm kombiniert Community-Zusammenfassungen und die Ergebnisse des maschinellen Lernens von Diagrammen, um Hinweise zum Zeitpunkt der Abfrage zu verbessern. GraphRAG zeigt erhebliche Verbesserungen bei der Beantwortung beider Arten von Fragen und zeigt eine bessere Leistung als frühere Methoden für private Datensätze.

Als jedoch alle ein tieferes Verständnis von GraphRAG erlangten, stellten sie fest, dass seine Prinzipien und Inhalte wirklich schwer zu verstehen waren.

Kürzlich veröffentlichte Philip Rathle, CTO der Neo4j Company, einen Blogartikel mit dem Titel „GraphRAG Manifesto: Adding Knowledge to Generative AI“. GraphRAG und mehr.

Er sagte: „Ihre nächste generative KI-Anwendung wird wahrscheinlich einen Wissensgraphen verwenden.“

Philip Rathle, CTO von Neo4j

Lesen Sie diesen Artikel unten.

Uns wird klar: Um mit generativer KI etwas wirklich Sinnvolles zu tun, können Sie sich nicht einfach darauf verlassen, dass autoregressive LLMs Entscheidungen für Sie treffen.

Ich weiß, was Sie denken: „Verwenden Sie RAG.“ Oder nehmen Sie eine Feinabstimmung vor oder warten Sie auf GPT-5.

Ja. Techniken wie die vektorbasierte Retrieval Augmentation Generation (RAG) und Feinabstimmung können Ihnen dabei helfen. Und sie lösen bestimmte Anwendungsfälle gut genug. Es gibt jedoch einen Anwendungsfall, der all diese Technologien zum Erliegen bringen wird.

Bei vielen Problemen besteht die Lösung des vektorbasierten RAG (und der Feinabstimmung) im Wesentlichen darin, die Wahrscheinlichkeit der richtigen Antwort zu erhöhen. Aber keine der beiden Techniken bietet ein gewisses Maß an Sicherheit hinsichtlich der richtigen Antwort. Ihnen fehlt oft der Kontext und es ist schwierig, eine Verbindung zu etwas herzustellen, das Sie bereits kennen. Darüber hinaus liefern diese Tools keine Hinweise darauf, warum eine bestimmte Entscheidung getroffen wurde.

Wenden wir uns wieder dem Jahr 2012 zu, als Google seine Suchmaschine der zweiten Generation auf den Markt brachte und einen ikonischen Blogbeitrag mit dem Titel „Einführung in den Knowledge Graph: Dinge, keine Zeichenfolgen“ veröffentlichte. Sie fanden heraus, dass es zu einer enormen Verbesserung der Suche führen könnte, wenn sie zusätzlich zur Durchführung verschiedener String-Verarbeitungen einen Wissensgraphen verwenden würden, um alle Dinge zu organisieren, die als Strings auf einer Webseite dargestellt werden.

Nun zeichnet sich ein ähnliches Muster im Bereich der generativen KI ab. Viele generative KI-Projekte stoßen an eine Grenze, bei der die Qualität ihrer Ergebnisse dadurch eingeschränkt wird, dass es sich bei der Lösung um Strings und nicht um Dinge handelt.

Heute haben hochmoderne KI-Ingenieure und akademische Forscher wiederentdeckt, was Google einst entdeckte: Das Geheimnis zur Überwindung dieses Engpasses ist der Wissensgraph. Mit anderen Worten geht es darum, Wissen über Dinge in die statistikbasierte Texttechnologie einzubringen. Die Funktionsweise ähnelt der anderer RAGs, außer dass zusätzlich zur Vektorindizierung auch der Wissensgraph aufgerufen wird. Das heißt: GraphRAG! (GraphRAG = Wissensgraph + RAG)

Ziel dieses Artikels ist es, eine umfassende und verständliche Einführung in GraphRAG zu bieten. Untersuchungen zeigen, dass die Integration Ihrer Daten in einen Wissensgraphen und deren Nutzung durch RAG Ihnen mehrere große Vorteile bringen kann. Es gibt zahlreiche Untersuchungen, die belegen, dass GraphRAG die meisten oder alle Fragen, die Sie LLM stellen, besser beantworten kann als RAG, indem es nur gewöhnliche Vektoren verwendet.

Allein dieser Vorteil reicht aus, um die Einführung von GraphRAG stark zu fördern.

Aber das ist noch nicht alles: Da die Daten beim Erstellen einer App sichtbar sind, ist die Entwicklung auch einfacher.

Ein dritter Vorteil von GraphRAG besteht darin, dass sowohl Menschen als auch Maschinen Diagramme gut verstehen und darauf basierende Schlussfolgerungen ziehen können. Dadurch ist die Erstellung von Anwendungen mit GraphRAG einfacher und führt zu besseren Ergebnissen, während sie gleichzeitig einfacher zu interpretieren und zu prüfen sind (was für viele Branchen von entscheidender Bedeutung ist).

Ich glaube, dass GraphRAG für die meisten Anwendungsfälle die reine Vektor-RAG als Standard-RAG-Architektur ersetzen wird. Dieser Artikel erklärt warum.

Was ist eine Karte?

Zuerst müssen wir klären, was ein Graph ist.

Graph, auch Graph genannt, wird oft mit „Graph“ übersetzt, kann daher aber leicht mit Konzepten wie Bild und Bild verwechselt werden. Um die Unterscheidung zu erleichtern, wird in diesem Artikel nur die Übersetzungsmethode „图图“ verwendet.

Die Grafik sieht wahrscheinlich so aus:

Kartenbeispiel

Obwohl dieses Bild oft als Beispiel für einen Wissensgraphen verwendet wird, sind seine Quelle und sein Autor nicht mehr bekannt.

oder dieses:

„Game of Thrones“-Charakterbeziehungskarte von William Lyon

oder dieses:

Karte der Londoner U-Bahn. Interessante Tatsache: Transport for London hat kürzlich eine graphbasierte digitale Zwillingsanwendung eingeführt, um die Reaktionsfähigkeiten bei Vorfällen zu verbessern und Staus zu reduzieren.

Mit anderen Worten: Eine Karte ist kein Diagramm.

Hier werden wir uns nicht zu sehr mit Definitionsfragen befassen, vorausgesetzt, Sie wissen bereits, was eine Karte ist.

Wenn Sie die obigen Bilder verstehen, können Sie wahrscheinlich erkennen, wie die zugrunde liegenden Wissensdiagrammdaten (in der Diagrammdatenbank gespeichert) abgefragt und als Teil eines RAG-Workflows verwendet werden können. Das ist GraphRAG.

Zwei Formen der Wissensdarstellung: Vektoren und Grafiken

Der Kern einer typischen RAG ist die Vektorsuche, die darin besteht, konzeptionell ähnliche Texte aus schriftlichen Kandidatenmaterialien auf der Grundlage von Eingabetextblöcken zu finden und zurückzugeben. Diese Art der Automatisierung funktioniert hervorragend und selbst einfache Suchvorgänge sind nützlich.

Aber jedes Mal, wenn Sie eine Suche durchführen, haben Sie möglicherweise nicht darüber nachgedacht, was ein Vektor ist oder wie die Ähnlichkeitsberechnung implementiert wird. Werfen wir als nächstes einen Blick auf Apple. Es stellt verschiedene Formen aus der menschlichen Perspektive, der Vektorperspektive und der Graphenperspektive dar:

Apple aus menschlicher Perspektive, Vektorperspektive und Kartenperspektive

Für den Menschen ist die Darstellung eines Apfels komplex und mehrdimensional und seine Eigenschaften können nicht vollständig auf dem Papier beschrieben werden. Hier können wir uns poetisch vorstellen, dass dieses rote Foto wahrnehmungsmäßig und konzeptionell einen Apfel darstellen kann.

Die Vektordarstellung dieses Apfels ist ein Array. Der Zauber von Vektoren besteht darin, dass sie jeweils die Essenz ihres entsprechenden Textes in codierter Form erfassen. Im Kontext von RAG werden Vektoren jedoch nur benötigt, wenn Sie bestimmen müssen, wie ähnlich ein Textabschnitt einem anderen Textabschnitt ist. Führen Sie dazu einfach eine Ähnlichkeitsberechnung durch und prüfen Sie die Übereinstimmung. Wenn Sie jedoch die Bedeutung eines Vektors verstehen möchten, verstehen möchten, was im Text dargestellt wird, und Einblick in seine Beziehung zu einem größeren Kontext gewinnen möchten, ist die Vektordarstellung nicht geeignet.

Im Gegensatz dazu stellen Wissensgraphen die Welt in deklarativer Form dar – in der Terminologie des KI-Bereichs also symbolisch. Daher können sowohl Menschen als auch Maschinen den Wissensgraphen verstehen und darauf basierende Überlegungen anstellen. Dies ist wichtig und wird später erwähnt.

Darüber hinaus können Sie den Wissensgraphen abfragen, visualisieren, annotieren, modifizieren und erweitern. Ein Wissensgraph ist ein Weltmodell, das die Welt in Ihrem aktuellen Arbeitsbereich darstellen kann.

GraphRAG und RAG

Die beiden stehen nicht im Wettbewerb. Für RAG sind sowohl Vektorabfragen als auch Diagrammabfragen nützlich. Jerry Liu, Gründer von LlamaIndex, betont: Wenn man über GraphRAG nachdenkt, ist es hilfreich, Vektoren einzubeziehen. Dies unterscheidet sich von „nur Vektor-RAG“ – es basiert ausschließlich auf der Ähnlichkeit zwischen Texteinbettungen.

Grundsätzlich ist GraphRAG eine Art RAG, mit der Ausnahme, dass sein Suchpfad den Wissensgraphen umfasst. Wie Sie unten sehen werden, ist das Kernschema von GraphRAG sehr einfach. Seine Architektur ist die gleiche wie bei RAG, die Vektoren verwendet, enthält jedoch eine Wissensgraphenschicht.

GraphRAG-Modus

Ein häufiges Muster für GraphRAG

Wie Sie sehen können, wurde im obigen Bild eine Diagrammabfrage ausgelöst. Es kann optional eine Vektorähnlichkeitskomponente enthalten. Sie können das Diagramm und die Vektoren in zwei verschiedenen Datenbanken speichern oder eine Diagrammdatenbank wie Neo4j verwenden, die die Vektorsuche unterstützt.

Ein gängiges Muster für die Verwendung von GraphRAG ist unten aufgeführt:

1. Führen Sie eine Vektorsuche oder Stichwortsuche durch, um eine Reihe von Anfangsknoten zu finden.

2. Durchlaufen Sie den Graphen und bringen Sie Informationen über relevante Knoten zurück.

3. (Optional) Verwenden Sie diagrammbasierte Ranking-Algorithmen wie PageRank, um Dokumente neu zu ordnen

Unterschiedliche Anwendungsfälle führen zu unterschiedlichen Nutzungsmustern. Wie alle Forschungsrichtungen im heutigen KI-Bereich ist auch GraphRAG ein forschungsintensives Feld, in dem jede Woche neue Entdeckungen gemacht werden.

GraphRAG-Lebenszyklus

Generative KI mit GraphRAG folgt auch dem Muster jeder anderen RAG-Anwendung. Zu Beginn gibt es einen Schritt „Graph erstellen“:

GraphRAG-Lebenszyklus

Das Erstellen eines Diagramms ähnelt dem Teilen eines Dokuments und dem Laden in eine Vektordatenbank. Fortschritte bei den Werkzeugen haben die Kartenerstellung recht einfach gemacht. Hier sind drei gute Nachrichten:

1. Karten sind sehr iterativ – Sie können mit einer „Minimum Viable Map“ beginnen und diese dann erweitern.

2. Sobald Daten zum Wissensgraphen hinzugefügt wurden, kann dieser problemlos weiterentwickelt werden. Sie können weitere Datentypen hinzufügen, um Datennetzwerkeffekte zu nutzen. Sie können auch die Qualität Ihrer Daten verbessern, um den Wert Ihrer Anwendung zu steigern.

3. Das Gebiet entwickelt sich rasant weiter, was bedeutet, dass die Erstellung von Karten mit immer ausgefeilteren Werkzeugen immer einfacher wird.

Das Hinzufügen der Schritte zur Kartenerstellung zum vorherigen Bild führt zu einem Arbeitsablauf wie unten dargestellt:

Fügen Sie Schritte zur Kartenerstellung hinzu

Werfen wir einen Blick auf die Vorteile, die GraphRAG bieten kann.

Warum GraphRAG verwenden?

Im Vergleich zu reinem Vektor-RAG sind die Vorteile von GraphRAG hauptsächlich in drei Kategorien unterteilt:

1. Höhere Genauigkeit und vollständigere Antworten (Laufzeit-/Produktionsvorteil)

2. Sobald der Wissensgraph erstellt ist, ist es einfacher, RAG-Anwendungen zu erstellen und zu warten (Entwicklungszeitvorteil).

3. Bessere Erklärbarkeit, Nachvollziehbarkeit und Zugriffskontrolle (Governance-Vorteile)

Hier finden Sie einen detaillierten Einblick in diese Vorteile.

1. Mehr Genauigkeit und nützlichere Antworten

Der erste (und am deutlichsten sichtbare) Vorteil von GraphRAG ist die höhere Qualität seiner Antworten. Ob in der Wissenschaft oder in der Industrie, wir können viele Beweise finden, die diese Beobachtung stützen.

Wie dieses Beispiel vom Datenkatalogunternehmen Data.world. Ende 2023 veröffentlichten sie einen Forschungsbericht, der zeigte, dass GraphRAG die Genauigkeit von LLM-Antworten auf 43 Geschäftsfragen um durchschnittlich das Dreifache verbessern konnte. Diese Benchmark-Studie liefert Beweise dafür, dass Wissensgraphen die Antwortgenauigkeit erheblich verbessern können.

Der Wissensgraph verbessert die Genauigkeit der LLM-Antwort um 54,2 Prozentpunkte, was ungefähr dem Dreifachen entspricht.

Microsoft lieferte auch eine Reihe von Beweisen, darunter einen Forschungsblog vom Februar 2024 „GraphRAG: Unlocking LLM Discovery on Narrative Private Data“ und ein zugehöriges Forschungspapier „From Local to Global: A Graph RAG Approach to Query-Focused Summarization“ „Und Software: https://github.com/microsoft/graphrag (das eingangs erwähnte GraphRAG).

Unter anderem beobachteten sie die folgenden zwei Probleme mit der Basis-RAG unter Verwendung von Vektoren:

Baseline RAG macht es schwierig, die Zusammenhänge zu erkennen. Um unterschiedliche Informationen zu synthetisieren und neue Erkenntnisse zu gewinnen, müssen unterschiedliche Informationsfragmente über gemeinsame Attribute durchlaufen werden. Derzeit ist es für die Basis-RAG schwierig, unterschiedliche Informationsfragmente zu verbinden.
Baseline RAG schneidet schlecht ab, wenn es darum geht, semantische Konzepte umfassend zu verstehen, die induktiv über große Datensammlungen oder sogar einzelne große Dokumente zusammengefasst werden.

Microsoft fand heraus: „Durch die Verwendung des von LLM generierten Wissensgraphen kann GraphRAG den „Abruf“-Teil von RAG erheblich verbessern, indem es relevantere Inhalte für das Kontextfenster ausfüllt und dadurch bessere Antworten erhält und Beweisquellen erhält.“ „Sie fanden außerdem heraus, dass GraphRAG im Vergleich zu anderen alternativen Methoden 26 % bis 97 % weniger Token benötigt, sodass es nicht nur bessere Antworten liefert, sondern auch geringere Kosten und eine bessere Skalierbarkeit aufweist.

Wenn wir uns etwas genauer mit der Genauigkeit befassen, wissen wir, dass es zwar wichtig ist, dass die Antwort richtig ist, sie aber auch nützlich sein muss. Es wurde festgestellt, dass GraphRAG Antworten nicht nur genauer, sondern auch umfassender, vollständiger und nützlicher macht.

Der aktuelle Artikel von LinkedIn „Retrieval-Augmented Generation with Knowledge Graphs for Customer Service Question Answering“ ist ein hervorragendes Beispiel für die Auswirkungen von GraphRAG auf seine Kundendienstanwendungen. GraphRAG verbesserte die Genauigkeit und Fülle seiner Kundenservice-Antworten, machte sie nützlicher und reduzierte die durchschnittliche Zeit, die sein Kundenservice-Team für die Lösung jedes Problems benötigte, um 28,6 %.

Der Generative AI-Workshop von Neo4j hat ein ähnliches Beispiel. Wie unten gezeigt, ist dies die Antwort, die mit den Methoden „Vektor + GraphRAG“ und „Nur Vektor“ für eine Reihe von SEC-Einreichungen erhalten wurde:

Vergleich der Methoden „nur Vektor“ und „Vektor + GraphRAG“.

Bitte beachten Sie den Unterschied zwischen „Beschreiben Sie die Merkmale von Unternehmen, die von der Lithiumknappheit betroffen sein könnten“ und „Auflisten der spezifischen Unternehmen, die möglicherweise betroffen sind“. Wenn Sie ein Investor sind, der als Reaktion auf Marktveränderungen ein Portfolio neu ausrichten möchte, oder ein Unternehmen, das seine Lieferkette als Reaktion auf eine Naturkatastrophe neu ausrichten möchte, sind die Informationen auf der rechten Seite des obigen Diagramms sicherlich viel wichtiger als die Informationen auf der Linken. Hier sind beide Antworten zutreffend. Aber die Antwort rechts ist eindeutig nützlicher.

Jesus Barrasas Going Meta Episode 23 bietet ein weiteres großartiges Beispiel: Beginnen Sie mit einer Wortkarte, um mit juristischen Dokumenten zu arbeiten.

Von Zeit zu Zeit sehen wir auch neue Beispiele aus Wissenschaft und Industrie. Beispielsweise gab Charles Borderie aus Lettria ein Vergleichsbeispiel für die Methoden „Nur Vektor“ und „Vektor + GraphRAG“. GraphRAG basiert auf einem LLM-basierten Text-zu-Grafik-Workflow, um 10.000 Finanzartikel in einem Wissensgraphen zu organisieren:

Nur-Sucher-Methoden vs. Graph-Sucher-Methoden

Es ist ersichtlich, dass die Verwendung von GraphRAG im Vergleich zur Verwendung von gewöhnlichem RAG nicht nur die Qualität der Antworten verbessern, sondern auch die Anzahl der Token in seinen Antworten um ein Drittel reduzieren kann.

Nehmen wir ein weiteres Beispiel von Writer. Sie veröffentlichten kürzlich einen RAG-Benchmark-Bericht auf Basis des RobustQA-Frameworks, in dem ihre GraphRAG-basierte Methode mit anderen ähnlichen Tools verglichen wurde. Der von GraphRAG erzielte Wert beträgt 86 %, was deutlich besser ist als bei anderen Methoden (im Bereich von 33 % bis 76 %), bei ähnlicher oder besserer Latenzleistung.

Ergebnisse der Genauigkeits- und Reaktionszeitbewertung der RAG-Methode

GraphRAG unterstützt eine Vielzahl generativer KI-Anwendungen. Wissensgraphen eröffnen den Weg, die Ergebnisse generativer KI genauer und nützlicher zu machen.

2. Verbessertes Datenverständnis und schnellere Iteration

Wissensgraphen sind sowohl konzeptionell als auch visuell intuitiv. Die Erforschung von Wissensgraphen führt oft zu neuen Erkenntnissen.

Viele Benutzer von Wissensgraphen haben dieses unerwartete Ergebnis geteilt: Sobald sie in die Vervollständigung ihres eigenen Wissensgraphen investieren, kann es ihnen auf unerwartete Weise dabei helfen, ihre eigenen generativen KI-Anwendungen zu erstellen und zu debuggen. Das liegt zum Teil daran, dass Sie, wenn Sie die Daten in Form einer Grafik betrachten, erkennen können, dass die diesen Anwendungen zugrunde liegenden Daten ein lebendiges Datenbild darstellen.

Mithilfe von Diagrammen können Sie Antworten verfolgen, Daten finden und die Kausalkette auf dem Weg verfolgen.

Schauen wir uns das obige Beispiel zur Lithiumknappheit an. Wenn Sie seinen Vektor visualisieren, erhalten Sie etwa das Bild unten, jedoch mit mehr Zeilen und Spalten.

Vektorvisualisierung

Und wenn Sie die Daten in ein Diagramm umwandeln, können Sie sie auf eine Weise verstehen, die eine Vektordarstellung nicht kann.

Das Folgende ist ein Beispiel aus einem aktuellen LlamaIndex-Webinar, das zeigt, wie sie die Beziehung „MENTIONS“ verwenden, um vektorisierte Wortblöcke (Vokabulardiagramm) zu extrahieren, und LLM, um ein Diagramm von Entitäten (Domänendiagramm) zu extrahieren und die beiden Fähigkeiten zu verbinden:

Extrahieren Sie die Vokabelkarte und die Domänenkarte

(Es gibt auch viele Beispiele für die Verwendung von Tools wie Langchain, HayStack und SpringAI.)

Sie können die reichhaltige Struktur der Daten in diesem Diagramm sehen und sich die neuen Entwicklungs- und Debugging-Möglichkeiten vorstellen, die es ermöglicht. Jedes Datenelement hat seinen eigenen Wert, und die Struktur selbst speichert und vermittelt zusätzliche Bedeutung, die Sie nutzen können, um Ihre Anwendung intelligenter zu machen.

Es ist nicht nur Visualisierung. Dabei geht es auch darum, dass Ihre Datenstrukturen Bedeutung vermitteln und speichern können. Hier ist die Reaktion eines Entwicklers eines bekannten Fintech-Unternehmens, nur eine Woche nach der Einführung von Wissensgraphen in den RAG-Workflow:

Reaktion der Entwickler auf GraphRAG

Die Reaktion dieses Entwicklers steht sehr im Einklang mit der Hypothese der „testgetriebenen Entwicklung“, die darin besteht, zu überprüfen (aber nicht zu vertrauen), ob die Antwort richtig ist. Ich persönlich wäre entsetzt, wenn man von mir verlangen würde, 100 % meiner Autonomie einer KI zu überlassen, deren Entscheidungsfindung völlig undurchsichtig ist. Genauer gesagt, selbst wenn Sie kein Anhänger des KI-Weltuntergangs sind, werden Sie zustimmen: Wenn Sie die Wörter oder Dokumente im Zusammenhang mit „Apple, Inc.“ nicht dem Unternehmen „Apple Corps“ zuordnen können (das sind zwei völlig verschiedene Dinge), wird in der Tat von großem Wert sein. Da es letztendlich Daten sind, die generative KI-Entscheidungen vorantreiben, ist es wohl am wichtigsten, die Datenkorrektheit zu bewerten und sicherzustellen.

3. Governance: Erklärbarkeit, Sicherheit und mehr

Je größer die Auswirkungen einer generativen KI-Entscheidung sind, desto mehr müssen Sie die Menschen überzeugen, die letztlich die Verantwortung tragen, wenn die Entscheidung fehlschlägt. Dazu gehört in der Regel die Prüfung jeder Entscheidung. Dies erfordert eine zuverlässige und wiederholbare Aufzeichnung guter Entscheidungen. Aber das reicht nicht aus. Wenn Sie eine Entscheidung treffen oder aufgeben, müssen Sie auch die Gründe dafür erläutern.

LLM selbst macht das nicht gut. Ja, Sie können sich auf die Dokumentation beziehen, die zur Entscheidungsfindung herangezogen wurde. Aber diese Dokumente erklären nicht die Entscheidung selbst – ganz zu schweigen davon, dass LLM die Quellen stammte. Wissensgraphen befinden sich auf einer völlig anderen Ebene und machen die Argumentationslogik der generativen KI klarer und erleichtern die Interpretation von Eingaben.

Fahren wir mit dem obigen Beispiel fort: Charles aus Lettria hat aus 10.000 Finanzartikeln extrahierte Entitäten in einen Wissensgraphen geladen und einen LLM verwendet, um GraphRAG auszuführen. Wir sehen, dass dies bessere Antworten liefert. Werfen wir einen Blick auf die Daten:

Laden Sie aus 10.000 Finanzartikeln extrahierte Entitäten in den Wissensgraphen

Stellen Sie sich Ihre Daten zunächst als Diagramm vor. Darüber hinaus können wir in den Daten navigieren, sie abfragen und sie jederzeit überarbeiten und aktualisieren. Der Governance-Vorteil besteht darin, dass es viel einfacher wird, das „Weltmodell“ dieser Daten anzuzeigen und zu prüfen. Die Verwendung eines Diagramms erhöht die Wahrscheinlichkeit, dass die letztendlich verantwortliche Person die Gründe für die Entscheidung versteht, als die Verwendung einer Vektorversion derselben Daten.

Wenn es um die Qualitätssicherung geht: Wenn Sie Ihre Daten in einem Wissensgraphen zusammenfassen können, ist es einfacher, Fehler und Überraschungen zu finden und sie bis zu ihrer Quelle zurückzuverfolgen. Sie können im Diagramm auch Herkunfts- und Konfidenzinformationen abrufen, die dann für Berechnungen und Interpretationen verwendet werden können. Mit einer reinen Vektorversion derselben Daten ist dies einfach nicht möglich, und wie wir bereits erwähnt haben, sind vektorisierte Daten für durchschnittliche (und sogar nicht durchschnittliche) Menschen schwer zu verstehen.

Wissensgraphen können auch die Sicherheit und den Datenschutz erheblich verbessern.

Sicherheit und Datenschutz sind beim Erstellen eines Prototyps oft nicht sehr wichtig, aber sie sind entscheidend, wenn sie in ein Produkt eingebaut werden sollen. In regulierten Branchen wie dem Bankwesen oder dem Gesundheitswesen hängt der Datenzugriff jedes Mitarbeiters von seiner Berufsbezeichnung ab.

Unabhängig davon, ob es sich um LLM oder eine Vektordatenbank handelt, gibt es keine gute Möglichkeit, den Umfang des Datenzugriffs einzuschränken. Wissensgraphen können eine gute Lösung sein, indem sie mithilfe der Berechtigungskontrolle den Umfang der Datenbanken regulieren, auf die Teilnehmer zugreifen können, und so verhindern, dass sie Daten sehen, die sie nicht sehen dürfen. Das Folgende ist eine einfache Sicherheitsrichtlinie, mit der eine detaillierte Berechtigungssteuerung im Wissensdiagramm implementiert werden kann:

Eine einfache Sicherheitsstrategie, die in Wissensgraphen implementiert werden kann

Erstellen Sie einen Wissensgraphen

Was wird benötigt, um einen Wissensgraphen zu erstellen? Der erste Schritt besteht darin, die beiden Diagramme zu verstehen, die für generative KI-Anwendungen am relevantesten sind.

Der Domänengraph stellt das für die aktuelle Anwendung relevante Weltmodell dar. Hier ist ein einfaches Beispiel:

Domänenkarte

Ein lexikalischer Graph ist ein Graph der Dokumentstruktur. Der grundlegendste Vokabulargraph besteht aus Knoten, die aus Wortblöcken bestehen:

Vokabelkarte

Oft wird es erweitert, um Beziehungen zwischen Blöcken, Dokumentobjekten (z. B. Tabellen), Kapiteln, Absätzen, Seitenzahlen, Dokumentnamen oder -nummern, Sammlungen, Quellen usw. einzubeziehen. Sie können Domänenkarten und Vokabelkarten auch miteinander kombinieren, wie unten gezeigt:

Kombinieren Sie die Domänenschicht und die Vokabularschicht

Das Erstellen einer Vokabelkarte ist sehr einfach und besteht im Wesentlichen nur aus einfacher Analyse und Aufteilung. Für die Domänenkarte gibt es je nach Datenquelle (aus strukturierten Datenquellen, unstrukturierten Datenquellen oder beidem) unterschiedliche Erstellungspfade. Glücklicherweise entwickeln sich Tools zur Erstellung von Wissensgraphen aus unstrukturierten Datenquellen rasant weiter.

Beispielsweise kann der neue Neo4j Knowledge Graph Builder automatisch Wissensgraphen aus PDF-Dokumenten, Webseiten, YouTube-Videos und Wikipedia-Artikeln erstellen. Der gesamte Vorgang ist so einfach wie ein paar Klicks auf eine Schaltfläche, und Sie können Domänen- und Vokabularkarten des von Ihnen eingegebenen Textes visualisieren und abfragen. Dieses Tool ist sehr leistungsstark und interessant und kann die Schwelle für die Erstellung von Wissensgraphen erheblich senken.

Strukturierte Daten (z. B. die strukturierten Daten, die Ihr Unternehmen über Kunden, Produkte, geografische Standorte usw. speichert) können direkt in einem Wissensgraphen abgebildet werden. Beispielsweise können für strukturierte Daten, die am häufigsten in relationalen Datenbanken gespeichert werden, einige Standardtools verwendet werden, um Beziehungen auf der Grundlage bewährter und zuverlässiger Regeln in Diagrammen abzubilden.

Verwenden Sie einen Wissensgraphen

Sobald Sie einen Wissensgraphen haben, können Sie GraphRAG erstellen. Es stehen viele Frameworks zur Auswahl, z. B. der LlamaIndex Property Graph Index, die integrierte Langchain-Version von Neo4j und die integrierte Haystack-Version. Dieses Feld entwickelt sich rasant, aber jetzt wird die Programmiermethode sehr einfach.

Das Gleiche gilt für die Diagrammerstellung wie Neo4j Importer (der tabellarische Daten über eine grafische Oberfläche importieren und in Diagramme abbilden kann) und der bereits erwähnte Neo4j Knowledge Graph Builder. Die folgende Abbildung fasst die Schritte zum Erstellen eines Wissensgraphen zusammen.

Erstellen Sie automatisch Wissensgraphen für generative KI

Mithilfe von Wissensgraphen können auch menschliche Sprachfragen in Graphdatenbankabfragen abgebildet werden. Neo4j hat mit NeoConverse ein Open-Source-Tool veröffentlicht, das die Verwendung natürlicher Sprache zur Abfrage von Wissensgraphen unterstützt: https://neo4j.com/labs/genai-ecosystem/neoconverse/

Der Einstieg in die Verwendung von Diagrammen erfordert zwar einiges an Lernerfahrung, die gute Nachricht ist jedoch, dass es mit der Weiterentwicklung der Tools einfacher wird.

Zusammenfassung: GraphRAG ist die unvermeidliche Zukunft von RAG

Die inhärenten wortbasierten Computer- und Sprachkenntnisse von LLM in Kombination mit vektorbasiertem RAG können zu sehr guten Ergebnissen führen. Um dauerhaft gute Ergebnisse zu erzielen, ist es notwendig, über die String-Ebene hinauszugehen und ein Weltmodell über dem Wortmodell aufzubauen. Ebenso stellte Google fest, dass man, um die Suche zu meistern, über die bloße Textanalyse hinausgehen und die Beziehungen zwischen den Dingen abbilden musste, die durch Zeichenfolgen dargestellt werden. Wir beginnen, das gleiche Muster in der KI-Welt zu erkennen. Dieser Modus ist GraphRAG.

Die Entwicklungskurve der Technologie verläuft S-förmig: Nachdem eine Technologie ihren Höhepunkt erreicht hat, wird eine andere Technologie den Fortschritt vorantreiben und die erstere übertreffen. Mit der Weiterentwicklung der generativen KI werden auch die Anforderungen an entsprechende Anwendungen steigen – von qualitativ hochwertigen Antworten über die Erklärbarkeit bis hin zur feingranularen Kontrolle von Datenzugriffsberechtigungen, Datenschutz und Sicherheit wird auch der Wert von Wissensgraphen zunehmen.

Die Entwicklung der generativen KI

Ihre nächste generative KI-Anwendung wird wahrscheinlich einen Wissensgraphen verwenden.

Referenzlink: https://neo4j.com/blog/graphrag-manifesto/

Nachricht

Microsofts Open-Source-GraphRAG erfreut sich immer größerer Beliebtheit. Ist die generative KI in die Ära der Wissensgraphen eingetreten?

Einführung

meine Kontaktdaten