GraphRAG:从零到英雄
Source: Dev.to
介绍
GraphRAG 是一种检索增强生成(RAG)系统,它将知识图谱与向量搜索相结合,以提供更准确、上下文感知的 AI 响应。与仅依赖文档嵌入的传统 RAG 不同,GraphRAG 利用知识图谱中的结构化关系和语义连接来理解上下文并检索最相关的信息。
在本实操教程中,你将学习如何构建一个复杂的 GraphRAG 流水线,集成以下功能:
- 双向 Neo4j 集成 – 灵活访问图数据,支持无缝抽取和写入到 Protégé,使你的知识库能够随时间演进。
- Protégé 本体创建与修改 – 标准化并结构化数据,以提升语义理解和查询精度;直接从 LLM 创建或修改本体。
- 向量数据库存储 – 优化相关信息的检索,以实现准确的 RAG 响应;在 RAG 存储中存储和检索 Neo4j 或 Protégé 本体。
- 语义搜索能力 – 与传统关键词搜索相比,提供更有意义、上下文感知的结果。
- NLP 驱动的查询 – 通过 SPARQL 和 Cypher 简化交互,使知识图谱对任何技术水平的用户都可访问。
- LLM 驱动的动态本体创建 – 快速适应数据需求的变化,构建不断演进的复杂知识图谱。
此实现提供了完整的知识图谱管理与查询工作流,适用于欺诈检测系统、推荐引擎、智能搜索平台等场景。
所需环境
- Protégé – GitHub
- Neo4j AuraDB – Console
- GraphRAG 插件 – GitHub
- VidyaAstra 插件 – GitHub
- Neo4j‑Protégé 插件 – GitHub
示例中使用的本体可在此获取:
fraud‑detection‑ontology.owl
注意: 这些插件仍在积极维护中。包名可能会重构,且会添加新功能。如遇问题,欢迎联系作者。
安装完这三个插件后,它们会出现在 Protégé 的工具栏中:

连接 Neo4j
你可以使用 Neo4j‑Protégé 插件连接到 Neo4j AuraDB 实例。连接对话框可通过工具栏访问:

使用此插件,你可以:
- 在 Neo4j 与 OWL/RDF 格式之间导入/导出本体。
- 本地检索本体并运行 NLP 驱动的查询。
- 导入图的子集,以在本地 Protégé 项目中使用。

你还可以执行自动翻译为 SPARQL/Cypher 的纯英文查询:

导入到 Protégé
从 Neo4j 导出本体后,将其导入到 Protégé:

构建 RAG 存储
本体加载到 Protégé 后,使用 GraphRAG 插件生成向量嵌入并将其存储在本地 RAG 存储中:

现在,你可以像使用标准 RAG 系统一样查询该 RAG 存储:

欺诈检测用例
欺诈检测本体即上面链接的同一文件。将其导入 Protégé 后,通过 GraphRAG 插件将其存入 RAG 存储:

与 VidyaAstra 插件结合使用
VidyaAstra 插件为图谱添加额外信息,并支持更深入的子图探索:

插件特性
GraphRAG 与 VidyaAstra 插件均提供:
- Explain Graph – 可视化展示实体之间的连接方式。
- NLP Query – 将自然语言查询翻译为 SPARQL/Cypher。
- Dynamic Ontology Updates – 基于 LLM 建议的即时本体修改。
- Semantic Search – 跨组合的图‑向量存储进行上下文感知检索。
