NodeRAG:使用异构节点构建基于图的 RAG
Tianyang Xu, Haojie Zheng, Chengze Li, Haoxiang Chen, Yixin Liu, Ruoxi Chen, Lichao Sun
发布日期: 4/22/2025

摘要
检索增强生成 (RAG) 使大型语言模型能够访问外部和私有语料库,从而在特定领域实现事实一致的响应。基于图的 RAG 方法利用语料库的固有结构,通过构建知识图谱索引并利用图的结构特性,进一步丰富了这一流程。然而,当前基于图的 RAG 方法很少优先考虑图结构的设计。设计不完善的图不仅会阻碍各种图算法的无缝集成,还会导致工作流不一致和性能下降。为了进一步释放图在 RAG 中的潜力,我们提出了 NodeRAG,这是一个以图为中心的框架,引入了异构图结构,使基于图的方法能够无缝、整体地集成到 RAG 工作流中。通过与 LLM 的功能紧密结合,该框架可确保完全内聚且高效的端到端流程。通过大量实验,我们证明 NodeRAG 的性能优势远超 GraphRAG 和 LightRAG 等先前方法,不仅体现在索引时间、查询时间和存储效率方面,更体现在多跳基准测试和开放式头对头测试中,以最少的检索令牌实现了卓越的问答性能。我们的 GitHub 代码库可通过此 https URL查看。