
在信息爆炸的时代,如何从海量信息中获取准确、全面的搜索结果,并以更直观、可读性更强的方式呈现出来,是每个人都期望达到的目标。传统的搜索增强技术受限于训练文本的数量和质量,对于复杂或多义词效果不佳,无法满足ChatGPT等语言模型应用带来的大规模、高并发、复杂相关查询的需求。
在此背景下,舒悦图数据库率先实现了与Llama Index、LangChain等大语言模型框架的深度适配,并在业内首次提出了Graph RAG(基于图的检索增强)的概念。知识图谱结合大语言模型(LLM)可以为搜索引擎提供更全面的上下文信息,可以帮助用户以更低的成本获得更智能、更准确的搜索结果。目前悦数图数据库推出的这项技术,在与矢量数据库结合的领域也取得了相当不错的成绩。
今天,我们来看看什么是Graph RAG,以及它与其他RAG技术的比较。欢迎来到官网,悦数图数据库,通过Demo直观体验此功能。
传统检索增强技术的瓶颈:缺乏训练数据和文本理解不足。
在传统的搜索引擎中,搜索结果通常是基于关键词匹配的。随着用户对搜索准确度和词汇联想能力要求的提高,传统的搜索结果往往难以满足用户的实际需求,尤其是在处理复杂问题和长尾查询时,效果会明显降低。
为了解决这类问题,RAG搜索增强技术应运而生。RAG(retrieval-augmented generation)是指通过RAG模型增强搜索结果的过程。具体而言,它是一种结合检索技术和语言生成技术来增强生成过程的技术,可以帮助传统搜索引擎生成更加准确、相关和多样化的信息,以满足用户的需求。
为了使搜索结果更加准确,RAG技术仍然面临着训练数据和文本理解的挑战:
训练数据:RAG技术需要大量的数据和计算资源来训练和生成模型,尤其是在处理多语言和复杂的任务时,但互联网上文本的质量和准确性有限,训练数据的缺乏会直接影响生成内容的质量。
文本理解:RAG需要理解查询的意图,但是对于复杂查询或者多义查询,RAG可能会有歧义或者不确定性,从而影响生成的质量。
因此,如何找到一种更强大的检索增强技术来获得更高效、更符合搜索者期望的搜索结果显得更加迫切。
什么是Graph RAG:基于知识地图的检索增强技术
“图RAG”是岳数图数据首先提出的一个概念。它是一种基于知识地图的检索增强技术。通过构建图模型的知识表达,将实体与关系之间的关系以图的形式展现出来,然后通过LLM(大语言模型)进行检索增强。
在之前的有Llama Index的现场研讨会中,我们提到过,图形数据库通过以图形格式组织和连接信息的方式,天然地适合于存储和表达复杂的上下文信息。通过图技术构建知识地图,可以提高情境学习的全面性,为用户提供更多的情境信息,有助于LLM更好地理解实体之间的关系,提高其表达和推理能力。
Graph RAG将知识图谱等同于一个非常庞大的词汇,而实体和关系则对应于单词。这样,Graph RAG在检索时可以将实体和关系作为一个单元联合建模,从而更准确地理解查询意图,提供更准确的检索结果。
Demo演示:检索增强效果对比:“约舒”官网可以直接在线体验。
我们通过Demo演示,直观的对比一下Graph RAG和Vector RAG和Text2Cypher的区别和对比吧——
矢量图形与图形+矢量图形的比较
首先是Vector RAG(向量检索)和Graph+Vector RAG(图技术增强的向量检索)的比较。

左:矢量RAG右:Graph+矢量RAG以《银河护卫队3》的数据集为例。当我们询问“彼得·奎尔的相关信息”时,单单矢量搜索引擎就只给出简单的身份、剧情、演员等信息。当我们使用Graph RAG来增强搜索结果时,它提供了更多关于主角技能、角色目标和身份变化的信息——在这个例子中,我们不难看出Graph RAG的方法有效地补充了嵌入、向量搜索等传统手段的不足。
Graph RAG和Text2Cypher的比较
基于atlas的LLM另一个有趣的方法是Text2Cypher,即自然语言生成图查询。这种方法不依赖于实体的子图检索,而是将任务/问题转化为面向答案的特定图查询,这和我们常说的Text2SQL的本质是一样的。
Text2Cypher和Graph RAG主要是检索机制不同。Text2Cypher根据知识图谱的图式和给定的任务生成一个图形化的图式查询,而(子)Graph RAG获取相关子图提供上下文。两者各有千秋,通过这个演示可以更直观的了解它们的特点:

左:Text2Cypher右:Graph RAG我们可以看到,可视化下的两种图查询方式有着非常明显的区别,基于Graph RAG的检索显然呈现出更丰富的结果。用户不仅可以获得最基本的介绍信息,还可以获得基于相关搜索和上下文的一系列推理结果,如“彼得·奎尔是银河护卫队的领袖”、“这个角色暗示他将在续集中回归”以及角色的性格等。
舒悦地图数据库:率先实现LLM适配,一键打造企业专属知识地图应用。
舒悦图数据库不仅是国内第一个提出图RAG概念的厂商,也是第一个实现与Llama Index、LangChain等大语言模型框架深度适配的厂商。因此,开发人员可以专注于LLM的布局逻辑和流水线设计,而无需亲自处理许多细节的抽象和实现,一站式生成高质量、低成本的企业级大型语言模型应用。
Graph RAG技术的出现可以说为海量信息处理和检索带来了一种全新的思路。Graph RAG通过将知识地图和图存储集成到LLM的技术栈中,将上下文学习推向了一个新的高度。目前,用户只需三行代码,就可以轻松构建一个基于悦数图形数据库的图形RAG,甚至可以集成更复杂的RAG逻辑,比如图形+矢量RAG。

相信随着图技术和深度学习算法的进一步发展,图RAG技术在信息处理和检索中的应用会越来越广泛。欢迎大家点击【联系我们】获得舒悦海图数据免费试用机。
微信扫码
QQ扫码
您的IP:10.1.201.110,2026-04-06 13:15:37,Processed in 2.21222 second(s).