悦数图数据库

首页>博客>行业科普>悦数 AI 应用平台解析:图数据库 + 大模型的一站式 AI 开发平台

悦数 AI 应用平台解析:图数据库 + 大模型的一站式 AI 开发平台

T:悦数 AI 应用平台解析:图数据库 + 大模型的一站式 AI 开发平台 K:悦数 AI 应用平台 D:本文全面解析悦数 AI 应用平台的核心架构与功能模块,从知识图谱构建、GraphRAG 检索到 AI Agent 开发,探讨图数据库与大模型深度融合的一站式 AI 开发平台如何帮助企业快速落地 AI 应用。

悦数 AI 应用平台

2024 年之后,几乎每家企业都在做 AI。但大多数企业做的,不过是把大模型的 API 接进来,套个问答框,就对外说"我们上了 AI"。

这类应用,试用体验往往不差。真正拿来处理业务时,问题就来了:

"为什么它不知道我们公司内部的产品关系?"

"为什么问今年的采购数据,它给我的是通用回答?"

"为什么同一个问题,每次回答都不一样?"

这些问题指向同一个根源:大模型有能力,但没有数据。更准确地说,是缺少一个把企业私有知识、复杂关系数据和大模型推理能力连接起来的"中间层"。

悦数 AI 应用平台,做的就是这个"中间层"。

一、为什么图数据库是 AI 平台的最佳搭档

在讨论悦数 AI 应用平台之前,有必要先回答一个基础问题:为什么要把图数据库和大模型放在一起做平台,而不是直接用向量数据库做检索增强?

这个问题的答案,关键在"关系"二字。

向量数据库解决的是"语义相似"问题:给定一个问题,找到语义上最接近的文本片段,交给大模型作答。这对于知识库问答、文档检索类场景足够用了。

但企业真实的数据,不是一堆文档,而是一张关系网络。

一家制造企业的数据里,有供应商、零件、工序、设备、质检记录……它们之间有"供应""组装""依赖""生产于"等各种关系。当业务员问"这个零件断供了会影响哪些产品线"时,这个问题本质上是在这张网络里做多跳路径查询——向量相似度解决不了,关系型数据库做多层 JOIN 太慢,只有图数据库能高效处理。

图技术在 AI 应用场景下的独特价值,正在于此:

  • 结构化知识:用图谱把企业数据中的实体和关系显式存储,大模型检索时不只能找到"相关文字",还能找到"相关关系路径";
  • 推理路径可追溯:图谱里的每一条路径都是确定性的,AI 给出答案时可以附带完整推理依据,不是黑盒;
  • 动态知识更新:图谱支持实时写入,新知识当天入图,大模型当天可用,不需要等待重新训练。

悦数 AI 应用平台正是基于这个逻辑搭建的:以悦数图数据库为知识存储底座,集成大模型推理能力,提供从图谱构建到应用上线的完整工具链。

二、平台核心架构:四层协同,覆盖 AI 应用全生命周期

悦数 AI 应用平台的架构,可以分为四层来理解:

层次 核心功能 解决的问题
数据接入层 多源数据连接器、知识抽取引擎 把企业分散数据汇聚成结构化图谱
图谱管理层 图谱建模、可视化编辑、版本管理 让图谱易于维护和演化
AI 推理层 三模检索(向量 + 精确 + 图谱)、GraphRAG 引擎、Agent 编排 把图谱知识精准供给给大模型
应用交付层 低代码问答应用构建、API 输出、权限管理 快速把 AI 能力包装成业务应用

这四层打通了从"企业有数据"到"AI 能用数据"再到"业务跑起来"的完整链路,是"一站式"的核心含义所在。

三、关键模块深度解析

模块一:智能知识图谱构建

传统知识图谱建设是个劳动密集型工程:人工定义 Schema、人工抽取实体关系、人工校验质量……一张中型规模的知识图谱,从零到可用往往需要半年以上。

悦数 AI 应用平台在知识图谱构建环节引入了 AI 辅助能力,将这个过程大幅压缩:

Schema 自动推荐:上传企业现有的文档、数据表、API 接口文档,平台通过大模型分析数据结构,自动推荐图谱的实体类型和关系类型,人工只需在此基础上确认和调整,而不是从空白处开始。

多模态知识抽取:支持从结构化数据(数据库表、Excel)、半结构化数据(JSON、XML)和非结构化数据(PDF 报告、Word 文档、网页文本)中自动抽取实体和关系,写入图谱。某金融客户的实测结果显示,使用平台的自动抽取能力后,图谱知识覆盖率从人工维护阶段的约 45% 提升到 80% 以上。

可视化图谱编辑器:提供所见即所得的图谱编辑界面,业务人员无需掌握图查询语言,即可通过拖拽方式完成节点和关系的增删改,降低图谱维护的技术门槛。

模块二:GraphRAG 引擎

这是悦数 AI 应用平台区别于普通 RAG 平台的核心能力。

普通 RAG 的检索逻辑是:把问题向量化,在向量数据库中找相似片段,拼接成 Prompt 送给大模型。这个链路简单,但有一个根本缺陷:它找到的是"相似文本",而不是"相关知识"。

GraphRAG 的检索逻辑不同:

  1. 意图解析:大模型分析用户问题,识别其中涉及的实体和关系类型;
  2. 图谱检索:在知识图谱中执行多跳路径查询,找到与问题相关的实体、关系和推理路径;
  3. 三模融合:将图谱检索结果与向量相似检索、精确关键词检索的结果融合,形成更完整的上下文;
  4. 答案生成:把融合后的结构化上下文送给大模型,生成附带引用来源的答案。

这个流程的关键改进,在步骤 2:图谱检索找到的不只是文本,而是带结构的知识路径。大模型在生成答案时,有了"知道 A 和 B 有什么关系、B 又和 C 有什么关系"这样的结构化上下文,回答准确度和深度都会显著提升。

模块三:AI Agent 编排

GraphRAG 解决的是"问答"场景。当任务变成"完成一项分析"或"执行一个复杂流程"时,就需要 Agent 了。

悦数 AI 应用平台提供可视化的 Agent 编排界面,让技术团队能够以低代码方式构建复杂的 AI 工作流:

工具注册中心:将图谱查询、外部 API 调用、数据计算、文档生成等能力注册为 Agent 可调用的工具,Agent 在执行任务时自主选择合适的工具。

多 Agent 协作:支持多个 Agent 的串联和并联编排。例如,"供应链风险分析 Agent"可以拆分为:数据采集 Agent(拉取供应商最新数据)→ 图谱更新 Agent(将新数据写入知识图谱)→ 风险计算 Agent(执行图算法和模型推理)→ 报告生成 Agent(输出结构化风险简报),四个子 Agent 流水线协作,完成一个复杂的自动化分析任务。

执行追踪与调试:提供 Agent 执行过程的完整日志,每一步调用了哪个工具、输入输出是什么、耗时多少,全部可视化展示,方便开发团队定位问题和优化流程。

模块四:低代码应用构建

上述三个模块,解决了"AI 能力怎么做"的问题。最后一个模块,解决"AI 能力怎么交付"的问题。

不是每个业务场景都需要开发团队从头写代码。悦数 AI 应用平台提供基于图谱和 GraphRAG 的低代码应用模板:

  • 知识问答应用:上传文档、连接图谱、配置大模型,5 步以内发布一个具备图谱增强的知识问答 Bot;
  • 图谱探索应用:提供自然语言转图查询的交互界面,业务人员用中文提问,平台自动生成 nGQL 查询并返回可视化图谱结果;
  • 自动化报告应用:配置数据源和报告模板,平台定时执行图谱分析,自动生成并推送结构化报告。

这些模板显著降低了 AI 应用的交付周期。某制造业客户反馈,使用平台的低代码模板,一个供应链知识问答应用从需求确认到上线只用了 3 周,而传统开发方式预估需要 3~4 个月。

四、三个典型落地场景

场景一:金融知识图谱问答

背景:某股份制银行有数十年积累的内部研报、政策文件、产品手册,总量超过 100 万页,日常检索完全靠人工,效率极低。

方案:使用悦数 AI 应用平台构建金融知识图谱,将文档中的实体(公司、产品、政策条款、监管要求)和关系(适用于、限制于、替代于、与……相关)抽取入图,再通过 GraphRAG 引擎构建智能问答系统。

效果:研究员的文献检索时间从平均 2~3 小时压缩到 5~10 分钟;对于需要跨文档关联推理的复杂问题(如"这类产品在哪些监管场景下有限制条款"),准确率达到 85% 以上,远超纯向量检索方案。

场景二:制造业设备知识图谱

背景:某大型装备制造商有数千台在线设备,每台设备有大量操作手册、故障记录、维护历史。一线技术人员遇到故障时,需要翻阅大量文档,平均排查时间 4~6 小时。

方案:构建设备知识图谱,将设备-零件-故障现象-处理方案的关系全部结构化入图,结合历史维修记录,形成"故障诊断知识网络"。技术人员通过自然语言描述故障现象,系统自动检索图谱中的关联故障模式和推荐处理方案。

效果:故障排查平均时间从 4~6 小时降至 45 分钟以内,首次修复成功率提升 28%,设备停机时长减少约 35%。

场景三:医疗行业合规知识管理

背景:某三甲医院的合规管理部门需要跟踪数百项医疗法规、政策文件的更新,及时评估对医院现有操作规程的影响,并通知相关科室。

方案:构建医疗合规知识图谱,将法规条款-适用科室-操作规程-关键人员的关联关系结构化,并接入政策文件实时更新流。当新政策发布时,系统自动分析影响范围,生成"受影响规程清单 + 建议修订方向"报告,推送给合规负责人。

效果:合规响应周期从平均 3~4 周(人工梳理分析)压缩至 1~2 天,合规覆盖盲区比之前减少约 60%。

五、企业选型参考:什么样的团队适合用这类平台

并不是所有企业都需要一个图数据库 + 大模型的一站式平台。以下几类情形,说明企业在这个方向上有真实需求:

业务数据天然是关系网络。 金融(担保/股权/交易关系)、制造(零件/工序/设备关系)、医疗(疾病/药品/操作规程关系)、零售(商品/供应商/客户关系)——这些行业的数据本质上都是图,用图数据库做 AI 底座是自然选择。

现有 RAG 方案遇到了多跳问题的天花板。 如果已经尝试了向量检索 RAG,但对于需要关联多个知识点的复杂问题效果不理想,是时候引入图谱增强了。

需要 AI 给出可解释的推理依据。 金融合规、医疗决策、法律分析这类高风险领域,AI 的答案必须有来源、有路径、有依据,纯向量检索的黑盒答案不符合要求。

有积累多年的私有知识资产。 如果企业有大量内部文档、操作手册、历史记录,这些知识资产通过图谱结构化后,能大幅放大大模型的实际价值。

反过来,如果业务场景比较简单(仅需要文档问答)、数据量较小、AI 使用频率较低,普通 RAG 方案就够了,不需要引入完整的图数据库平台。

六、悦数图数据库

悦数图数据库是杭州悦数科技推出的企业级分布式图数据库,悦数 AI 应用平台以其为核心知识存储底座,提供从图谱构建到 AI 应用交付的完整解决方案。核心技术亮点包括:

  • 千亿级性能底座:C++ 原生图存储引擎,支持千亿节点与边的生产规模,多跳查询毫秒级响应,满足 GraphRAG 和 Agent 的实时检索需求;
  • Shared-Nothing 分布式架构:支持不停服线性扩缩容,业务增长时无需重新架构,图谱规模和查询性能同步扩展;
  • ISO-GQL 标准查询语言:率先支持国际图查询语言标准,开发团队写的查询脚本具备跨平台可移植性,降低长期锁定风险;
  • 完整 AI 工具链:GraphRAG 框架、知识抽取引擎、Agent 编排平台、低代码应用构建器一体集成,缩短从数据到 AI 应用的落地周期;
  • 头部客户实战背书:已在中国移动、美团、京东数科、小红书等大规模生产环境中稳定运行,金融、制造、医疗等多行业有落地案例可参考。