Page 89 - 2025年第56卷第5期
P. 89
较低 [12-13] 。
大语言模型(Large Language Models, LLMs) 的出现为知识图谱的构建开辟了新路径,特别是在
[14]
减少人工干预和提高效率方面展现出巨大潜力。LLMs 凭借其强大的语言理解和生成能力 [15] ,能够从
非结构化文本中提取知识,将其转化为结构化的三元组,降低了人力。Edge 等 [16-17] 基于 LLMs 提出图
检索增强生成(Graph Retrieval-Augmented Generation,GraphRAG)方法,实现知识图谱的半自动化构
建。但由于 GraphRAG 只关注实体类型,在关系类型的标注上存在不足,无法通过特定关系检索到相
连 实 体 , 使 得 知 识 图 谱 的 实 用 性 受 到 限 制 。 Zhang 等 [18] 提 出 开 放 信 息 提 取(Extract-Define-
Canonicalize, EDC)方法自动化构建知识图谱,但该方法主要聚焦于关系类型的定义与优化,实体冗
余和不一致问题难以解决,知识图谱的质量仍有待提升。
为 突 破 现 有 局 限 , 本 文 设 计 了 由 LLMs 指 导 的 “ 发 掘 -构 建 -过 滤 ”(Explore-Construct-Filter,
ECF)框架,实现水利工程运行管理质量问题概念模型及知识图谱的自动化构建,减少人工干预,并
对实体和关系进行双重发掘。首先,利用思维链(Chain of Thought,CoT) [19-20] 提示,辅助 LLMs 识别水
利领域的实体和关系以及它们的类型,达到实体关系联合处理。实体与关系的双重维度分析提升了知
识图谱的类型捕获能力。穷举组合水利工程实体与关系类型,最大限度地召回待定元三元组,实现知
识图谱概念模型的自动化生成。其次,结合已生成的概念模型,借助 LLMs 从文本中提取实例三元组,
构建水利工程运行管理质量问题知识图谱。最后,为确保知识图谱的准确性,设计了过滤机制,剔除
概念模型及知识图谱中的三元组噪声。该方法对提升流域水利工程相关质量问题的智能捕获与分析能
力提供了新思路,为水利工程的规范运行与稳步推进提供了理论支持。
2 研究方法
本文提出了一种人工智能链(AI 链)驱动的水利工程运行管理质量问题概念模型及知识图谱的自动
)
化构建方法。通过知识图谱发掘(KG Exploration,KGE)、知识图谱构建(KG Construction, KGC)和知
(
识图谱过滤(KG Filtering,KGF)三个集成模块的开发,组成如图 1 所示的 ECF 框架。旨在解决现行知
图 1 “发掘-构建-过滤”框架
— 635 —