Page 89 - 2025年第56卷第5期
P. 89

较低  [12-13] 。
                  大语言模型(Large Language Models, LLMs) 的出现为知识图谱的构建开辟了新路径,特别是在
                                                          [14]
              减少人工干预和提高效率方面展现出巨大潜力。LLMs 凭借其强大的语言理解和生成能力                                         [15] ,能够从
              非结构化文本中提取知识,将其转化为结构化的三元组,降低了人力。Edge 等                                    [16-17] 基于 LLMs 提出图
              检索增强生成(Graph Retrieval-Augmented Generation,GraphRAG)方法,实现知识图谱的半自动化构
              建。但由于 GraphRAG 只关注实体类型,在关系类型的标注上存在不足,无法通过特定关系检索到相
              连 实 体 , 使 得 知 识 图 谱 的 实 用 性 受 到 限 制 。 Zhang 等          [18] 提 出 开 放 信 息 提 取(Extract-Define-
              Canonicalize, EDC)方法自动化构建知识图谱,但该方法主要聚焦于关系类型的定义与优化,实体冗
              余和不一致问题难以解决,知识图谱的质量仍有待提升。
                  为 突 破 现 有 局 限 , 本 文 设 计 了 由 LLMs 指 导 的 “ 发 掘 -构 建 -过 滤 ”(Explore-Construct-Filter,
              ECF)框架,实现水利工程运行管理质量问题概念模型及知识图谱的自动化构建,减少人工干预,并
              对实体和关系进行双重发掘。首先,利用思维链(Chain of Thought,CoT)                          [19-20] 提示,辅助 LLMs 识别水
              利领域的实体和关系以及它们的类型,达到实体关系联合处理。实体与关系的双重维度分析提升了知
              识图谱的类型捕获能力。穷举组合水利工程实体与关系类型,最大限度地召回待定元三元组,实现知
              识图谱概念模型的自动化生成。其次,结合已生成的概念模型,借助 LLMs 从文本中提取实例三元组,
              构建水利工程运行管理质量问题知识图谱。最后,为确保知识图谱的准确性,设计了过滤机制,剔除
              概念模型及知识图谱中的三元组噪声。该方法对提升流域水利工程相关质量问题的智能捕获与分析能
              力提供了新思路,为水利工程的规范运行与稳步推进提供了理论支持。


              2 研究方法


                  本文提出了一种人工智能链(AI 链)驱动的水利工程运行管理质量问题概念模型及知识图谱的自动

                                                                )
              化构建方法。通过知识图谱发掘(KG Exploration,KGE)、知识图谱构建(KG Construction, KGC)和知
                                           (
              识图谱过滤(KG Filtering,KGF)三个集成模块的开发,组成如图 1 所示的 ECF 框架。旨在解决现行知


































                                                  图 1 “发掘-构建-过滤”框架

                                                                                                — 635  —
   84   85   86   87   88   89   90   91   92   93   94