Page 113 - 2023年第54卷第9期
P. 113

标准洪水与坝顶抢筑子埝之间的 “采取方法” 关系,进而得到 <超标准洪水,采取方法,坝顶抢筑子
              埝>三元组知识。此外输入文本极易因非规范描述产生语义模糊现象,且多数复杂句包含代词指称和
              冗余描述,而现有方 法对 高质量 输入 文本 的强 依赖 性 决定 了 其 从 复 杂 语 句 中 抽 取 领 域 知 识 的 能 力
              有限。
                  为了克服这些限制,与从现有文本中进行知识抽取的方法不同,本文采取一种截然不同的思想,
              即通过大型语言模型 LLM(LargeLanguageModel,如 GPT - 3.5            [16] ,GPT - 4)进行大坝防汛抢险知识推理
              ( FloodControlandRescueKnowledgeInference,FCRKI)。与抽取不同,推理的方法不要求输入语句中
              具有明确的防汛实体间关系,而是通过 LLM分别挖掘出防汛实体相关描述,将相关语句组合,进而根
              据这些组合语句分析推理出防汛实体间关系。LLM 经过整个互联网中语料的预训练                                       [17] ,是拥有世界
              知识的人工智能 AI(ArtificialIntelligence)引擎,被称为基础模型               [18] ,通过 LLM 挖掘防汛实体相关知
              识,可利用整个互联网作为知识库,不依赖有限的文本源,从而避免可利用工程文本数量过少的限
              制。LLM学习到互联网中多样的语言表达模式,且其上下文学习能力支持组合不同语句进行关系推理
              而不依赖于特定的文本输入,因此可避免输入文本质量偏低的限制。然而若直接使用 LLM查询防汛实
              体间关系,其很可能由于无法深入理解领域知识产生无效响应。为了避免直接查询生成无效回答,受
              任务分解     [19] 与提示链接   [20] 等研究的启发,本文设计一种大坝防汛抢险知识推理新范式,这种范式将
              总体推理任 务 分解 为子 任务,为各 个子 任 务 设计 任务 提示,按特 定结 构 将 任 务 提 示 链 接 形 成 “ AI
              链”,以驱动 LLM根据 AI链中任务提示逐步完成各个推理子任务,最终解决防汛实体间关系推理问
              题。具体来说,将防汛抢险实体间关系推理整体流程详细分解为三个步骤,依次为防汛实体抽取、实
              体相关知识挖掘与实体间关系推断,针对三个步骤设计三个模块与 LLM进行实时交互,分别是防汛实
              体抽取器( EntityExtractor,Eer)、防汛实体知识解析器(KnowledgeParser,KPer)和防汛实体间关系决
              策器(RelationDecider,RDer),在三个模块中通过设计一系列提示,逐步引导 LLM根据提示从知识库
              中对目标知识进行抽取、挖掘与推理。为了提高防汛实体间关系推理的可靠性,本文设计了一种群体
              智能策略     [21] ,即由 RDer以三种不同方式(开放式提问、限制性判断、限制性选择)对该实体对间关系
              做出三次决策,采用多数投票决定最终结果,从而完成防汛实体间关系推理。FCRKI主要利用 LLM丰
              富的语言知识及上下文学习能力进行防汛实体间关系推理,打破了可利用工程文本数量过少和防汛实
              体关系语句分布散乱的局限。这一新范式给水利领域各种信息抽取任务提供了新的解决思路,将使研
              究人员更高效率地完成不仅限于大坝防汛抢险知识推理等水利信息化任务中任何一种需要 AI参与的
              任务。


              2 防汛抢险知识推理方法


              2.1 关系类型描述 大坝防汛抢险工作涉及的关系类型众多,以 5种关系类型为例介绍防汛抢险知识
              推理方法,关系类型分别是:存在风险、连带险情、采取方法、功能相似、功能对比                                          [12] 。其中 “存
              在风险” 关系,即某一工程部位会出现某种风险事件;“连带险情” 关系,即某一工程险情可能会连
              带另一种工程险情的发生;“采取方法” 关系,即出现某种险情时需要采取某种方法抢护;“功能相
              似” 关系,即不同物料之间的可替代;“功能对比” 关系,即物料之间的效率对比。
              2.2 总体任务分解 现有的基于监督或半监督学习的方法,需要大量人力成本对数据进行收集、清理
              和标记   [22] ,从而完成模型训练、评估和优化。与之不同,本文提出的知识推理方法利用 LLM 的强大
              语言处理能力以无监督学习方法进行防汛实体间关系推理。为完成知识推理总任务,该方法模仿人类
              思维,将推理流程分解为三个串行子任务,分别是抽取防汛实体并配对、挖掘防汛实体相关知识并组
              合、基于组合知识推理出防汛实体间关系。同时,针对三个子任务设计了三个子模块,分别是防汛实
              体抽取器 Eer、防汛实体知识解析器 KPer和防汛实体间关系决策器 RDer,总体框架如图 1(图中黑体
              为突出重点,下同)。在知识推理过程中,首先,Eer旨在引导 LLM从输入文本中提取大坝防汛实体,
              将实体两两配对,这里 Eer只做实体抽取,不考虑实体间关系,不受当前输入文本语义复杂度的影响。

                                                                                                   1
                                                                                              —   1 2 3 —
   108   109   110   111   112   113   114   115   116   117   118