Page 119 - 2023年第54卷第9期
P. 119
表 2 AI单元和模块的准确性
子模块 准确率 AI单元 准确率
防汛实体抽取器 87% 实体抽取单元 87%
防汛实体间关系决策 1 82%
防汛实体间关系决策器 86% 防汛实体间关系决策 2 79%
防汛实体间关系决策 3 77%
实体抽取错误主要表现为无效实体与文本中不存在实体,具体案例如表 3。从第 1条文本中抽取
出的 “土粒” 实体,与从第 2条文本中抽取出的 “填筑” 实体,其在日常生活和各个领域中被广泛使
用,这类实体属于通用实体,对于大坝防汛抢险任务缺乏针对性,本文注释时将该类实体视为无效实
体。从第 1条文本中抽取的 “堤坝” 实体,虽属于该领域内特定实体,但并不存在于文本中,这是由
于 LLM有时可能会根据语义生成与当前文本语义较相似,但实际不存在于文本中的实体,本文中注释
时将该实体视为错误实体。关系推断不正确主要由于进行实体相关知识挖掘时,LLM生成的防汛实体
相关知识可能存在噪声,因为此模块所返回的答案是利用 LLM从广泛的世界知识中挖掘并生成的,所
涉及知识并无标准答案,而本文设计的群体智能策略可以缓解噪声带来的挑战,提高关系推理结果的
可靠性。总体来看,AI单元表现出的高准确率,证实了融合群体智能策略的 AI链能够有效地连接 AI
单元完成大坝防汛抢险知识推理任务。
表 3 实体抽取错误案例
文本 抽取总实体 错误实体
堤外坡土粒容易被水流冲刷导致浪坎形成 堤外坡;堤坝;土粒;水流冲刷;浪坎 土粒;堤坝
临河填筑黏性土封堵隔渗,同时背河填筑砂石反滤导渗 临河;填筑;封堵隔渗;背河;反滤导渗 填筑
4.2 防汛知识推理有效性检验结果 FCRKI和 WRERJE的对比结果如表 4。FCRKI和 WRERJE分别
从随机抽取的 310条初始工程文本中推理得到 335条和 274条防汛实体关系三元组。对于简单文本,
FCRKI能够正确推理出 192条防汛实体关系三元组,高 于 WRERJE提 取 的 169条,对于 复杂文本,
FCRKI正确推理出 143条防汛实体关系三元组,多于 WRERJE提取的 105条关系三元组。因为简单文
本的语义复杂度较低,对方法推理能力要求不高。复杂文本的语义复杂度较高,涉及到很多从句和代
词指称,使得 WREEJE提取关系较为困难,因为 WRERJE仅从输入文本中提取表意明确关系三元组,
推理能力弱。而 FCRKI利用 LLM具备的世界知识和强大的生成能力来推理出防汛实体间关系,不受
文本来源和语义复杂度的限制,因此,FCRKI可以更好的地处理复杂文本中的实体与实体间关系。
表 4 FCRKI和 WRERJE的验证结果
FCRKI WRERJE
抽取数量 抽取关系总数 正确关系数量 推理关系总数 正确推理数量
310(初始文本) 409 335 356 274
156 (简单文本) 235 192 220 169
154(复杂文本) 174 143 136 105
4.3 AI链和群体智能策略有效性检验结果 6种方法的结果如表 5所示。从表中得知 FCRKI 准确
w?oAI
预测 180条关系三元组,少于 FCRKI的 335条,这表明即便 LLM 学习到海量互联网知识,但没有明
确的任务提示,也很难直接推理出二者关系。FCRKI 准确预测 198条关系三元组,这表明在单个
AI - CoT
文本块中进行全部步骤的描述,LLM 很难将各部分的输入输出紧密联系起来,这两种方法验证了 AI
链思想和子模块以及功能单元设计对 FCRKI鲁棒性的影响。FCRKI 准确预测 361个关系,虽高于
w?OMV
FCRKI的 335个,但其准确率远低于 FCRKI,验证了多数投票的有效性。而对于独立的防汛实体间关
1
— 1 2 9 —