Page 119 - 2023年第54卷第9期

P. 119

表２ＡＩ单元和模块的准确性
子模块准确率ＡＩ单元准确率
防汛实体抽取器８７％实体抽取单元８７％
防汛实体间关系决策１８２％
防汛实体间关系决策器８６％防汛实体间关系决策２７９％
防汛实体间关系决策３７７％

实体抽取错误主要表现为无效实体与文本中不存在实体，具体案例如表３。从第１条文本中抽取
出的 “土粒” 实体，与从第２条文本中抽取出的 “填筑” 实体，其在日常生活和各个领域中被广泛使
用，这类实体属于通用实体，对于大坝防汛抢险任务缺乏针对性，本文注释时将该类实体视为无效实
体。从第１条文本中抽取的 “堤坝” 实体，虽属于该领域内特定实体，但并不存在于文本中，这是由
于ＬＬＭ有时可能会根据语义生成与当前文本语义较相似，但实际不存在于文本中的实体，本文中注释
时将该实体视为错误实体。关系推断不正确主要由于进行实体相关知识挖掘时，ＬＬＭ生成的防汛实体
相关知识可能存在噪声，因为此模块所返回的答案是利用ＬＬＭ从广泛的世界知识中挖掘并生成的，所
涉及知识并无标准答案，而本文设计的群体智能策略可以缓解噪声带来的挑战，提高关系推理结果的
可靠性。总体来看，ＡＩ单元表现出的高准确率，证实了融合群体智能策略的ＡＩ链能够有效地连接ＡＩ
单元完成大坝防汛抢险知识推理任务。

表３实体抽取错误案例

文本抽取总实体错误实体
堤外坡土粒容易被水流冲刷导致浪坎形成堤外坡；堤坝；土粒；水流冲刷；浪坎土粒；堤坝
临河填筑黏性土封堵隔渗，同时背河填筑砂石反滤导渗临河；填筑；封堵隔渗；背河；反滤导渗填筑

４．２防汛知识推理有效性检验结果ＦＣＲＫＩ和ＷＲＥＲＪＥ的对比结果如表４。ＦＣＲＫＩ和ＷＲＥＲＪＥ分别
从随机抽取的３１０条初始工程文本中推理得到３３５条和２７４条防汛实体关系三元组。对于简单文本，
ＦＣＲＫＩ能够正确推理出１９２条防汛实体关系三元组，高于ＷＲＥＲＪＥ提取的１６９条，对于复杂文本，
ＦＣＲＫＩ正确推理出１４３条防汛实体关系三元组，多于ＷＲＥＲＪＥ提取的１０５条关系三元组。因为简单文
本的语义复杂度较低，对方法推理能力要求不高。复杂文本的语义复杂度较高，涉及到很多从句和代
词指称，使得ＷＲＥＥＪＥ提取关系较为困难，因为ＷＲＥＲＪＥ仅从输入文本中提取表意明确关系三元组，
推理能力弱。而ＦＣＲＫＩ利用ＬＬＭ具备的世界知识和强大的生成能力来推理出防汛实体间关系，不受
文本来源和语义复杂度的限制，因此，ＦＣＲＫＩ可以更好的地处理复杂文本中的实体与实体间关系。
表４ＦＣＲＫＩ和ＷＲＥＲＪＥ的验证结果

ＦＣＲＫＩＷＲＥＲＪＥ
抽取数量抽取关系总数正确关系数量推理关系总数正确推理数量
３１０（初始文本）４０９３３５３５６２７４
１５６（简单文本）２３５１９２２２０１６９
１５４（复杂文本）１７４１４３１３６１０５

４．３ＡＩ链和群体智能策略有效性检验结果６种方法的结果如表５所示。从表中得知ＦＣＲＫＩ准确
ｗ?ｏＡＩ
预测１８０条关系三元组，少于ＦＣＲＫＩ的３３５条，这表明即便ＬＬＭ学习到海量互联网知识，但没有明
确的任务提示，也很难直接推理出二者关系。ＦＣＲＫＩ准确预测１９８条关系三元组，这表明在单个
ＡＩ－ＣｏＴ
文本块中进行全部步骤的描述，ＬＬＭ很难将各部分的输入输出紧密联系起来，这两种方法验证了ＡＩ
链思想和子模块以及功能单元设计对ＦＣＲＫＩ鲁棒性的影响。ＦＣＲＫＩ准确预测３６１个关系，虽高于
ｗ?ＯＭＶ
ＦＣＲＫＩ的３３５个，但其准确率远低于ＦＣＲＫＩ，验证了多数投票的有效性。而对于独立的防汛实体间关

１
— １２９ —

114 115 116 117 118 119 120 121 122 123 124