Page 118 - 2023年第54卷第9期
P. 118
防汛实体间关系决策单元,通过判断最终推理所得结果的准确率来评估该单元的可靠程度。
3.2.2 防汛知识推理有效性验证 将 FCRKI与实体关系联合抽取框架 WRERJE [12] 进行比较,验证
FCRKI在防汛实体关系三元组知识推理任务中的可靠性。将 3.2.1节中得到的 310条初始文本作为输
入,分别使用 WRERJE和 FCRKI提取防汛实体关系三元组。此外,为了验证文本特征对 FCRKI的影
响,将 310条样本分为简单文本和复杂文本,如果 1条文本中含有两个以上的防汛抢险实体且模式复
杂,即划定为复杂文本,否则为简单文本,最终得到 156条简单文本和 154条复杂文本。分别测试
FCRKI方法对复杂文本和简单文本的推理性能。
3.2.3 AI链和群体智能策略有效性检验 为了验证本文所提 AI链的有效性,设计 2种方法:(1)
FCRKI ,其不使用 AI链思想,采取直接询问实体间关系的方式,如图 6中 FCRKI ,输入为 1条
w?oAI w?oAI
工程文本,输出为 LLM根据自身逻辑推理出的该条语句中表达的关系;(2)FCRKI ,其使用 AI链
AI - CoT
思想,但不进行子模块和功能单元的划分,只在 1个文本块中描述所有步骤,LLM通过任务步骤来完
成防汛实体间关系推理,如图 6中所示,输入为 1条工程文本,输出为 LLM根据步骤推理得到的文本
中表达关系。采用初始 310条工程文本进行上述两种方法的测试。
为了评估群体智能策略对 FCRKI鲁棒性的影响,设计了 4种方法,第 1种方法为 FCRKI 该方
w?OMV,
法省略多数投票环节,在 3个决策单元的输出结果中,只要有一个输出为正,该结果就为正,该方法
主要验证多数投票的有效性。其余 3种方法则是针对防汛实体间关系决策单元设计了 3种独立变体,
分别是只回答开放式问题的决策 1(RDer_1)、只判断声明正误的决策 2(RDer_2)、只做限制性选择的
决策 3(RDer_3),每种方法都将其对应的独立决策单元的输出作为最终结果,3种独立变体用于验证
群体智能策略的有效性。
图 6 FCRKI AICoT 两种方法对比
w?oAI 和 FCRKI -
4 实验结果
4.1 子模块中 AI单元有效性检验结果 对于子模块和 AI单元的准确性检验结果如表 2所示。防汛实
体抽取器的准确率取决于该子模块内进行实体抽取的 AI单元准确率,实体抽取 AI单元对初始的 310
条文本进行抽取,共抽取出 525个实体,通过人工对 525个实体进行注释,其中正确的有 457个,准
确率为 87%。防汛实体间关系决策器从 3.2.1中得到的 560个实体对中推理出 769条关系三元组,通
过人工对 769条关系三元组进行注释,正确数量为 661,准确率为 86%。在 769条关系三元组中,通
过开放式提问方式进行决策的决策 1回答正确个数为 630,准确率为 82%;通过限制性判断声明正误
方式进行决策的决策 2判断正确个数为 607,准确率为 79%。通过限制性选择方式进行决策的决策 3
选择正确个数为 592,准确率为 77%。
— 1 1 8 —
2