Page 109 - 水利学报2025年第56卷第4期
P. 109
图 7 迭代检索- 生成框架
3.2.1 子模块领域多模态知识图谱增强的有效性 本研究方法的一个模块是使用工程巡检多模态知识
图谱作为增强知识,让模型在回答前先进行知识的查询,以便于针对特定的风险问题进行回复。为了
验证这一方法的有效性,实验设置不采用知识增强,仅仅使用模型自身的方法 VIP - LLaVA;以及使用
了工程巡检多模态知识图谱作为增强知识的方法 VIP - LLaVA (本 VIP - LLaVA 使用了两轮次检索生
KG
KG
成迭代,即 VIP - LLaVA KG- 2 )。利用风险图像文本对测试集进行该模块有效性的检验。
3.2.2 子模块检索生成迭代轮次的有效性验证 本研究方法中另一个模块为检索生成协同迭代的方式
寻找最合适的方案,对检索生成协同迭代的轮次次数进行有效性检验。为了验证这一方法的有效性,
实验设置了采用一个轮次的文本知识增强方法 VIP - LLaVA KG - 1 ,以及两个轮次的文本加图像知识增强
方法 VIP - LLaVA 。同样使用风险图像文本对测试集进行该模块的有效性检验。
KG -2
3.2.3 第一轮次相关实体最合适数量探究 在进行第一轮次的水利知识检索时,列出相关实体的数量
对模型推荐方案的准确性及响应速度有着重要的影响。本研究分别针对这两个方面进行相关实验探
究,分别设置列出实体数量的个数为 2、3、4、5、6。针对不同的数量做准确性与响应速度的分析,
从而找出一个能够平衡准确性与响应速度的数值。此实验的方案准确性仅在指标 BLEU上进行分析。
3.3 实验结果 关于评价指标,本研究使用 BLEU、ROUGE - L和 METEOR三种 [43] ,其中,BLEU@N
表示生成方案占参考方案指定字符串长度的比例。计算公式如下。
N
∑
BLEU@N=BP· exp (w·lnp) (5)
n
n
n =1
式中:BP(BrevityPenalty - 简短惩罚)依据生成文本序号进行设置,用于惩罚生成的句子过短;p 为生
n
成文本中第 n个匹配词的数量与生成文本中连续 n个词数量的比值,n由 N界限;w 为每个 lnp 的权
n
n
重;N为指定字符串长度。
ROUGE - L基于最长公共子序列(LCS),比较生成方案和参考方案之间的重叠词汇来评估它们的
相似性。计算公式如下。
2
(1 + β)·P·R
ROUGE - L = F = (6)
β 2
β·P + R
式中:P为生成文本和参考文本的 LCS长度与生成文本长度的比值;R为生成文本和参考文本的 LCS
长度与参考文本长度的比值;β 为一个可调节的参数,用来控制 P与 R的相对权重。
METEOR在 BLEU基础上考虑了同义词、词干、词序等。计算公式如下。
10 ·P·R chunk 3
[
(
METEOR = · 1 - 0.5· ( ))] (7)
R + 9 ·P matches
式中:P为生成文本和参考文本匹配词的数量与生成文本总词数的比值;R为生成文本和参考文本匹
— 5 2 7 —