Page 109 - 水利学报2025年第56卷第4期
P. 109

图 7 迭代检索- 生成框架

              3.2.1 子模块领域多模态知识图谱增强的有效性 本研究方法的一个模块是使用工程巡检多模态知识
              图谱作为增强知识,让模型在回答前先进行知识的查询,以便于针对特定的风险问题进行回复。为了
              验证这一方法的有效性,实验设置不采用知识增强,仅仅使用模型自身的方法 VIP - LLaVA;以及使用
              了工程巡检多模态知识图谱作为增强知识的方法 VIP - LLaVA (本 VIP - LLaVA 使用了两轮次检索生
                                                                      KG
                                                                                      KG
              成迭代,即 VIP - LLaVA     KG- 2 )。利用风险图像文本对测试集进行该模块有效性的检验。
              3.2.2 子模块检索生成迭代轮次的有效性验证 本研究方法中另一个模块为检索生成协同迭代的方式
              寻找最合适的方案,对检索生成协同迭代的轮次次数进行有效性检验。为了验证这一方法的有效性,
              实验设置了采用一个轮次的文本知识增强方法 VIP - LLaVA                     KG - 1 ,以及两个轮次的文本加图像知识增强
              方法 VIP - LLaVA     。同样使用风险图像文本对测试集进行该模块的有效性检验。
                             KG -2
              3.2.3 第一轮次相关实体最合适数量探究 在进行第一轮次的水利知识检索时,列出相关实体的数量
              对模型推荐方案的准确性及响应速度有着重要的影响。本研究分别针对这两个方面进行相关实验探
              究,分别设置列出实体数量的个数为 2、3、4、5、6。针对不同的数量做准确性与响应速度的分析,
              从而找出一个能够平衡准确性与响应速度的数值。此实验的方案准确性仅在指标 BLEU上进行分析。
              3.3 实验结果 关于评价指标,本研究使用 BLEU、ROUGE - L和 METEOR三种                            [43] ,其中,BLEU@N
              表示生成方案占参考方案指定字符串长度的比例。计算公式如下。
                                                                N
                                                               ∑
                                            BLEU@N=BP· exp        (w·lnp)                               (5)
                                                                          n
                                                                     n
                                                               n =1
              式中:BP(BrevityPenalty - 简短惩罚)依据生成文本序号进行设置,用于惩罚生成的句子过短;p 为生
                                                                                                      n
              成文本中第 n个匹配词的数量与生成文本中连续 n个词数量的比值,n由 N界限;w 为每个 lnp 的权
                                                                                                      n
                                                                                           n
              重;N为指定字符串长度。
                  ROUGE - L基于最长公共子序列(LCS),比较生成方案和参考方案之间的重叠词汇来评估它们的
              相似性。计算公式如下。
                                                                  2
                                                             (1 + β)·P·R
                                               ROUGE - L = F =                                          (6)
                                                           β     2
                                                                β·P + R
              式中:P为生成文本和参考文本的 LCS长度与生成文本长度的比值;R为生成文本和参考文本的 LCS
              长度与参考文本长度的比值;β 为一个可调节的参数,用来控制 P与 R的相对权重。
                  METEOR在 BLEU基础上考虑了同义词、词干、词序等。计算公式如下。
                                                 10 ·P·R               chunk  3
                                                            [
                                                                (
                                       METEOR =           · 1 - 0.5·  (      ))]                        (7)
                                                  R + 9 ·P             matches
              式中:P为生成文本和参考文本匹配词的数量与生成文本总词数的比值;R为生成文本和参考文本匹
                                                                                                —  5 2 7 —
   104   105   106   107   108   109   110   111   112   113   114