Page 110 - 水利学报2025年第56卷第4期
P. 110
配词的数量与参考文本总词数的比值;chunk为生成文本和参考文本匹配词的数量;matches为匹配词
的数量。
对实验设置小节设置的模块进行验证,模块实验结果见表 4。
表 4 模块实验结果
模型 BLEU@3 ROUGE - L METEOR
VIP - LLaVA 0.326 0.098 0.232
0.503 0.135 0.402
VIP - LLaVA KG - 1
0.566 0.169 0.449
VIP - LLaVA KG - 2
由表 4所示,使用了水利多模态知识图谱增强的 VIP - LLaVA 方 表 5 实体数量分析
KG - 2
法在三种指标上都要高于未使用知识增强的 VIP - LLaVA方法,从而验 数量 BLEU@3 响应时间?s
证了实验设置小节中领域多模态知识图谱作为知识增强的有效性;同
2 0.412 2.2
时,使用了文本加图像知识两个轮次检索生成迭代的 VIP - LLaVA 方
KG - 2 3 0.453 3.9
法在三种指标上都要略高于仅使用了文本知识一个轮次检索生成迭代
4 0.566 4.7
的 VIP - LLaVA KG - 1 方法,同样验证了实验设置小节中检索生成迭代轮 5 0.569 6.8
次的有效性。
6 0.572 7.3
由表 5所示,如果将实体数量设置为 4,较之数量 2、3在评价指
标 BLEU@3上有着明显的提升,较之数量 5、6在评价指标 BLEU@3上准确性基本没有降低;同时,
在响应速度上,实体数量设置为 4的响应时间适中。最终,综合平衡准确性与响应时间,将实体数量
设置为 4最为合适。
4 结论
南水北调工程运行中的风险知识通常分散于多源异构的巡检文档中,为充分利用其中包含的自然
文本和图像两种模态数据,文中以多模态知识图谱集合各种模态数据,以多模态大模型为基础,做南
水北调工程风险应对决策推荐,进行巡检知识复用,主要贡献有以下 3点:(1)首次选用可着重关注
局部特征的开源多模态预训练模型 VIP - LLaVA,侧重于工程局部风险区域进行有效理解与分析;(2)基
于南水北调工程巡检数据,构建领域多模态知识图谱,对水利领域知识进行明确且格式化管理;( 3)通
过多模态知识图谱与大模型检索生成协同迭代的方式寻找应对风险的最佳方案。经实验验证了本文方
法的有效性,未来将探索更多处理多模态数据的技术,以更好地利用各种模态的数据源,并且将深入
研究更新和维护知识图谱的策略,以及其他相关技术和方法,以提高南水北调工程巡检文本的利用
率,更好地保证南水北调工程稳定运行,为水利工程行业的发展做出更大的贡献。
参 考 文 献:
[ 1] 欧阳文宇,叶磊,顾学志,等.深度学习水文预报研究进展综述 II———研究进展及展望[J].南水北调与
水利科技 (中英文),2022,20(5):862 - 875.
[ 2] 褚钰,付景保,朱九龙.基于图模型的南水北调中线水源地生态环境多主体治理冲突分析[J].南水北调
与水利科技 (中英文),2023,20(6):1179 - 1187.
[ 3] TANGS,ZHUY,YUAN S.Intelligentfaultdiagnosisofhydraulicpistonpumpbasedondeeplearningand
Bayesianoptimization [J].ISAtransactions,2022,129:555 - 563.
[ 4] 刘雪梅,卢汉康,李海瑞,等.知识驱动的水利工程应急方案智能生成方法—以南水北调中线工程为例
[ J].水利学报,2023,54(6):666 - 676.
[ 5] 马恒志,钱育蓉,冷洪勇,等.知识图谱嵌入研究进展综述[J].计算机工程,2025,51(2):18 - 34.
[ 6] 张天成,田雪,孙相会,等.知识图谱嵌入技术研究综述[J].软件学报,2023,34(1):277 - 311.
8
— 5 2 —