Page 59 - 水利学报2025年第56卷第3期
P. 59
水 利 学 报
2025年 3月 SHUILI XUEBAO 第 56卷 第 3期
文章编号:0559 - 9350(2025)03 - 0341 - 13
面向水利防汛抢险的知识图谱构建与应用
2
张栋梁 1,2 ,周 伟 1,2,3 ,马 刚 1,2,3 ,王旭东 ,刘 禹 1,2 ,王小毛 1,2,4
(1.武汉大学 水工程科学研究院,湖北 武汉 430072;2.武汉大学 水资源工程与调度全国重点实验室,湖北 武汉 430072;
3.武汉大学 水工岩石力学教育部重点实验室,湖北 武汉 430072;4.长江设计集团有限公司,湖北 武汉 430010)
摘要:知识平台是数字孪生水利的重要组成部分,而水利知识分散在多源文本中,具有显著的非结构化与碎片化
特征,知识提取与有效利用面临挑战。本文以水利防汛抢险文本为对象,针对领域数据质量偏低、知识利用率不
足问题,改进知识抽取模型、融合外源数据,提出了联合非结构化与半结构化数据的防汛抢险知识图谱智能构建
方法。首先利用大语言模型提取非结构化文本术语,解析术语主题构建本体模型。采用预训练模块强化文本表示
特征,引入卷积模块改进实体知识抽取模型,提出实体数据增强方法提升知识抽取准确率。然后抽取外源百科数
据扩充知识面,构建了更完备的防汛抢险知识图谱。文本试验显示,所提模型实体知识抽取 F1值为 89.91%,明
显优于基线模型。最后介绍了知识图谱在防汛抢险领域的应用方式,可形成数字孪生水利建设的知识引擎,为防
汛研判与决策提供知识支撑。
关键词:防汛抢险;知识图谱;知识抽取;多源数据;数字孪生
文献标识码:A
中图分类号:TV698.2 doi:10.13243?j.cnki.slxb.20240268
1 研究背景
智慧水利建设是推动新阶段水利高质量发展的六条路径之一,数字孪生是实现传统水利业务与现
代信息技术融合发展的智慧水利实施措施 [1] 。数字孪生平台主要包括数据底板、模型平台与知识平台
三部分,其中知识平台尚处于起步阶段,缺乏可借鉴的成功经验 [2] 。这是由于水利行业知识散乱分布
在标准规范、技术手册、论文专著、网络百科等处,碎片化与非结构化特征显著 [3 - 4] 。非结构化文本
内容关联性差、知识体系性弱,分散的知识易形成互不连通的知识孤岛,对水利知识快速检索与利用
带来了巨大阻碍 [5] 。尤其是对时效性要求较高的突发事件,例如水利防汛抢险,知识碎片化与非结构
化的影响更为显著,制约数字孪生水利高质量发展。
知识图谱是一种通用语义知识描述框架,具有强大的知识组织、更新维护和表达能力 [6 - 7] 。领域
知识图谱通过领域概念、实体、关系等要素表示专业知识及其关联,可辅助特定领域展开知识检索与
决策支持,已在防火策略分析 [8] 、医疗药物推荐 [9] 、智慧城市建设 [10] 、工业故障诊断 [11] 等领域成功
应用。针对水利行业知识结构化程度低、碎片化程度高、知识利用困难的现状,利用知识图谱技术构
建水利知识平台,利用其语义组织框架将水利知识关联和涉水对象规律等作为数字孪生水利的知识支
撑,可高效实现知识关联检索、抢险措施查询、调度方案编制等多种水利业务智能化应用,以促进水
利智能化管理与决策发展进程。
水利领域知识图谱的研究与应用处于起步阶段,学者们正在探索领域知识智能组织与重用路径。
收稿日期:2024 - 05 - 09;网络首发日期:2024 - 11 - 07
网络首发地址:https:??kns.cnki.net?urlid?11.1882.TV.20241107.0913.001
基金项目:国家重点研发计划课题(2022YFC3005505);国家自然科学基金项目(52322907,52179141,U23B20149);中央高校基
本科研业务费专项项目( 2042024kf1031,2042023kfyq03)
作者简介:张栋梁( 1998 - ),博士生,主要从事水利信息挖掘与知识应用研究。E - mail:dl_zhang@whu.edu.cn
通信作者:周伟(1975 - ),教授,博士生导师,主要从事流域库岸变形监测新技术与信息管理研究。E - mail:zw_mxx@whu.edu.cn
— 3 4 1 —