Page 108 - 2025年第56卷第5期
P. 108
图 8 时空动态知识图谱本体设计
(2)知识抽取:构建图谱所涉及的相关信息,主要分为关系型数据库存储(实测的流量、水位及分
水量等)、计算提取所得(描述场景特征的分类因子 x —x 等)、通过模拟软件所得(表 2)与文档形式存
1 14
储(规划断面数据、水工建筑信息与渠段糙率数据等)。将这些数据进行实体识别,属性抽取,关系抽
取,最终得到三元组形式的知识,共得实体 3556 个,关系 11 500 个,属性 21 226 个。
(3)知识存储与更新:本研究选择 Neo4j 图数据库的导入精灵界面进行知识存储与更新管理。
4 结果与讨论
4.1 结果
(1)场景分类结果:采用 DBSCAN-RF 分类算法进行调度场景分类研究,分类算法的精度较高,
DBSCAN 聚类算法轮廓系数为 0.8341,RF 分类算法准确率为 95.47%。
(2)图谱构建结果:结合工程运行情况与实际需求进行图谱本体设计,划分实体 8 类,包括泵站、
分水口、闸门、断面、场景、时刻、调度模式与调度建议;关系 5 类,包括位于(位置关系)、包含、
时刻(时序关系)、实例与采取(调度建议)关系。经实体识别、属性抽取与关系抽取,最终得到三元组
形式的知识,共得实体 3556 个,关系 11 500 个,属性 21 226 个,其中描述时空状态变化的实体 2652
个、属性 21 216 个。
(3)辅助决策效果:辅助决策功能大致包括图谱可视化、知识检索、知识更新与调度建议提供。
a)图谱可视化:图 9 示例了图谱可视化效果,可以查询各时刻下淮河滩地分水口与引黄济峡分水
图 9 知识图谱可视化示例
— 654 —