Page 108 - 水利学报2025年第56卷第3期
P. 108
出流和入流有一定的相关性,呈现出不完全年调节水库的特点。受上游龙羊峡水库出流的影响,相比
2007年至 2017年,2018年至 2020年刘家峡水库入库流量显著增加,出库流量也相应大幅增加。
图 2 龙羊峡水库 2007—2022年运行情况
图 3 刘家峡水库 2007—2020年运行情况
3 研究方法
3.1 MDUPLEX算法 MDUPLEX算法由 DUPLEX算法 [7] 改进得来。DUPLEX首先计算了数据集中
的各数据点的欧几里得距离,距离越大说明了两个数据点的特征差异也越大;再从距离最大的两点开
始,逐渐缩小采样距离,把数据点成对交替分配到率定集和验证集中。但 DUPLEX会严格按照比例划
分数据集,当某个数据集数量饱和时,其他数据点会自动分配到其余数据集。对于率定集大于验证集
的情况,大量正常或不太极端的数据点会分配到更大的率定集。这会使模型参数率定偏向于正常事
件,导致模型在极端事件下的模拟性能相对较差。
MDUPLEX算法有效解决了这一问题,首先将数据集中的所有数据分配到不同的采样池中,然后
在每个采样池中应用 DUPLEX数据分区的方法。于是在 MDUPLEX算法的数据划分中,执行了多次率
定集与验证集的分 配,减 小了只 执行 一次 分配 带 来 的 偏 差。图 4显 示 了 按 时 间 序 列 划 分 数 据 集 与
MDUPLEX算法划分数据集的对比。
3.2 LSTM 神经网络 长短期记忆网络是一种特殊的循环神经网络(RNN) [24] 。LSTM 能够学习长期
依赖关系,也就是在一个序列中前面的信息如何影响后面的信息,适合用于时间序列模拟。LSTM 通
过一种 “门控机制” 的结构来实现长期依赖,将包含门的内部处理单元作为记忆模块,实现了序列信
息的有效存储和更新。这些门控单元包括输入门、输出门、遗忘门,其循环结构和记忆模块示意见
图 5。
— 3 9 —
0