Page 109 - 水利学报2025年第56卷第3期

P. 109

图４按时间序列划分数据集与ＭＤＵＰＬＥＸ算法划分数据集示意

图５ＬＳＴＭ网络示意

输入门能够将每个新输入单元的一部分信息存入记忆单元中，输出门能输出部分信息作为下一次
输入新信息时的短期记忆，而遗忘门能从输入的部分中选择遗忘掉部分信息。它们具体的运行模式可
用以下式子表示：
ｉ＝ σ （Ｗ ·［ｈ，ｘ］＋ｂ）（１）
ｉ
ｔ
ｔ－１
ｉ
ｔ
ｆ＝ σ （Ｗ ·［ｈ，ｘ］＋ｂ）（２）
ｔｆｔ－１ｔｆ
ｏ＝ σ （Ｗ ·［ｈ，ｘ］＋ｂ）（３）
ｔｏｔ－１ｔｏ
Ｃ＝ｆ × Ｃ＋ｉ × 珟ｔ（４）
Ｃ
ｔ
ｔ－１
ｔ
ｔ
ｈ＝ｏ× ｔａｎｈ（Ｃ）（５）
ｔ
ｔ
ｔ
Ｃ（６）
珟＝ｔａｎｈ（Ｗ ·［ｈ，ｘ］＋ｂ）
ｔｃｔ－１ｔｃ
Ｃ
式中：ｉ、ｆ、ｏ分别为输入门、遗忘门、输出门；珟为候选态，即对新信息归纳后的结果；Ｗ、Ｗ、
ｔｔｔｔｉｆ
Ｗ、Ｗ分别为连接门与输入信息之间的权重；ｂ、ｂ、ｂ、ｂ为偏置项；Ｃ为长期记忆单元，每个
ｃ
ｏ
ｔ
ｉ
ｆ
ｏ
ｃ
时刻更新长期记忆；ｈ为短期记忆单元，作为下一时刻的隐含状态输入。σ和ｔａｎｈ代表不同的激活
ｔ
函数。
本研究采用的模型包含多层ＬＳＴＭ网络，需要调试的超参为学习率和ＬＳＴＭ网络层数，使用
ＡＤＡＭ算法［２４］作为学习率方法，损失指标选择均方误差（ＭＳＥ），激活函数选择ｔａｎｈ和ｓｉｇｍｏｉｄ函数。
ＬＳＴＭ模型基于Ｐｙｔｈｏｎ中的Ｔｅｎｓｏｒｆｌｏｗ模块、Ｋｅｒａｓ模块来实现［２５］。
３．３基于ＭＤＵＰＬＥＸ－ＬＳＴＭ的水库出流模拟方法本文提出了基于ＭＤＵＰＬＥＸ数据划分方法和
ＬＳＴＭ神经网络的水库出流模拟方法———ＭＤＵＰＬＥＸ－ＬＳＴＭ。建模采用的数据包括水库日尺度入流量、
蓄水量和出流量序列等。首先，采用ＭＤＵＰＬＥＸ算法将数据集划分为率定集、验证集和测试集。设置
不同的超参（即学习率和网络层数）组合，基于不同超参组合、采用率定集数据率定得到ＬＳＴＭ中的权
重和偏置等参数，使用验证集数据选出模拟效果最优的超参组合，采用测试集数据评估ＭＤＵＰＬＥＸ－
ＬＳＴＭ的模拟效果。
在ＬＳＴＭ的输入输出方面，ＬＳＴＭ的输出变量为日尺度的水库出流量。在设置ＬＳＴＭ的输入变量
— ３９１ —

104 105 106 107 108 109 110 111 112 113 114