Page 76 - 2023年第54卷第11期
P. 76
内部,从而影响网络的输出,相比于传统的循环神经网络,LSTM 在隐藏层中加入了记忆细胞单元,
可以较好地记住较长的历史信息。
图 4 LSTM模型结构示意图 [25]
记忆细胞单元可以对输入的数据进行选择性的记忆和 表 4 LSTM设置参数表
遗忘,通过引入遗忘门、输入门、输出门,使神经网络长
参数名称 变量 设置
期传输记忆信息,LSTM结构见图 4。在本研究中,LSTM 输出层个数 Output_size 1
模型建模在 Matlab下运行,研究所使用的 LSTM及其变体 隐含层神经元数 run_unit 32
模块,均采用 Matlab(版本 R2021)框架中的 LSTM模块设 学习率 learning_rate 0.01
计。根据文献[26 - 28],当流域较小或可获取的数据量不
学习率衰减因子 decay 0.99
充足时,采用单层隐含层可获得更好的训练效率及运行
批处理量 batch_size 32
结果,因而本研究选择了 1层作为 LSTM的隐含层数。通
时间步大小 time_step 12
过试算得出,隐藏神经元个数 n = 32时可以使模型均方误
迭代更新次数 epoch 200
差最小。模型训练前,还需要确定模型的学习率、批处理
隐含层激活函数 activationFunction tanh
量参数和选代次数等参数。其中,学习率决定了模型权重
更新的幅度,但目前还缺少确定最佳学习率的最优方法。在本研究依据经验将学习率设定为 0.01,同时
将学习率衰减因子设定为 0.99,使学习率随着迭代次数增加缓慢变小,则模型收缩时震荡能得到缓解。
批处理量参数即一次输入模型中的样本个数,参照相关研究 [29 - 31] ,批处理样本数与隐含层神经元数相同
时处理效果较好,故将批处理量定为 32。epoch是参数选代更新次数,根据本研究中的数据量大小,将
epoch定为 200。LSTM主要参数设置见表 4。在本研究中,基于 WRF - Hydro的逐小时径流预报构建了逐
小时预报径流误差的历史序列,并将其作为 LSTM输入变量,以 1h为时间步长预报不同预见期下的径流
误差,最后将预测的误差序列叠加至径流预报结果中,完成耦合系统水文预报的实时校正。
3.2.2 ARMA实时校正模型 ARMA模型由自回归模型(AR模型)与移动平均模型(MA模型)为基础
“混合” 构成,是可以反映水文变量在时序变化上统计特性的数学模型。本研究针对研究流域内实测
径流量和 WRF - Hydro预报径流量之间的逐小时误差序列 {dQ(x),x = 1,2,…,t},通过构建具有
时间特征的误差序列,建立基于误差的自回归方程。设 t时刻的预报值为Q′(t),实测值为Q(t),则
dQ(x) =Q′(t) - Q(t)即为误差序列。假定误差序列具有一定的自相关性,则可以利用过去的误差预报未
来的误差。ARMA(p,q)的结构取决于阶数 p和 q。在本研究流域,已有相关研究表明当 p = 3 ,q = 1 时可
以取得较好的校正效果 [17] ,因此,本研究选用 ARMA(3,1)模型对耦合系统的预报径流过程进行实时校正。
3.3 评价指标 利用纳什效率系数(NSE)、均方根误差(RMSE)、洪峰流量的相对误差(R)、洪量的
f
相对误差( R)以及峰现时间绝对误差(T)对 WRF - Hydro模拟的径流量进行评估。对于评价指标,NSE
v
用以验证水文模式模拟结果的可信程度。RMSE用来衡量预报值同观测值之间的偏差。R 为洪峰的相
f
对误差,反映模拟洪峰的可信程度,R 为洪量的相对误差,反映模拟洪量的可信程度。T为实际峰现
v
时间和预报峰现时间的时差,用于表示峰现时间预报的误差。
3
— 1 3 8 —