Page 6 - 2023年第54卷第8期
P. 6
络构建了深度学习概率预报模型 [8,14 - 16] 。混合密度网络(MDN)是一种可以估计目标变量条件概率分布
的神经网络。MDN将神经网络与混合密度函数相结合,借助神经网络生成多个核函数的权重和参数,
将核函数按照权重相加组合为混合密度函数,理论上可以表示任意条件概率分布 [15] ,在能源、气象等
领域获得广泛关注 [19 - 21] ,其损失函数依据最大似然估计法构建 [19] 。当前,多数深度学习概率预报研
究主要集中在单个时间步长的概率预报中,无法在考虑预报洪水过程时间相关性的前提下获得不确定
性估计,缺乏可解释性和适用性。因此,有必要开展基于混合深度学习模型的多时段洪水过程概率预
报研究,实现实时量化预报洪水过程的不确定性,为水库防洪调度等决策提供更多的风险信息。
本文首先将 XAJ模型的预报流量过程嵌入 XAJ - LSTM- EDE模型的解码过程;其次,将 MDN耦合
至 XAJ - LSTM- EDE模型解码过程的输出层以实现概率分布转换,构建 XAJ - LSTM- EDE - MDN混合深
度学习模型;最后,依据最大似然估计法构建损失函数,以优化 XAJ - LSTM- EDE - MDN模型的权重等
参数。本文以陆水和建溪两个流域为案例,对 XAJ - LSTM、XAJ - LSTM- EDE和 XAJ - LSTM- EDE - MDN
模型进行对比验证,并分析了所提模型的不确定性量化性能。
2 研究方法
2.1 XAJ - LSTM 模型 长短期记忆(LSTM)神经网络由遗忘门、输入门、更新记忆单元状态和输出
门等 4个计算结构构成。XAJ - LSTM模型结构见图 1(a)。XAJ - LSTM模型是将 XAJ模型的预报流量作
为 LSTM神经网络在预报时刻的输入。其中,XAJ模型参数率定方法和结果见文献[11]。XAJ模型预
报流量与目标输出变量(即每一预见期对应的实测流量)有较强的相关性,因此期望其可引导神经网络
产生较合理的预报流量过程。同时,XAJ模型预报流量增加了模型输入数量,可在一定程度上缓解过拟
合问题。XAJ - LSTM模型为单输出结构(与文献[3]相似),未在时间维度上考虑预报洪水间的相关性。
2.2 XAJ - LSTM- EDE模型 基于外源输入编码- 解码结构的 XAJ - LSTM - EDE模型由编码过程(图 1(b) -
(1))和解码过程(图 1(b) - (2))构成。为克服传统递归编码 - 解码结构的曝光偏差问题,将 XAJ模型
的预报流量过程与解码过程相耦合(图 1(b) - (2)虚线框),以替代解码中的递归过程,使得解码过程
的输入始终为编码过程提取的重要信息(即图 1(b) - (2)中的中间向量 C)和 XAJ模型的预报流量。
XAJ - LSTM- EDE模型可以在考虑输出变量时间相关性的前提下,实时预报多时段洪水过程,相对 XAJ -
LSTM模型更具可解释性和适用性。XAJ - LSTM- EDE模型未考虑预见期内预报降雨数据,为保持输入
变量一致,XAJ - LSTM模型同样未考虑预报降雨数据,即 P ~P 为 0mm。
t + m + 1 t + m + n
2.3 混合深度学习模型 本文将 MDN耦合至 XAJ - LSTM- EDE模型解码过程的输出层,即将 XAJ -
LSTM- EDE模型解码过程隐含层输出 X作为混合密度网络(MDN)的输入,增加了概率预报过程(图 1
(b) - (3)),从而构建 XAJ - LSTM- EDE - MDN混合深度学习模型。该模型可以在考虑输出变量时间相
关性的前提下,将解码过程产生的点估计转化为概率分布估计,能够反映预报过程的不确定性,提供
更多的风险信息。
XAJ - LSTM- EDE - MDN模型输出多个核函数的权重 w和参数 θ ,其中 w通过 Softmax函数进行归
一化,以确保核函数形成有效的分布函数,其他输出值可通过适当的函数处理(如指数函数),以确保
其值在规定范围内。洪水预报序列一般为一维时间序列,给定 XAJ - LSTM- EDE模型隐含层输出 X时,
目标变量 Y的条件概率密度函数 f(Y θ ,X)为
m
f(Y θ ,X) = ∑ w(X) φ i (Y X) (1)
i
i =1
m
0 w1, ∑ w= 1 (2)
i i
i =1
w
exp (Y)
i
w
w= softmax(Y) = (3)
i i m
w
∑ exp(Y)
j
j =1
0
— 8 9 —