Page 6 - 2023年第54卷第8期
P. 6

络构建了深度学习概率预报模型               [8,14 - 16] 。混合密度网络(MDN)是一种可以估计目标变量条件概率分布
              的神经网络。MDN将神经网络与混合密度函数相结合,借助神经网络生成多个核函数的权重和参数,
              将核函数按照权重相加组合为混合密度函数,理论上可以表示任意条件概率分布                                      [15] ,在能源、气象等
              领域获得广泛关注         [19 - 21] ,其损失函数依据最大似然估计法构建              [19] 。当前,多数深度学习概率预报研
              究主要集中在单个时间步长的概率预报中,无法在考虑预报洪水过程时间相关性的前提下获得不确定
              性估计,缺乏可解释性和适用性。因此,有必要开展基于混合深度学习模型的多时段洪水过程概率预
              报研究,实现实时量化预报洪水过程的不确定性,为水库防洪调度等决策提供更多的风险信息。
                  本文首先将 XAJ模型的预报流量过程嵌入 XAJ - LSTM- EDE模型的解码过程;其次,将 MDN耦合
              至 XAJ - LSTM- EDE模型解码过程的输出层以实现概率分布转换,构建 XAJ - LSTM- EDE - MDN混合深
              度学习模型;最后,依据最大似然估计法构建损失函数,以优化 XAJ - LSTM- EDE - MDN模型的权重等
              参数。本文以陆水和建溪两个流域为案例,对 XAJ - LSTM、XAJ - LSTM- EDE和 XAJ - LSTM- EDE - MDN
              模型进行对比验证,并分析了所提模型的不确定性量化性能。


              2 研究方法


              2.1 XAJ - LSTM 模型 长短期记忆(LSTM)神经网络由遗忘门、输入门、更新记忆单元状态和输出
              门等 4个计算结构构成。XAJ - LSTM模型结构见图 1(a)。XAJ - LSTM模型是将 XAJ模型的预报流量作
              为 LSTM神经网络在预报时刻的输入。其中,XAJ模型参数率定方法和结果见文献[11]。XAJ模型预
              报流量与目标输出变量(即每一预见期对应的实测流量)有较强的相关性,因此期望其可引导神经网络
              产生较合理的预报流量过程。同时,XAJ模型预报流量增加了模型输入数量,可在一定程度上缓解过拟
              合问题。XAJ - LSTM模型为单输出结构(与文献[3]相似),未在时间维度上考虑预报洪水间的相关性。
              2.2 XAJ - LSTM- EDE模型 基于外源输入编码- 解码结构的 XAJ - LSTM - EDE模型由编码过程(图 1(b) -
              (1))和解码过程(图 1(b) - (2))构成。为克服传统递归编码 - 解码结构的曝光偏差问题,将 XAJ模型
              的预报流量过程与解码过程相耦合(图 1(b) - (2)虚线框),以替代解码中的递归过程,使得解码过程
              的输入始终为编码过程提取的重要信息(即图 1(b) - (2)中的中间向量 C)和 XAJ模型的预报流量。
              XAJ - LSTM- EDE模型可以在考虑输出变量时间相关性的前提下,实时预报多时段洪水过程,相对 XAJ -
              LSTM模型更具可解释性和适用性。XAJ - LSTM- EDE模型未考虑预见期内预报降雨数据,为保持输入
              变量一致,XAJ - LSTM模型同样未考虑预报降雨数据,即 P                          ~P    为 0mm。
                                                                    t + m + 1  t + m + n
              2.3 混合深度学习模型 本文将 MDN耦合至 XAJ - LSTM- EDE模型解码过程的输出层,即将 XAJ -
              LSTM- EDE模型解码过程隐含层输出 X作为混合密度网络(MDN)的输入,增加了概率预报过程(图 1
              (b) - (3)),从而构建 XAJ - LSTM- EDE - MDN混合深度学习模型。该模型可以在考虑输出变量时间相
              关性的前提下,将解码过程产生的点估计转化为概率分布估计,能够反映预报过程的不确定性,提供
              更多的风险信息。
                  XAJ - LSTM- EDE - MDN模型输出多个核函数的权重 w和参数 θ ,其中 w通过 Softmax函数进行归
              一化,以确保核函数形成有效的分布函数,其他输出值可通过适当的函数处理(如指数函数),以确保
              其值在规定范围内。洪水预报序列一般为一维时间序列,给定 XAJ - LSTM- EDE模型隐含层输出 X时,
              目标变量 Y的条件概率密度函数 f(Y θ ,X)为
                                                           m
                                               f(Y θ ,X) = ∑  w(X) φ i (Y X)                            (1)
                                                              i
                                                          i =1
                                                               m
                                                    0 w1,   ∑  w= 1                                   (2)
                                                        i         i
                                                              i =1
                                                                      w
                                                                exp (Y)
                                                                      i
                                                           w
                                               w= softmax(Y) =                                          (3)
                                                i          i    m
                                                                       w
                                                               ∑  exp(Y)
                                                                       j
                                                               j =1
                     0
                —  8 9  —
   1   2   3   4   5   6   7   8   9   10   11