Page 76 - 2023年第54卷第1期
P. 76

多目标问题转化 为 单 目 标 进 行 求 解,该 方 法 称 为 基 于 惩 罚 因 子 的 动 态 规 划 逐 次 逼 近 法 (theDPSA
              BasedonCombinationofPenaltyFactors ,即 CPF - DPSA)。其计算流程与 DPSA大体一致,但需做如
              下处理:
                  (1)DP状态转移方程。在计算初始调度线时,DP顺序递推算法的寻优递推方程为:
                                          
                                                            
                                         f(t + 1 ,k) = max (f(t,j) + E(t,j,k))                         (10)
                                          i                 i        i
                                                     j = 1~ L i,t
                                                                          
              式中:L 为第 i水库 t时段初状态(库蓄水量或水位)离散个数;f(t + 1,k)为第 i水库 t时段末处于
                      i,t                                                 i
              第 k个状态时,第 i水库 1~t时段总的最优发电量,kW·h;E(t,j,k)为第 i水库 t时段初处于第 j状
                                                                      i
              态、时段末处于第 k状态时,第 t时段的发电量,kW·h。
                  在迭代计算时,使用 DPSA算法的寻优递推方程为:
                                           
                         
                         f(t + 1 ,k) = max (f(t,j) + E(t,j,k) +   ∑    E other,l (t) - oR(t) - oR(t))  (11)
                         i
                                           i
                                                     i
                                                                                         2 2
                                                                                 1 1
                                     j = 1~L i,t
                                                                l =1~I,l ≠i
              式中:E    other,l (t)为 t时段除 i以外的其他水电站在原先调度线上,运行状态不改变情况下计算所得的发
              电量,由于当前时段 i水电站的不同决策会影响出库流量,故而下游所有水电站同时刻都会受到影响,
              上游若受回水顶托也会有所影响,因而在寻优时考虑该项;o、o为对应于目标 f、f的惩罚因子,取
                                                                      1  2              2  3
              非负数;R(t)、R(t)为 t时段对于目标 f、f的惩罚基本量,可应用不同的惩罚策略:
                        1      2                    2   3
                  ①线性型。可认为每一时段对应目标的破坏是不等价的,考虑计算值与基本量的不足程度,表示
              为线性变化,如对最小出力的惩罚,可采用如下线性公式计算:
                                                 R(t) =N - N(t) t = 1~ T                               (12)
                                                  1      d  S
              式中: N 为高于 N      min 的设计值,依此判断本时刻梯级总出力 N(t)的基本惩罚量。
                                                                       S
                     d
                  ②非线性型。可认为每一时段对应目标的破坏是不等价的,依据计算值与基本量的不足程度来评
              判惩罚量级,不足程度越大,惩罚力度越大,表示为非线性变化,如对最小出力的惩罚,也可采用如
              下指数型惩罚公式计算:
                                            R(t) =a N(t)?N d × (N - N(t)) t = 1~ T                     (13)
                                              1
                                                             d
              式中 a为底数,根据实际情况取适当值。
                  ③常数型。可认为每一时段目标的破坏是等价的,不考虑破坏深度,如对生态目标,其惩罚基本
              量可以常数的形式表示:
                                                       R(t) = ψ (t)                                    (14)
                                                        2
                  ( 2)惩罚因子(o,o)取值。一般地,一组惩罚因子有可能得到一个多目标的非劣解,为了获得
                                1   2
              分布较为均匀、广泛、真正的非劣解集,必须对( o,o)的影响范围和离散宽度做出判断。惩罚因子
                                                            1   2
              代入 CPF - DPSA时分两阶段策略:
                  第一阶段:惩罚因子影响范围探测:
                  ①点绘 f - o、f - o曲线;
                                3
                             1
                          2
                                   2
                  ②考查曲线变化趋势,分析排除接近于无影响区域得到惩罚因子的影响范围区间 S和 S,保证在
                                                                                             1
                                                                                                  2
              有效范围内确定因子取值;
                  ③在 S和 S中,根据目标随因子变化的梯度选取因子离散值:在变化剧烈处可多选点,在变化平
                        1
                             2
              缓处适量减少选点,得到相应的惩罚因子取值范围集合 s和 s,对应元素个数为 d和 d。
                                                                  1   2                  1    2
                  第二阶段:组合 s和 s得到数量为 d× d的取值空间,对组合中的每 一个 元素 逐 个 代入 CPF -
                                       2
                                                        2
                                                     1
                                   1
              DPSA求解非劣解,经过多目标筛选后得到非劣解集。
                  CPF - DPSA算法的流程图以及梯级水库群多目标优化调度问题求解思路如图 1和图 2所示。
              3.3 评价指标  在分析所得非劣解集的优劣时,需 考虑 其收 敛 性 和分 布的 多样 性,并与 其 他算法
              比较  [30] 。
                  ( 1)采用超体积指标        [19] (HV)来衡量个体所支配的空间,以综合评估解集 A的收敛性和多样性:


                                                                                                 —  7 1 —
   71   72   73   74   75   76   77   78   79   80   81