Page 76 - 2023年第54卷第1期
P. 76
多目标问题转化 为 单 目 标 进 行 求 解,该 方 法 称 为 基 于 惩 罚 因 子 的 动 态 规 划 逐 次 逼 近 法 (theDPSA
BasedonCombinationofPenaltyFactors ,即 CPF - DPSA)。其计算流程与 DPSA大体一致,但需做如
下处理:
(1)DP状态转移方程。在计算初始调度线时,DP顺序递推算法的寻优递推方程为:
f(t + 1 ,k) = max (f(t,j) + E(t,j,k)) (10)
i i i
j = 1~ L i,t
式中:L 为第 i水库 t时段初状态(库蓄水量或水位)离散个数;f(t + 1,k)为第 i水库 t时段末处于
i,t i
第 k个状态时,第 i水库 1~t时段总的最优发电量,kW·h;E(t,j,k)为第 i水库 t时段初处于第 j状
i
态、时段末处于第 k状态时,第 t时段的发电量,kW·h。
在迭代计算时,使用 DPSA算法的寻优递推方程为:
f(t + 1 ,k) = max (f(t,j) + E(t,j,k) + ∑ E other,l (t) - oR(t) - oR(t)) (11)
i
i
i
2 2
1 1
j = 1~L i,t
l =1~I,l ≠i
式中:E other,l (t)为 t时段除 i以外的其他水电站在原先调度线上,运行状态不改变情况下计算所得的发
电量,由于当前时段 i水电站的不同决策会影响出库流量,故而下游所有水电站同时刻都会受到影响,
上游若受回水顶托也会有所影响,因而在寻优时考虑该项;o、o为对应于目标 f、f的惩罚因子,取
1 2 2 3
非负数;R(t)、R(t)为 t时段对于目标 f、f的惩罚基本量,可应用不同的惩罚策略:
1 2 2 3
①线性型。可认为每一时段对应目标的破坏是不等价的,考虑计算值与基本量的不足程度,表示
为线性变化,如对最小出力的惩罚,可采用如下线性公式计算:
R(t) =N - N(t) t = 1~ T (12)
1 d S
式中: N 为高于 N min 的设计值,依此判断本时刻梯级总出力 N(t)的基本惩罚量。
S
d
②非线性型。可认为每一时段对应目标的破坏是不等价的,依据计算值与基本量的不足程度来评
判惩罚量级,不足程度越大,惩罚力度越大,表示为非线性变化,如对最小出力的惩罚,也可采用如
下指数型惩罚公式计算:
R(t) =a N(t)?N d × (N - N(t)) t = 1~ T (13)
1
d
式中 a为底数,根据实际情况取适当值。
③常数型。可认为每一时段目标的破坏是等价的,不考虑破坏深度,如对生态目标,其惩罚基本
量可以常数的形式表示:
R(t) = ψ (t) (14)
2
( 2)惩罚因子(o,o)取值。一般地,一组惩罚因子有可能得到一个多目标的非劣解,为了获得
1 2
分布较为均匀、广泛、真正的非劣解集,必须对( o,o)的影响范围和离散宽度做出判断。惩罚因子
1 2
代入 CPF - DPSA时分两阶段策略:
第一阶段:惩罚因子影响范围探测:
①点绘 f - o、f - o曲线;
3
1
2
2
②考查曲线变化趋势,分析排除接近于无影响区域得到惩罚因子的影响范围区间 S和 S,保证在
1
2
有效范围内确定因子取值;
③在 S和 S中,根据目标随因子变化的梯度选取因子离散值:在变化剧烈处可多选点,在变化平
1
2
缓处适量减少选点,得到相应的惩罚因子取值范围集合 s和 s,对应元素个数为 d和 d。
1 2 1 2
第二阶段:组合 s和 s得到数量为 d× d的取值空间,对组合中的每 一个 元素 逐 个 代入 CPF -
2
2
1
1
DPSA求解非劣解,经过多目标筛选后得到非劣解集。
CPF - DPSA算法的流程图以及梯级水库群多目标优化调度问题求解思路如图 1和图 2所示。
3.3 评价指标 在分析所得非劣解集的优劣时,需 考虑 其收 敛 性 和分 布的 多样 性,并与 其 他算法
比较 [30] 。
( 1)采用超体积指标 [19] (HV)来衡量个体所支配的空间,以综合评估解集 A的收敛性和多样性:
— 7 1 —