Page 54 - 2025年第56卷第5期
P. 54
相较点预测,区间预测 [12] 能够更好地考虑不确定性问题。因此,许多学者对区间预测在异常检测
中的应用进行了研究。Mathonsi等 [13] 使用级联神经网络、LSTM、回声状态网络等多种深度学习方法
在多个数据集上进行充分的多次点预测实验,利用预测值的分布来构建预测区间进行异常检测,证明
[14]
了以深度学习区间预测的方式实现异常检测的可行性。Li 利用先验知识构建区间上下限,当传感器
的读数不在区间内时,即认为发生了异常,并构建区间差异度对无线传感器测量误差与节点异常进行
区分。Pang等 [15] 使用高斯过程回归与相关向量机实现区间预测,并对用于检测的最佳置信水平进行
了寻优,认为超出区间边界的传感器数据点为异常。余宇峰等 [16] 在水文序列中,将滑动窗口内的已知
参数用于预测下一时刻数值,并将预测值超出预测区间的值认定为异常点。水电机组工作环境复杂,
振动数据随机性强、频率高,水电机组的振动异常检测更应关注短时、连续发生的振动异常,而非单
个离群值。现有做法大多将区间的上下限作为检测异常的标准,本质上仍是对单个点的检测。而滑动
窗口已在时间序列广泛应用,本文尝试将区间预测与滑动窗口的方法应用到水电机组振动异常检测
中,实现对短时间连续发生的水电机组振动异常进行检测。
因此,本文采用直接区间估计法 [17] ,引入分位数损失函数,又称弹球损失(PinballLoss) [18] ,作
为损失函数训练模型实现区间预测,构建水电机组健康模型。结合滑动窗口与区间覆盖率,构建成动
态区间覆盖率。最终,通过受试者工作特征曲线选取最优阈值,利用置信水平、滑动窗口宽度和滑动
步长灵活调整检测力度,形成了一种动态区间覆盖方法。
2 区间预测
2.1 分位数区间预测模型 本文所用区间预测模型使用分位数损失函数,直接学习输出分布的不同分
位数以构建预测区间,只需向网络添加多个输出节点,并为每个节点设置分位数,便能同时估计多个
分位数。该方法相较传统概率区间预测方法,不需要进行大量数据统计、对误差概率分布进行先验性
假设以及复杂的计算等,更为简单、便捷。
弹球损失 [18] :
L(y,z) = { (y - z) τ y ≥z (1)
τ (z - y)(1 - τ ) y ≤z
式中:τ 为指定分位数;z为实际值;y为预测值。
2.2 区间预测评价指标
(1)预测区间覆盖率(PredictionIntervalCoverageProbability,PICP)。引入区间覆盖率来评价预测
区间的可靠性,该指标反映了实际值落在预测区间上下界内的比例。预测时,PI 应尽可能接近预设
CP
的置信水平,PI 值越大,代表预测区间内包含更多的实际值。
CP
1 N
PI = ∑ κ i (2)
CP
N i =1
式中:N为样本数;κ为布尔量,如果预测目标值在区间预测的上下限内,则 κ = 1 ,否则 κ = 0 。
( 2)预测区间平均宽度(PredictionIntervalNormalizedAverageWidth,PINAW)。引入区间平均带宽
来反映预测的清晰度,避免因单纯追求可靠性,导致预测区间过宽,失去参考意义。
1 N
PI = ∑ [U(x)-L(x)] (3)
NAW
i
i
N i =1
式中:U(x)为预测区间上限;L(x)为预测区间下限。当 PI 一定时,PI 值越小,则预测区间越
i i CP NAW
窄,预测效果越好。
3 动态区间覆盖方法
3.1 动态区间覆盖率 振动数据具有高频、随机的特性,仅依赖某个值是否超出预测区间,来判定机
— 6 0 —
0