Page 57 - 2025年第56卷第5期
P. 57
式中:TP为真阳性(TruePositives,即正确识别的阳性样本);FN为假阴性(FalseNegatives,即错误
识别为阴性的阳性样本)。
(2)假阳性率(FPR)。在所有实际为阴性的样本中,错误地被识别为阳性的比例。其计算公式:
FP
FPR = (9)
FP + TN
式中:FP为假阳性(FalsePositives,即错误识别为阳性的阴性样本);TN为真阴性 (TrueNegatives,
即正确识别的阴性样本)。
(3)受试者工作特征曲线(ROCCurve)与 AUC值。ROC曲线是一个展示 TPR和 FPR关系的图形化
工具。曲线越贴近左上角,表示模型的性能越好。曲线下的面积称为 AUC值:
1
∫
AUC= TPRdFPR (10)
0
AUC值越接近 1,表示模型的分类性能越好。AUC = 1 ,是完美分类器;AUC = (0.85,0.95],效果
较好;AUC = (0.7,0.85],效果一般;AUC = (0.5,0.7],效果较差;AUC = 0.5,随机猜测相同,没有
预测价值;AUC<0.5,比随机猜测还差,但总是反向预测可以优于随机猜测。
3.4 水电机组振动异常动态区间覆盖检测方法 本文提出的采用动态区间覆盖的水电机组振动异常检
测方法流程如图 4所示,具体步骤如下。
图 4 动态区间覆盖方法
步骤一:离线阶段,首先使用历史健康数据来训练区间预测模型。
步骤二:计算测试集数据动态区间覆盖率,使用 ROC曲线选取不同的参数组合,即置信水平、
阈值、滑动窗口的宽度、滑动窗口的滑动步长。
步骤三:在线阶段,接收实时数据流,并对每个数据点进行单步区间预测,从而生成实时的预测区间。
步骤四:计算动态区间覆盖率,判断当前窗口是否异常。若为异常,则记录异常信息;否则,继
续下一个窗口的预测和评估。
步骤五:根据实际情况通过调整参数来调整检测力度。
4 案例分析
4.1 案例一:健康水电机组异常模拟
4.1.1 数据来源与实验设计 数据来自国内某电厂 2号机组,为 248MW 混流式机组。数据为其 2022
— 6 0 3 —