Page 15 - 2022年第53卷第6期
P. 15

(a) 振捣机器人振捣作业;(b) 振捣机器人振捣效果;(c) 人工振捣作业;(d) 人工振捣效果
                                            图14  振捣机器人系统与人工振捣作业效果对比
               4.3.2  机器视觉算法对比分析             对比浅层神经网络 BPNN 和其他深层 VggNet-16 及 ResNet 网络方法,
               不同方法建立的混凝土表面图像识别模型性能如图 15 所示。相比与传统神经网络 BPNN 模型,基于
               深度学习的网络模型(VggNet 和 ResNet)具有更优越的性能。对比 VggNet 和 ResNet 模型分类性能,验
               证了不同网络结构对模型性能的影响。相比于原始的 ResNet-50 模型,改进 ResNet-50 在 Precision 和
               Recall 指标上的分类平均值分别提升了 2.83% 和 3.74%。此外,相比于文献 [28] 所建立的混凝土表面
               图像分类模型,改进的 ResNet-50 通过引入 CBAM 以及全局平均池化层后,在 Precision 和 Recall 指标
               上的分类平均值分别提升了0.29%和0.43%,这表明所引入的策略可行、有效。
                                                                   [36]
                   进一步讨论模型分类准确的原因,采用 Grad-CAM                         模块对最后一个卷积输出层(即图 7 中
               Conv5_x 的输出层)的特征进行可视化分析。每一类别选取 3 张代表性图像作为分析对象,模型识别
               图像类别结果与真实标签一致,不同模型分类结果及特征可视化如图 16 所示。结果表明,图 16 中
               No.1—No.3 中模型更加关注图像表面起伏较小的泛浆区域,这符合振捣合格的图像特征;图 16 中
               No.4—No.6 中模型更加关注水泥浆液和骨料交错的区域,尤其是图 16 中 No.4 和 No.6,与振捣过程
               中骨料下沉的特征一致;图 16 中 No.7—No.9 中模型更加关注图像中有分界的区域,图 16 中 No.7 和
               No.9 较为明显,关注大骨料或者浆液少的区域。通过 Grad-CAM 可视化分析,表明模型能够有效提
               取输入图像的关键特征,一定程度上解释了所提模型实现正确分类的内在原因,验证了模型的可
               靠性。


























                                  (a)Precison指标                             (b)Recall指标
                                                  图15  不同图像识别算法对比





                                                                                                 —641 —
   10   11   12   13   14   15   16   17   18   19   20