Page 44 - 2022年第53卷第9期
P. 44
图 6 真实活动标签
图 7 预处理后的数据集
3.2 机械活动状态分类识别结果 声学模块为深度卷积神经网络选择的优化器和运动学模块为 IDeep
convLSTM选择的优化器均为 Adam优化器,Adam是标准随机梯度下降优化算法的一种变体,它根据
运行平均值和最近梯度的运行方差来调整学习率以加速收敛 [46] ,初始学习率均设置为 0.001。声音模
块选取 30ms的时间帧作为输入,batchsize设置为 64,最大 epoch设置为 100,损失目标函数设置为交
叉熵;运动学模块 batchsize大小设置为 256,最大 epoch设置为 100,由于 LSTM梯度的累积在数百个
输入时间步长上展开,因此训练期间较大的权重更新会导致数值上溢或下溢,通常称为梯度爆炸( gra
dientsexploding)。为了避免此问题,采用梯度缩放和梯度剪裁来更改误差的导数,最大梯度阈值设置为
1.0,最大梯度范数设置为 1.0。模型的训练过程所采用的计算机 CPU型号信息为 Intel(R)Core(TM)i7 -
9700CPU@3.00GHz ,运行内存为 16.0GB。运动学和声学深度学习模型训练迭代曲线如图 8所示,基于
图 8 运动学与声学模型训练曲线
0
— 1 5 7 —