摘要
针对传统轴承故障诊断模型学习关键故障特征能力不足,且在噪声干扰下诊断精度受限的问题,提出了一种多分支多尺度卷积神经网络结合通道注意力(MBSACNN)的故障诊断方法。该方法采用多通道多输入的方式弥补传统模型只能分析单一维度故障特征信息的不足;进行连续小波变换将样本转化为时频信号,增强样本信息的多样性;利用多尺度并行卷积获取关键特征,增强特征学习能力;结合通道注意力机制有效融合多分支故障特征,提升故障诊断的准确性。与传统故障诊断模型相比,MBSACNN模型在特征学习和抗噪性能方面都表现出一定的优势。在凯斯西储大学(CWRU)实验数据集零噪声与强噪声情况下,故障分类准确率分别为99.99%和96.97%;工程应用中,在噪声干扰强烈的3类水泥生产设备上故障分类准确率均优于97.25%,具有较高的诊断精度与噪声鲁棒性。
1 引言
滚动轴承因工作环境恶劣,是发生故障最多部件之一,其正常运转对于整个系统的稳定性至关重
深度学习(deep learning,DL)克服了机器学习的缺点。深度信念网
噪声会导致故障特征分布在不同特征区间、不同频率范围内,影响CNN关键特征的提
针对上述问题,本文提出了一种基于多分支多尺度卷积神经网络结合通道注意力(multi-branch multi-scale convolationch neural net work with channel attention,MBSACNN)的轴承故障诊断方法。MBSACNN模型将一维信号转化为二维灰度图像,使用连续小波变换转换为时频信号,采用多分支结构获得多种故障特征。利用多尺度学习,从一维信号中并行提取信号不同频率的多尺度特征。使用通道注意力特征融合机制,将一维多尺度分支、小波时频图分支和二维图像分支进行特征融合。试验结果和工程验证均表明:该模型具有较强的特征学习能力,在强噪声实验数据集中具有较高的故障诊断精度和噪声鲁棒性。
2 基础理论
2.1 卷积神经网络
CNN是一种具有局部连接、权重共享等特性,由卷积层、池化层和全连接层交叉堆叠而成的深层前馈神经网络,见文献[
卷积层的目的是进行故障特征的提取。假设神经元接收D个输入x1,x2,…,xD,令向量x=[x1; x2; …; xD]表示这组输入。用净输入z∈R表示神经元所获得的输入信号x的加权和
(1) |
式中:ω=[ω1; ω2; …; ωD]∈RD是D维的权重向量, b∈R是偏置。
净输入z在经过1个非线性函数f(·)后得到神经元的活性值a:
(2) |
式中非线性函数f(·)称为激活函数。
通常,卷积层的数学模型可以由
(3) |
式中:
池化层可以降低特征维数,避免过拟合。假设池化层的输入特征映射组为χ∈
1) 最大池化:对于区域,选择这个区域内所有神经元的最大活性值作为这个区域的表示,即:
(4) |
式中xi为区域内i个神经元的活性值。
2) 平均池化:一般是取区域内所有神经元活性值的平均值,即:
(5) |
全连接层的作用是收集卷积、池化后的所有特征信息用于分类。Softmax函数可以将多个标量映射为一个概率分布,对于K个标量x1, x2, …, xK,函数定义如下:
(6) |
2.2 连续小波变换
连续小波变换(continuous wavelet transform, CWT)可以用小波基函数将时域的原始信号变换为时频域的信号,小波变换(WT)提供了信号的时频混合表示,其表达式如下:
(7) |
式中:f(t)是原始信号;
2.3 信号转灰度图像
故障诊断模型中,数据预处理是提取振动信号特征的重要环节。经典的对称点模式分

图1 信号转换为二维灰度图像实例
Fig.1 Example of signal-to-2D grayscale image
首先,把原始振动信号按照具体要求平均切分,逐次取出;然后,将取出的时域信号随机提取长度为
设L(i)表示一系列不同的数据,其中i=1,2,3,…,
(8) |
灰度图像像素强度反映了原始数据的值,这些值彼此不同。每个点通过
3 网络模型结构
MBSACNN模型从信号的不同维度和同一维度不同频率段内学习和融合故障特征,提升智能故障诊断的准确性和噪声鲁棒性。首先,将采集到的一维振动信号进行数据预处理,并转换为相应的二维灰度图像和小波时频图;其次,将一维振动信号输入到MBSACNN模型的一维信号分支,该分支由不同卷积核大小的3个网络通道组成,利用多尺度学习的方法提取一维振动信号不同频率范围内的特征;然后,将二维灰度图像输入二维信号分支中进行卷积处理;对一维振动信号进行连续小波变换,将振动信号转化为小波时频图并进行卷积处理;最后,利用通道注意力层对不同尺度进行特征融合,并将故障特征全局平均池化后输入进全连接层中进行故障分类。模型网络层具体参数如
网络层 | 卷积核大小 | 步长 | 核数量/个 |
---|---|---|---|
卷积层1 | 321 | 81 | 64 |
池化层1 | 21 | 21 | |
卷积层2 | 31 | 11 | 16 |
池化层2 | 21 | 21 | |
卷积层3 | 31 | 11 | 32 |
池化层3 | 21 | 21 | |
卷积层4 | 31 | 11 | 64 |
池化层4 | 21 | 21 | |
卷积层5 | 51 | 11 | 16 |
池化层5 | 21 | 21 | |
卷积层6 | 51 | 11 | 32 |
池化层6 | 21 | 21 | |
卷积层7 | 51 | 11 | 64 |
池化层7 | 21 | 21 | |
卷积层8 | 71 | 11 | 16 |
池化层8 | 21 | 21 | |
卷积层9 | 71 | 11 | 32 |
池化层9 | 21 | 21 | |
卷积层10 | 71 | 11 | 64 |
池化层10 | 21 | 21 |

图2 MBSACNN模型结构图
Fig.2 MBSACNN model structure diagram
3.1 一维信号分支
MBSACNN模型将一维信号直接输入进一维信号分支中。原始信号包含最丰富的信号特征,能够最全面地反映滚动轴承的健康状况。由于一维信号含有不同频率范围特性的噪声等因素,本文构建了一个多尺度学习的结构,以获得更加全面的故障特征,消除噪声等条件的干扰。这方面的内容见第3.3节。
3.2 二维信号分支
MBSACNN模型二维信号分支的输入为一维原始振动信号转换的二维灰度图像。将采集的滚动轴承一维信号,以4 096的具体长度切分为n个数据段,组成一个数据集;将各个数据集中的数据段转换为64行64列的数组,依次填充在灰度图像内。数组中每个元素代表对应灰度图像素的亮度。
3.3 小波时频图分支
MBSACNN模型小波时频图分支的输入为一维原始振动信号进行连续小波变换的小波时频图像。经过连续小波变换的二维时频图,包含时域和频域信息,在高频信号中获得一个好的时间分辨率和较差的频率分辨率,低频信号中获得较好的频率分辨率和较差的时间分辨率,避免了过多人工特征工程,增强模型的噪声鲁棒性,可以更好的验证多分支学习的效果,其中进行连续小波变换的总尺度为 1 024,时频卷积层中使用Morlet小波基函数。
3.4 多尺度结构
MBSACNN模型多尺度结构的核心思想是从不同频率范围学习原始信号中的不同特征。对一维信号分支的原始振动信号采用多尺度结构,以增强模型对故障特征的学习和判别能力。具体而言,多尺度结构使用不同大小的卷积核实现并行卷积,同时学习不同频率尺度的丰富故障特征。
多尺度结构由3个不同的通道组成。每个通道包含着3个不同的卷积层、池化层,共含有9个卷积层、池化层,每个卷积层、池化层的具体参数都不相同。在对应的通道的末尾设计了通道注意力层、全局平均池化层和展开层。将由一维信号分支中第一次卷积、池化后的数据输入到不同通道中,对故障进行多尺度分析,增强模型的抗噪声能力。
3.5 通道注意力层
由分析的可知,每个通道可以得到滚动轴承不同频率的故障特征。这些特征信息有可能是相互促进的,让模型更加准确的分类;也可能是相互矛盾的,从而导致模型的错误判断。为了融合后的特征进行自适应,不产生矛盾,MBSACNN模型在各个通道的末尾加入了通道注意力层,从而保留有用信息,抑制干扰信息。
通道注意力层把不同分支提取的故障特征先进行全局平均池化操作,再通过快速的一维卷积生成通道注意力,最后使用sigmoid激活函数提取新产生的通道注意力特征,并与原始输入特征进行加权输出。其中,一维卷积层的卷积核大小通过通道维数的非线性映射自适应确定, 给定通道维度C,卷积核大小k可以自适应地确定为
(9) |
式中:γ=2;b=1;表示最接近t的奇
通道注意力层的具体结构如

图3 通道注意力层结构
Fig.3 Channel attention layer structure
3.6 分类结构
MBSACNN模型在通道注意力层之后,采用了全局平均池化层,提高模型的泛化能力。在全局平均池化层之后模型连接展开层、合并层以及全连接层,分类层时采用Softmax函数给予故障分类结果。
4 实验分析与工程验证
为验证本文提出的MBSACNN模型故障分类准确度和具体抗噪声能力,采用具体实验和工程验证进行模型性能分析。
4.1 实验数据描述
实验使用凯斯西储大学(Case Western Reserve University,CWRU)轴承数据集验证模型性能。CWRU滚动轴承试验台以驱动端轴承SKF6205作为研究对象,系统采样频率为12 kHz。滚动轴承故障分为4种状态:正常状态,滚动体故障,外圈故障,内圈故障;每种故障状态有3个故障程度:轻微故障(0.177 8 mm),中度故障(0.355 6 mm),严重故障(0.533 4 mm)。CWRU轴承数据集分为9种故障状态和1种正常状态,共10种轴承状态。考虑到轴承转速和采样频率,将数据集样本按6:2:2的比例划分为训练集、测试集和验证集,每种轴承健康状态共有2 000个数据样本,数据集具体细节如
故障类型 | 尺寸/mm | 训练数量/个 | 验证数量/个 | 测试数量/个 | 标签 |
---|---|---|---|---|---|
正常 | 0 | 1 200 | 400 | 400 | 0 |
滚动体 故障 | 0.177 8 | 1 200 | 400 | 400 | 1 |
0.355 6 | 1 200 | 400 | 400 | 2 | |
0.533 4 | 1 200 | 400 | 400 | 3 | |
内圈 故障 | 0.177 8 | 1 200 | 400 | 400 | 4 |
0.355 6 | 1 200 | 400 | 400 | 5 | |
0.533 4 | 1 200 | 400 | 400 | 6 | |
外圈 故障 | 0.177 8 | 1 200 | 400 | 400 | 7 |
0.355 6 | 1 200 | 400 | 400 | 8 | |
0.533 4 | 1 200 | 400 | 400 | 9 |

CWRU轴承数据集为试验台采集的无外界强烈噪声干扰的轴承故障信号。软件运行环境为python程序语言,keras深度学习框架,使用Adam优化算法更新模型参数,在windows l0系统、Intel core i5处理器上运行,计算机内存为8GB。
4.2 不同模型性能对比分析
为更好地分析MBSACNN模型的故障诊断性能,将该模型分别与MSCN
每次实验测试过程重复10次,最终测试结果取均值。实验结果如

图4 不同模型的诊断精度
Fig.4 Diagnostic accuracy of different models

图5 CWRU轴承数据集混淆矩阵
Fig.5 CWRU bearing data set confusion matrix
10类样本信号输入MBSACNN模型训练和测试的分类准确率和损失率,如

图6 MBSACNN模型训练准确率
Fig.6 MBSACNN model training accuracy
4.3 模型结构性能验证
MBSACNN模型的核心是通过一维、二维信号分支结构、小波时频图分支、多尺度结构和通道注意力层从不同角度学习和融合丰富互补的特征,以获得更好的性能。因此,需要从不同结构来探讨不同特征信息对模型故障诊断性能的影响。分别在无噪声和强噪声的场景下进行消融实验,并记录整个过程中MBSACNN模型不同结构的测试精度。
为了评估MBSACNN模型的有效性,设置了4种模型结构,包括MBSACNN-1(缺少二维信号分支)、MBSACNN-2(缺少多尺度结构)、MBSACNN-3(缺少通道注意力层)和MBSACNN-4(缺少小波分支)。实验结果如
二维信号分支 | 多尺度结构 | 通道注意力层 | 小波分支 | 模型 | 准确率/(%) | |
---|---|---|---|---|---|---|
无噪声 | 强噪声 | |||||
√ | √ | √ | MBSACNN-1 | 99.90 | 95.02 | |
√ | √ | √ | MBSACNN-2 | 99.72 | 94.21 | |
√ | √ | √ | MBSACNN-3 | 99.83 | 94.85 | |
√ | √ | √ | MBSACNN-4 | 99.89 | 95.74 | |
√ | √ | √ | √ | MBSACNN | 99.99 | 96.97 |
由
4.4 抗噪性能分析
为体现MBSACNN模型优秀的抗噪声能力,需要进行模型的抗噪声能力分析。信噪比RSN是进行一维振动信号噪声分析的重要参数。由于CWRU轴承数据集为无噪声信号,需要在原始振动信号中加入具有不同信噪比的高斯白噪声以形成含噪声的复合信号。RSN计算公式如下:
(10) |
式中:Psignal为信号的能量;Pnoise为噪声的能量。
以CWRU轴承数据集为例,

图7 轴承信号波形
Fig.7 Bearing signal waveform
从
在数据集中加入高斯白噪声获得RSN为13 dB至3 dB的复合信号,用来模拟实际噪声环境中采集到的滚动轴承信号。
RSN/dB | 13 | 11 | 9 | 7 | 5 | 3 |
---|---|---|---|---|---|---|
准确率/(%) | 96.97 | 98.74 | 99.40 | 99.74 | 99.82 | 99.95 |
由

图8 不同模型的抗噪能力对比
Fig.8 Comparison of noise immunity of different models
由
4.5 工程验证
具体工程验证是在某水泥厂水泥生产工艺环境下,用多种水泥生产设备数据集来验证MBSACNN模型性能。水泥生产工艺环境较恶劣,含有大量噪声干扰,更容易影响模型的关键故障特征提取以及故障识别准确率。
水泥生产设备及三维模型如

图9 某水泥厂水泥生产设备及测点位置
Fig.9 Cement production equipment of a cement plant
将3种水泥生产设备故障数据集合并,3种设备共分为:辊压机正常和轴承内圈故障,离心风机正常和轴承外圈故障和水泥磨主排风机正常和不平衡故障6种状态。其中不平衡故障是指转子的质量中心和旋转中心线之间存在一定偏心现象,现场人员通过精确调整设备的对准状态,即可恢复其正常运行。轴承故障如

图10 水泥设备轴承故障图
Fig.10 Cement equipment bearing fault picture

每种健康状态共有2 000个数据样本,某水泥厂水泥生产工艺环境下多种水泥机械设备数据集细节如
设备名称 | 故障类型 | 训练数量 | 训练数量 | 测试数量 | 标签 |
---|---|---|---|---|---|
辊压机 |
正常 内圈故障 | 1 600 | 200 | 200 | 0 |
1600 | 200 | 200 | 1 | ||
离心 风机 |
正常 外圈故障 | 1600 | 200 | 200 | 0 |
1600 | 200 | 200 | 1 | ||
水泥磨 主排风机 |
正常 不平衡故障 | 1600 | 200 | 200 | 0 |
1600 | 200 | 200 | 1 |
4.6 工程验证结果分析
根据MBSACNN模型对某水泥厂水泥生产工艺环境下3种不同生产设备数据集进行故障识别。为了针对不同的研究对象,对每台生产设备的健康状态分别进行二分类,经MBSACNN模型得到的预测结果与真实标签保持一致,准确率接近100%,故障标签与正常标签被成功二分类,生产设备故障类型被成功识别区分。
为了验证所提模型对于智能故障诊断模型特征表达效果,利用tSNE(t-distributed stochastic neighbor embedding)方法对原始信号的特征分布以及MBSACNN模型提取到的特征进行降维可视化。原始数据特征和提取特征聚类效果如

图11 t-SNE降维可视化结果
Fig.11 Visualization results of t-SNE dimensionality reduction
从
4.7 模型工程性能分析
针对某水泥厂水泥生产工艺环境下多种水泥机械设备数据集验证MBSACNN模型故障诊断准确率,采用MSCNN、CNN、WDCNN、DRSN和CNN-LSTM模型进行对比验证。
每次测试过程重复10次,对辊压机、离心风机、水泥磨主排风机3种不同水泥生产设备故障识别准确率取均值,对比MBSACNN模型与其他深度学习模型的抗噪声能力,不同模型在不同水泥生产设备的故障识别准确率如

图12 不同模型的抗噪能力
Fig.12 Noise immunity of different models
由
通过上述对比分析,证实MBSACNN模型在水泥生产工艺环境下具备优秀的故障提取能力。在具体工程验证中体现良好的故障分类效果,可以区分不同种机械的故障特征;在强噪声干扰下,具有更好的抗噪性能、噪声鲁棒性,诊断精度更高。
5 结 论
提出一种可以有效识别关键故障特征、具备较强抗噪能力的MBSACNN模型。主要得出以下结论:
1) 首先将一维时间序列、二维灰度图像和小波时频图作为模型的输入,不依赖以往的经验,充分提取轴承的时频序列特征,提高故障诊断效率和准确性。
2) 利用不同分支,从不同尺度利用通道注意力机制,增强模型关键故障特征的识别度。在较少的训练轮数下模型可以达到更好的稳定性和准确率,不同结构的引入使模型的识别准确率得到了提升。
3) 在CWRU数据集上对比其他几种网络模型,MBSACNN表现更好;在不同信噪比的对比实验中,MBSACNN模型的故障识别准确率均稳定在96.9%以上;在水泥生产工艺环境下,故障识别准确率均优于97.25%,具备较强的特征提取能力及抗噪能力。
参考文献
胡向东, 梁川, 杨希. 基于时频增强的滚动轴承少样本故障诊断方法 [J]. 计量学报, 2023, 44(1): 12-20. [百度学术]
HU X D, LIANG C, YANG X. Fault diagnosis method for rolling bearing with few samples based on time-frequency enhancement [J]. Acta Metrologica Sinica, 2023, 44(1): 12-20. [百度学术]
金江涛, 许子非, 李春, 等. 基于VMD能量熵与优化支持向量机的轴承故障诊断 [J]. 计量学报, 2021, 42(7): 898-905. [百度学术]
JIN J T, XU Z F, LI C, et al. Bearing fault diagnosis based on VMD energy entropy and optimization support vector machine [J]. Acta Metrologica Sinica, 2021, 42(7): 898-905. [百度学术]
余志锋, 熊邦书, 欧巧凤, 等. 基于VMD-CWT和改进CNN的直升机轴承故障诊断 [J]. 航空动力学报, 2021, 36(5): 948-958. [百度学术]
YU Z F, XIONG B S, OU Q F, et al. Helicopter bearing fault diagnosis based on VMD-CWT and improved CNN [J]. Journal of Aerospace Power, 2021, 36(5): 948-958. [百度学术]
SHAO H, JIANG H, ZHANG H, et al. Electric locomotive bearing fault diagnosis using a novel convolutional deep belief network [J]. IEEE Transactions on Industrial Electronics, 2018, 65(3): 2727-2736. [百度学术]
WEN L, GAO L, LI X. A new deep transfer learning based on sparse auto-encoder for fault diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2017, 49(1) : 136-144. [百度学术]
金海龙, 马吴旭, 孟宗, 等. 基于改进1DCNN-GRU的滚动轴承故障诊断 [J]. 计量学报, 2023, 44(9): 1423-1428. [百度学术]
JIN H L, MA W X, MENG Z, et al. Fault diagnosis of rolling bearings based on improved 1DCNN-GRU [J]. Acta Metrologica Sinica, 2023, 44(9): 1423-1428. [百度学术]
JIANG G, HE H, YAN J, et al. Multiscale convolutional neural networks for fault diagnosis of wind turbine Gearbox [J]. IEEE Transactions on Industrial Electronics, 2019, 66(4): 3196-3207. [百度学术]
ZHANG W, LI C, PENG G, et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load [J]. Mechanical Systems and Signal Processing, 2018, 100: 439-453. [百度学术]
NIU G, LIU E, WANG X, et al. Enhanced discriminate feature learning deep residual CNN for multitask bearing fault diagnosis with information fusion [J]. IEEE Transactions on Industrial Informatics, 2023, 19(1): 762-770. [百度学术]
陈剑, 孙太华, 黄凯旋, 等. 基于直方图均衡化和卷积神经网络的轴承故障诊断方法 [J]. 计量学报, 2022, 43(7): 907-912. [百度学术]
CHEN J, SUN T H, HUANG K X, et al. Bearing fault diagnosis method based on histogram equalization and convolutional neural network [J]. Acta Metrologica Sinica, 2022, 43(7): 907-912. [百度学术]
XIA M, LI T, XU L, et al. Fault Diagnosis for Rotating Machinery Using Multiple Sensors and Convolutional Neural Networks [J]. IEEE-ASME Transactions on Mechatronics, 2018, 23(1): 101-110. [百度学术]
INCEE T, KIRAN S, EREN L, et al. Real-Time Motor Fault Detection by 1-D Convolutional Neural Networks [J]. IEEE Transactions on Industrial Electronics, 2016, 63(11): 7067-7075. [百度学术]
ZHANG W, LI C, PENG G, et al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load [J]. Mechanical Systems and Signal Processing, 2018, 100: 439-453. [百度学术]
LI T, CHEN X, YAN R, et al. WaveletKernelNet: An Interpretable Deep Neural Network for Industrial Intelligent Diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(4): 2302-2312. [百度学术]
ZHANG J, SUN Y, GUO L, et al. A new bearing fault diagnosis method based on modified convolutional neural networks [J]. Chinese Journal of Aeronautics, 2020,33(2): 439-447. [百度学术]
ZARE S, AYATI M. Simultaneous fault diagnosis of wind turbine using multichannel convolutional neural networks [J]. ISA Transactions, 2021, 108: 230-239. [百度学术]
ZHAO M, JIA X. A novel strategy for signal denoising using reweighted SVD and its applications to weak fault feature enhancement of rotating machinery [J]. Mechanical Systems and Signal Processing, 2017, 94: 129-147. [百度学术]
CHEN L, An K, HUANG D, et al. Noise-boosted convolutional neural network for edge-based motor fault diagnosis with limited samples [J]. IEEE Transactions on Industrial Informatics, 2022, 19(9): 9491-9502. [百度学术]
YANG C, QIAO Z, ZHU R, et al. An intelligent fault diagnosis method enhanced by noise injection for machinery [J]. IEEE Transactions on Instrumentation and Measurement, 2023, 72: 1-11. [百度学术]
万周, 何俊增, 姜东, 等. 基于参数优化SDP分析的转子故障诊断方法 [J]. 振动与冲击, 2023, 42(1): 81-88. [百度学术]
WAN C, HE J Z, JIANG D, et al. Rotor fault diagnosis method based on parameter optimization SDP analysis [J]. Journal of Vibration and Shock, 2023, 42(1): 81-88. [百度学术]
侯东晓, 周子安, 程荣财, 等. 基于GADF-TL-ResNeXt的滚动轴承故障诊断方法 [J]. 计量学报, 2023, 44(10): 1534-1542. [百度学术]
HOU D X, ZHOU Z A, CHENG R C, et al. Fault diagnosis method of rolling bearing based on GADF-TL-ResNeXt [J]. Acta Metrologica Sinica, 2023, 44(10): 1534-1542. [百度学术]
RUIZ M, MUJICA L E, ALF S, et al. Wind turbine fault detection and classification by means of image texture analysis [J]. Mechanical Systems and Signal Processing, 2018, 107: 149-167. [百度学术]
WANG Q, WU B, ZHU P F, LiPeihua, et al. ECA-Net: Efficient channel attention for deep convolutional neural networks[C]// IEEE/CVF conference on computer vision and pattern recognition, Seattle, America, 2020. [百度学术]
ZHANG W, PENG G, LIC, et al. A New Deep Learning Model for Fault Diagnosis with Good Anti-Noise and Domain Adaptation Ability on Raw Vibration Signals [J]. Sensors, 2017,17(2):425. [百度学术]
ZHAO M, ZHONG S, FU X, et al. Deep Residual Shrinkage Networks for Fault Diagnosis [J]. IEEE Transactions on Industrial Informatics, 2020, 16(7): 4681-4690. [百度学术]