使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读

基于多分支特征融合注意力的轴承故障诊断方法

  • 郭海宇 1
  • 于威 1
  • 张晓光 2,3,4
  • 陆凡凡 2
  • 陈洋 2
  • 赵学义 5
1. 沈阳工业大学 电气工程学院,辽宁 沈阳 110870; 2. 上海智质科技有限公司,上海 201801; 3. 中国科学技术大学 计算机科学与技术学院,安徽 合肥 230026; 4. 长三角信息智能 创新研究院,安徽 芜湖 241000; 5. 安徽海螺水泥股份有限公司,安徽 芜湖 241200

中图分类号: TB936TH133.3

最近更新:2025-02-21

DOI: 10.3969/j.issn.1000-1158.2025.02.10

  • 全文
  • 图表
  • 参考文献
  • 作者
  • 出版信息
EN
目录contents

摘要

针对传统轴承故障诊断模型学习关键故障特征能力不足,且在噪声干扰下诊断精度受限的问题,提出了一种多分支多尺度卷积神经网络结合通道注意力(MBSACNN)的故障诊断方法。该方法采用多通道多输入的方式弥补传统模型只能分析单一维度故障特征信息的不足;进行连续小波变换将样本转化为时频信号,增强样本信息的多样性;利用多尺度并行卷积获取关键特征,增强特征学习能力;结合通道注意力机制有效融合多分支故障特征,提升故障诊断的准确性。与传统故障诊断模型相比,MBSACNN模型在特征学习和抗噪性能方面都表现出一定的优势。在凯斯西储大学(CWRU)实验数据集零噪声与强噪声情况下,故障分类准确率分别为99.99%和96.97%;工程应用中,在噪声干扰强烈的3类水泥生产设备上故障分类准确率均优于97.25%,具有较高的诊断精度与噪声鲁棒性。

1 引言

滚动轴承因工作环境恶劣,是发生故障最多部件之一,其正常运转对于整个系统的稳定性至关重

1。因此需要及时对轴承的运转状况进行监测,防止其发生故障。机器学习被应用于故障特征提取和分类中。文献[2]利用支持向量机完成轴承多种故障振动信号分类任务。文献[3]使用K-最近邻完成轴承的故障诊断。虽然机器学习可以对故障进行分类,但是也暴露着需要人工提取特征、处理海量数据能力有限等缺点。

深度学习(deep learning,DL)克服了机器学习的缺点。深度信念网

4、自动编码器网5、卷积神经网6(convolutional neural networks,CNN)等DL模型已经被运用在实际工程中。其中CNN应用于齿轮7,滚动轴8~10其他旋转机1112的故障诊断。基于CNN进行故障诊断可分为一维CNN(1DCNN)和二维CNN(2DCNN)2种。1DCNN的输入主要是原始信7、手动提取的统计特11、滤波信12等;2DCNN的输入主要是将一维信号重组为二维图像。文献[8]采用1DCNN进行特征提取,通过不同的卷积核提取到更多频率段特征;LI T13提出基于CNN的一种新型小波驱动深度神经网络进行齿轮箱的故障诊断,增加模型可解释性;ZHANG J14利用2DCNN将振动数据转换为灰度图像,进行轴承故障特征分类识别;ZARE S15使用多通道2DCNN进行风力涡轮机轴承的故障检测。

噪声会导致故障特征分布在不同特征区间、不同频率范围内,影响CNN关键特征的提

16。同时,某些噪声可以提高模型的训练速度和泛化能力,防止其过拟合。CHEN L17在CNN全连接层中输入噪声,提高故障诊断准确率,有效利用噪声的特性;YANG C18在CNN中增加一个高斯噪声层,将高斯噪声作为模型输入并训练,分类精度更高。

针对上述问题,本文提出了一种基于多分支多尺度卷积神经网络结合通道注意力(multi-branch multi-scale convolationch neural net work with channel attention,MBSACNN)的轴承故障诊断方法。MBSACNN模型将一维信号转化为二维灰度图像,使用连续小波变换转换为时频信号,采用多分支结构获得多种故障特征。利用多尺度学习,从一维信号中并行提取信号不同频率的多尺度特征。使用通道注意力特征融合机制,将一维多尺度分支、小波时频图分支和二维图像分支进行特征融合。试验结果和工程验证均表明:该模型具有较强的特征学习能力,在强噪声实验数据集中具有较高的故障诊断精度和噪声鲁棒性。

2 基础理论

2.1 卷积神经网络

CNN是一种具有局部连接、权重共享等特性,由卷积层、池化层和全连接层交叉堆叠而成的深层前馈神经网络,见文献[

6]。

卷积层的目的是进行故障特征的提取。假设神经元接收D个输入x1x2,…,xD,令向量x=[x1x2; …; xD]表示这组输入。用净输入zR表示神经元所获得的输入信号x的加权和

z=d=1Dωdxd+b=ωTx+b (1)

式中:ω=[ω1ω2; …; ωD]∈RDD维的权重向量, bR是偏置。

净输入z在经过1个非线性函数f(·)后得到神经元的活性值a

a=f(z) (2)

式中非线性函数f(·)称为激活函数。

通常,卷积层的数学模型可以由式(3)描述:

zl=ωl*al-1+bl (3)

式中: zl为第l层的净输入; zl-1为第l-1层的活性值;ωl代表卷积核, 且ωlRK为可学习的权重向量, K为标量; blR为可学习的偏置。

池化层可以降低特征维数,避免过拟合。假设池化层的输入特征映射组为χRM×N×D,对于其中每一个特征映射XdRM×N,1≤dD,将其划分为很多区域Rm,nd,1≤mM, 1≤nN,常用的池化层函数有2种。

1) 最大池化:对于区域Rm,nd,选择这个区域内所有神经元的最大活性值作为这个区域的表示,即:

ym,nd=maxiRm,ndxi (4)

式中xi为区域RKdi个神经元的活性值。

2) 平均池化:一般是取区域内所有神经元活性值的平均值,即:

ym,nd=1Rm,ndiRm,ndxi (5)

全连接层的作用是收集卷积、池化后的所有特征信息用于分类。Softmax函数可以将多个标量映射为一个概率分布,对于K个标量x1x2, …, xK,函数定义如下:

zk=SoftmaxxK=expxKi=1Kexpxi (6)

2.2 连续小波变换

连续小波变换(continuous wavelet transform, CWT)可以用小波基函数将时域的原始信号变换为时频域的信号,小波变换(WT)提供了信号的时频混合表示,其表达式如下:

WTα,τ=1α-ftψ*t-ταdt (7)

式中:ft)是原始信号;ψ*是小波函数的复共轭;α是尺度参数;τ是平移参数。

2.3 信号转灰度图像

故障诊断模型中,数据预处理是提取振动信号特征的重要环节。经典的对称点模式分

19、格拉姆角20等数据图像化方法,各参数的取值严重依赖人工经验,不佳的参数取值将导致图像无法有效表征各种故障状态,并且需要进行不同坐标的数值映射。本文将一维振动数据转换为二维灰度图像,可以使原始振动信号的幅值等特征转化为灰度图像中的像素大小,提高模型故障识别的准确度,不需要额外的计算参数,避免人工经验的影21。具体转换图像实例如图1所示。

fig

图1  信号转换为二维灰度图像实例

Fig.1  Example of signal-to-2D grayscale image

首先,把原始振动信号按照具体要求平均切分,逐次取出;然后,将取出的时域信号随机提取长度为N2的分段样本,并让一维数据时域信号依次填充二维灰度图像的像素;最后,对样本进行处理,得到大小为N×N的二维灰度图像作为模型新的输入。

Li)表示一系列不同的数据,其中i=1,2,3,…,N2Pjk)表示二维灰度图像第jk列的具体像素强度,j=1,2,3,…,Nk=1,2,3,…,N。具体按照式(8)进行转换:

Pj,k=Lj-1×N+k×255 (8)

灰度图像像素强度反映了原始数据的值,这些值彼此不同。每个点通过式(8)从0到255归一化,图像的大小取决于原始振动信号数据的长度。

3 网络模型结构

MBSACNN模型从信号的不同维度和同一维度不同频率段内学习和融合故障特征,提升智能故障诊断的准确性和噪声鲁棒性。首先,将采集到的一维振动信号进行数据预处理,并转换为相应的二维灰度图像和小波时频图;其次,将一维振动信号输入到MBSACNN模型的一维信号分支,该分支由不同卷积核大小的3个网络通道组成,利用多尺度学习的方法提取一维振动信号不同频率范围内的特征;然后,将二维灰度图像输入二维信号分支中进行卷积处理;对一维振动信号进行连续小波变换,将振动信号转化为小波时频图并进行卷积处理;最后,利用通道注意力层对不同尺度进行特征融合,并将故障特征全局平均池化后输入进全连接层中进行故障分类。模型网络层具体参数如表1所示。MBSACNN模型整体结构如图2所示。

表1  MBSACNN模型具体参数
Tab.1  Specific parameters of MBSACNN model
网络层卷积核大小步长核数量/个
卷积层1 32×1 8×1 64
池化层1 2×1 2×1
卷积层2 3×1 1×1 16
池化层2 2×1 2×1
卷积层3 3×1 1×1 32
池化层3 2×1 2×1
卷积层4 3×1 1×1 64
池化层4 2×1 2×1
卷积层5 5×1 1×1 16
池化层5 2×1 2×1
卷积层6 5×1 1×1 32
池化层6 2×1 2×1
卷积层7 5×1 1×1 64
池化层7 2×1 2×1
卷积层8 7×1 1×1 16
池化层8 2×1 2×1
卷积层9 7×1 1×1 32
池化层9 2×1 2×1
卷积层10 7×1 1×1 64
池化层10 2×1 2×1
fig

图2  MBSACNN模型结构图

Fig.2  MBSACNN model structure diagram

3.1 一维信号分支

MBSACNN模型将一维信号直接输入进一维信号分支中。原始信号包含最丰富的信号特征,能够最全面地反映滚动轴承的健康状况。由于一维信号含有不同频率范围特性的噪声等因素,本文构建了一个多尺度学习的结构,以获得更加全面的故障特征,消除噪声等条件的干扰。这方面的内容见第3.3节。

3.2 二维信号分支

MBSACNN模型二维信号分支的输入为一维原始振动信号转换的二维灰度图像。将采集的滚动轴承一维信号,以4 096的具体长度切分为n个数据段,组成一个数据集;将各个数据集中的数据段转换为64行64列的数组,依次填充在灰度图像内。数组中每个元素代表对应灰度图像素的亮度。

3.3 小波时频图分支

MBSACNN模型小波时频图分支的输入为一维原始振动信号进行连续小波变换的小波时频图像。经过连续小波变换的二维时频图,包含时域和频域信息,在高频信号中获得一个好的时间分辨率和较差的频率分辨率,低频信号中获得较好的频率分辨率和较差的时间分辨率,避免了过多人工特征工程,增强模型的噪声鲁棒性,可以更好的验证多分支学习的效果,其中进行连续小波变换的总尺度为 1 024,时频卷积层中使用Morlet小波基函数。

3.4 多尺度结构

MBSACNN模型多尺度结构的核心思想是从不同频率范围学习原始信号中的不同特征。对一维信号分支的原始振动信号采用多尺度结构,以增强模型对故障特征的学习和判别能力。具体而言,多尺度结构使用不同大小的卷积核实现并行卷积,同时学习不同频率尺度的丰富故障特征。

多尺度结构由3个不同的通道组成。每个通道包含着3个不同的卷积层、池化层,共含有9个卷积层、池化层,每个卷积层、池化层的具体参数都不相同。在对应的通道的末尾设计了通道注意力层、全局平均池化层和展开层。将由一维信号分支中第一次卷积、池化后的数据输入到不同通道中,对故障进行多尺度分析,增强模型的抗噪声能力。

3.5 通道注意力层

由分析的可知,每个通道可以得到滚动轴承不同频率的故障特征。这些特征信息有可能是相互促进的,让模型更加准确的分类;也可能是相互矛盾的,从而导致模型的错误判断。为了融合后的特征进行自适应,不产生矛盾,MBSACNN模型在各个通道的末尾加入了通道注意力层,从而保留有用信息,抑制干扰信息。

通道注意力层把不同分支提取的故障特征先进行全局平均池化操作,再通过快速的一维卷积生成通道注意力,最后使用sigmoid激活函数提取新产生的通道注意力特征,并与原始输入特征进行加权输出。其中,一维卷积层的卷积核大小通过通道维数的非线性映射自适应确定, 给定通道维度C,卷积核大小k可以自适应地确定为

k=ψC=log2Cγ+bγodd (9)

式中:γ=2;b=1;todd表示最接近t的奇

22

通道注意力层的具体结构如图3所示。通道注意力层结构通过识别不同通道及其周围k个邻居来获取局部跨通道交互信息,提高了MBSACNN模型的故障诊断准确率和计算效率,通过避免降低通道维度来学习有效的通道注意力,同时获取跨通道的交互信息。

fig

图3  通道注意力层结构

Fig.3  Channel attention layer structure

3.6 分类结构

MBSACNN模型在通道注意力层之后,采用了全局平均池化层,提高模型的泛化能力。在全局平均池化层之后模型连接展开层、合并层以及全连接层,分类层时采用Softmax函数给予故障分类结果。

4 实验分析与工程验证

为验证本文提出的MBSACNN模型故障分类准确度和具体抗噪声能力,采用具体实验和工程验证进行模型性能分析。

4.1 实验数据描述

实验使用凯斯西储大学(Case Western Reserve University,CWRU)轴承数据集验证模型性能。CWRU滚动轴承试验台以驱动端轴承SKF6205作为研究对象,系统采样频率为12 kHz。滚动轴承故障分为4种状态:正常状态,滚动体故障,外圈故障,内圈故障;每种故障状态有3个故障程度:轻微故障(0.177 8 mm),中度故障(0.355 6 mm),严重故障(0.533 4 mm)。CWRU轴承数据集分为9种故障状态和1种正常状态,共10种轴承状态。考虑到轴承转速和采样频率,将数据集样本按6:2:2的比例划分为训练集、测试集和验证集,每种轴承健康状态共有2 000个数据样本,数据集具体细节如表2所示,小波时频图如表3所示。

表2  试验台数据描述
Tab.2  Test bench data description
故障类型尺寸/mm训练数量/个验证数量/个测试数量/个标签
正常 0 1 200 400 400 0

滚动体

故障

0.177 8 1 200 400 400 1
0.355 6 1 200 400 400 2
0.533 4 1 200 400 400 3

内圈

故障

0.177 8 1 200 400 400 4
0.355 6 1 200 400 400 5
0.533 4 1 200 400 400 6

外圈

故障

0.177 8 1 200 400 400 7
0.355 6 1 200 400 400 8
0.533 4 1 200 400 400 9
表3  CWRU数据集小波图示例
Tab.3  Example of wavelet chart for CWRU dataset
table

CWRU轴承数据集为试验台采集的无外界强烈噪声干扰的轴承故障信号。软件运行环境为python程序语言,keras深度学习框架,使用Adam优化算法更新模型参数,在windows l0系统、Intel core i5处理器上运行,计算机内存为8GB。

4.2 不同模型性能对比分析

为更好地分析MBSACNN模型的故障诊断性能,将该模型分别与MSCNN

7、CNN8、WDCNN23、DRSN24和CNNLSTM8模型进行对比分析。CNN为传统的卷积神经网络;WDCNN针对一维信号振动特点将第一层卷积替换成宽卷积;CNNLSTM为长短时记忆时空网络,从时间序列提取轴承信号中的故障特征;MSCNN为多尺度神经网络,通过不同大小的卷积核有效进行特征提取;DRSN为深度残差收缩网络,可以在强噪声干扰下取得良好的故障诊断效果。

每次实验测试过程重复10次,最终测试结果取均值。实验结果如图4所示。由图4可知,MBSACNN模型的平均准确率高于传统MSCNN和CNN模型;与其他故障诊断模型WDCNN、DRSN和CNNLSTM比较,也体现一定的优势性。值得注意的是,MBSACNN模型在正常环境实验中,故障识别准确率为99.99%,证明MBSACNN模型具有较高的诊断精度。图5为MBSACNN模型使用混淆矩阵进行分类结果的展示,混淆矩阵显示大部分故障标签都已经被成功分类。

fig

图4  不同模型的诊断精度

Fig.4  Diagnostic accuracy of different models

fig

图5  CWRU轴承数据集混淆矩阵

Fig.5  CWRU bearing data set confusion matrix

10类样本信号输入MBSACNN模型训练和测试的分类准确率和损失率,如图6所示。从图中可知,在模型训练和测试过程中,模型输出的分类准确率均接近100%,损失率接近0%。模型训练迭代次数在3次左右时,准确率和损失率趋于稳定。

fig

图6  MBSACNN模型训练准确率

Fig.6  MBSACNN model training accuracy

4.3 模型结构性能验证

MBSACNN模型的核心是通过一维、二维信号分支结构、小波时频图分支、多尺度结构和通道注意力层从不同角度学习和融合丰富互补的特征,以获得更好的性能。因此,需要从不同结构来探讨不同特征信息对模型故障诊断性能的影响。分别在无噪声和强噪声的场景下进行消融实验,并记录整个过程中MBSACNN模型不同结构的测试精度。

为了评估MBSACNN模型的有效性,设置了4种模型结构,包括MBSACNN-1(缺少二维信号分支)、MBSACNN-2(缺少多尺度结构)、MBSACNN-3(缺少通道注意力层)和MBSACNN-4(缺少小波分支)。实验结果如表4所示。

表4  不同模型结构准确率
Tab.4  Structural accuracy of different models
二维信号分支多尺度结构通道注意力层小波分支模型准确率/(%)
无噪声强噪声
MBSACNN-1 99.90 95.02
MBSACNN-2 99.72 94.21
MBSACNN-3 99.83 94.85
MBSACNN-4 99.89 95.74
MBSACNN 99.99 96.97

表4可知:在强噪声(13 dB)或无噪声条件下,MBSACNN模型的准确率都高于其他几种结构,这体现出了一维、二维信号分支结构、小波分支、多尺度结构和通道注意力层可以提升模型故障诊断的准确率。值得注意的是,在无噪声情况下MBSACNN模型与其他4种模型结构的故障诊断准确率差别不大,高了0.1%左右。在强噪声环境下,不同结构准确率差值逐渐变大,说明不同分支结构、多尺度结构和通道注意力层可以提高MBSACNN模型抵抗噪声干扰的能力。4种结构从多个信号分量中学习更多的故障特征,与原始信号特征相互补充,提高模型学习故障噪声特征的准度率。

4.4 抗噪性能分析

为体现MBSACNN模型优秀的抗噪声能力,需要进行模型的抗噪声能力分析。信噪比RSN是进行一维振动信号噪声分析的重要参数。由于CWRU轴承数据集为无噪声信号,需要在原始振动信号中加入具有不同信噪比的高斯白噪声以形成含噪声的复合信号。RSN计算公式如下:

RSN=10 lgPsignalPnoise (10)

式中:Psignal为信号的能量;Pnoise为噪声的能量。

以CWRU轴承数据集为例,图7为轴承信号波形。

fig

图7  轴承信号波形

Fig.7  Bearing signal waveform

图7可以看出,高斯噪声复合信号中的幅值信号特征被高斯噪声完全干扰,导致模型学习不到关键的原始故障特征从而影响最终的故障分类准确率。

在数据集中加入高斯白噪声获得RSN为13 dB至3 dB的复合信号,用来模拟实际噪声环境中采集到的滚动轴承信号。表5为MBSACNN模型在信噪比为-13 dB至-3 dB下不同的诊断结果。

表5  MBSACNN模型不同噪声下的准确率
Tab.5  Accuracy of MBSACNN model under different noises
RSN/dB-13-11-9-7-5-3
准确率/(%) 96.97 98.74 99.40 99.74 99.82 99.95

表5可知MBSACNN模型在所有噪声背景下的准确率稳定在96.9%以上,在RSN为最低的13 dB时,准确率为96.97%,远高于其他对比模型。实验中用于对比分析的模型包括WDCNN、CNNLSTM、MSCNN、CNN、DRSN,实验结果见图8图8显示出不同模型在不同RSN影响下的故障诊断准确率。

fig

图8  不同模型的抗噪能力对比

Fig.8  Comparison of noise immunity of different models

图8可知,随着噪声强度增大(RSN降低),MBSACNN模型仍保持较高的准确率,具有良好的故障识别稳定性。在RSN为-3dB时DRSN、WDCNN、MSCNN、CNN、CNN-LSTM模型的准确率分别为96.70%、96.89%、90.53%、82.25%、96.38%;在RSN为13 dB时,DRSN、WDCNN、MSCNN、CNN、CNN-LSTM模型的准确率分别为93.58%、83.68%、85.80%、 65.89%、 85.18%, 5种对比模型准确率明显下降且不稳定。以上分析表明,MBSACNN模型具有较高的故障特征提取能力,以及较强的抗噪声能力。

4.5 工程验证

具体工程验证是在某水泥厂水泥生产工艺环境下,用多种水泥生产设备数据集来验证MBSACNN模型性能。水泥生产工艺环境较恶劣,含有大量噪声干扰,更容易影响模型的关键故障特征提取以及故障识别准确率。

水泥生产设备及三维模型如图9所示,分别以辊压机、离心风机和水泥磨主排风机3种水泥生产设备故障状态作为工程验证对象,系统采样频率为51.2 kHz,采样时间为2 s,采样点数为102 400。由于水泥生产属于连续型生产工艺,“非计划停产”会造成严重的经济损失,因此水泥生产过程普遍采用点巡检、定期维修和预测性维护相结合的运维模式,以保证产线长期平稳运行。因此,真实生产过程中装备很少存在一台生产设备同时发生多种故障的情

25。本文选取了不同设备上发生过的不同类型的故障数据进行验证。其中,辊压机选取的测点是电机自由端1H(H代表水平方向)测点,离心风机选取的是联轴器侧3H测点,水泥磨主排风机选取的是电机自由端的1H测点,每台设备的故障类型分别表现为轴承内圈故障、不平衡故障和轴承外圈故障。

fig

图9  某水泥厂水泥生产设备及测点位置

Fig.9  Cement production equipment of a cement plant

将3种水泥生产设备故障数据集合并,3种设备共分为:辊压机正常和轴承内圈故障,离心风机正常和轴承外圈故障和水泥磨主排风机正常和不平衡故障6种状态。其中不平衡故障是指转子的质量中心和旋转中心线之间存在一定偏心现象,现场人员通过精确调整设备的对准状态,即可恢复其正常运行。轴承故障如图10所示。

fig

图10  水泥设备轴承故障图

Fig.10  Cement equipment bearing fault picture

表6分别展示了辊压机、离心风机和水泥磨主排风机正常状态和故障状态的小波时频图。将数据集样本按8:1:1的比例划分为训练集、测试集和验证集。

表6  水泥生产设备数据小波图示例
Tab.6  Example of wavelet chart for cement production equipment data
table

每种健康状态共有2 000个数据样本,某水泥厂水泥生产工艺环境下多种水泥机械设备数据集细节如表7所示。

表7  水泥生产工艺环境下多种设备数据集描述
Tab.7  Description of various equipment data sets in cement production process environment
设备名称故障类型训练数量训练数量测试数量标签
辊压机

正常

内圈故障

1 600 200 200 0
1600 200 200 1

离心

风机

正常

外圈故障

1600 200 200 0
1600 200 200 1

水泥磨

主排风机

正常

不平衡故障

1600 200 200 0
1600 200 200 1

4.6 工程验证结果分析

根据MBSACNN模型对某水泥厂水泥生产工艺环境下3种不同生产设备数据集进行故障识别。为了针对不同的研究对象,对每台生产设备的健康状态分别进行二分类,经MBSACNN模型得到的预测结果与真实标签保持一致,准确率接近100%,故障标签与正常标签被成功二分类,生产设备故障类型被成功识别区分。

为了验证所提模型对于智能故障诊断模型特征表达效果,利用tSNE(t-distributed stochastic neighbor embedding)方法对原始信号的特征分布以及MBSACNN模型提取到的特征进行降维可视化。原始数据特征和提取特征聚类效果如图11所示。其中橙色代表标签0的设备正常状态,蓝色分别代表标签1的辊压机轴承内圈故障,离心风机轴承外圈故障和水泥磨主排风机不平衡故障,横纵坐标表示特征在空间中的位置。

fig

图11  t-SNE降维可视化结果

Fig.11  Visualization results of t-SNE dimensionality reduction

图11中可知,原始信号包含过多冗余信息,特征信息难以分辨,聚类效果差。而MBSACNN模型提取的特征较原始信号容易区分,表现出较好的分类效果,即相同的故障特征按照同一中心聚集,不同的故障特征被区分开。因此,所提模型能够有效地提取水泥生产工艺环境下不同生产设备的故障特征。

4.7 模型工程性能分析

针对某水泥厂水泥生产工艺环境下多种水泥机械设备数据集验证MBSACNN模型故障诊断准确率,采用MSCNN、CNN、WDCNN、DRSN和CNN-LSTM模型进行对比验证。

每次测试过程重复10次,对辊压机、离心风机、水泥磨主排风机3种不同水泥生产设备故障识别准确率取均值,对比MBSACNN模型与其他深度学习模型的抗噪声能力,不同模型在不同水泥生产设备的故障识别准确率如图12所示。

fig

图12  不同模型的抗噪能力

Fig.12  Noise immunity of different models

图12可知,MBSACNN模型在原始强噪声数据集中对辊压机、离心风机、水泥磨主排风机3种水泥生产设备的故障识别准确率分别为100%、99.75%、97.25%,诊断精度优于其他模型。其中,传统CNN模型故障识别率仅为50%,MSCNN、WDCNN、DRSN和CNN-LSTM模型相比于MBSACNN模型,故障识别率较低且不稳定,针对不同水泥生产设备的故障特征无法维持较高的诊断精度。由于离心风机和水泥磨主排风机工作环境恶劣复杂,对比模型故障识别准确率明显偏低,MBSACNN模型仍保持较高的分类精度,故障识别准确率稳定。

通过上述对比分析,证实MBSACNN模型在水泥生产工艺环境下具备优秀的故障提取能力。在具体工程验证中体现良好的故障分类效果,可以区分不同种机械的故障特征;在强噪声干扰下,具有更好的抗噪性能、噪声鲁棒性,诊断精度更高。

5 结 论

提出一种可以有效识别关键故障特征、具备较强抗噪能力的MBSACNN模型。主要得出以下结论:

1) 首先将一维时间序列、二维灰度图像和小波时频图作为模型的输入,不依赖以往的经验,充分提取轴承的时频序列特征,提高故障诊断效率和准确性。

2) 利用不同分支,从不同尺度利用通道注意力机制,增强模型关键故障特征的识别度。在较少的训练轮数下模型可以达到更好的稳定性和准确率,不同结构的引入使模型的识别准确率得到了提升。

3) 在CWRU数据集上对比其他几种网络模型,MBSACNN表现更好;在不同信噪比的对比实验中,MBSACNN模型的故障识别准确率均稳定在96.9%以上;在水泥生产工艺环境下,故障识别准确率均优于97.25%,具备较强的特征提取能力及抗噪能力。

参考文献

1

胡向东梁川杨希. 基于时频增强的滚动轴承少样本故障诊断方法 [J]. 计量学报2023441): 12-20. [百度学术] 

HU X DLIANG CYANG X. Fault diagnosis method for rolling bearing with few samples based on time-frequency enhancement [J]. Acta Metrologica Sinica2023441): 12-20. [百度学术] 

2

金江涛许子非李春. 基于VMD能量熵与优化支持向量机的轴承故障诊断 [J]. 计量学报2021427): 898-905. [百度学术] 

JIN J TXU Z FLI Cet al. Bearing fault diagnosis based on VMD energy entropy and optimization support vector machine [J]. Acta Metrologica Sinica2021427): 898-905. [百度学术] 

3

余志锋熊邦书欧巧凤. 基于VMD-CWT和改进CNN的直升机轴承故障诊断 [J]. 航空动力学报2021365): 948-958. [百度学术] 

YU Z FXIONG B SOU Q Fet al. Helicopter bearing fault diagnosis based on VMD-CWT and improved CNN [J]. Journal of Aerospace Power2021365): 948-958. [百度学术] 

4

SHAO HJIANG HZHANG Het al. Electric locomotive bearing fault diagnosis using a novel convolutional deep belief network [J]. IEEE Transactions on Industrial Electronics2018653): 2727-2736. [百度学术] 

5

WEN LGAO LLI X. A new deep transfer learning based on sparse auto-encoder for fault diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems2017491) : 136-144. [百度学术] 

6

金海龙马吴旭孟宗. 基于改进1DCNN-GRU的滚动轴承故障诊断 [J]. 计量学报2023449): 1423-1428. [百度学术] 

JIN H LMA W XMENG Zet al. Fault diagnosis of rolling bearings based on improved 1DCNN-GRU [J]. Acta Metrologica Sinica2023449): 1423-1428. [百度学术] 

7

JIANG GHE HYAN Jet al. Multiscale convolutional neural networks for fault diagnosis of wind turbine Gearbox [J]. IEEE Transactions on Industrial Electronics2019664): 3196-3207. [百度学术] 

8

ZHANG WLI CPENG Get al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load [J]. Mechanical Systems and Signal Processing2018100439-453. [百度学术] 

9

NIU GLIU EWANG Xet al. Enhanced discriminate feature learning deep residual CNN for multitask bearing fault diagnosis with information fusion [J]. IEEE Transactions on Industrial Informatics2023191): 762-770. [百度学术] 

10

陈剑孙太华黄凯旋. 基于直方图均衡化和卷积神经网络的轴承故障诊断方法 [J]. 计量学报2022437): 907-912. [百度学术] 

CHEN JSUN T HHUANG K Xet al. Bearing fault diagnosis method based on histogram equalization and convolutional neural network [J]. Acta Metrologica Sinica2022437): 907-912. [百度学术] 

11

XIA MLI TXU Let al. Fault Diagnosis for Rotating Machinery Using Multiple Sensors and Convolutional Neural Networks [J]. IEEE-ASME Transactions on Mechatronics2018231): 101-110. [百度学术] 

12

INCEE TKIRAN SEREN Let al. Real-Time Motor Fault Detection by 1-D Convolutional Neural Networks [J]. IEEE Transactions on Industrial Electronics20166311): 7067-7075. [百度学术] 

13

ZHANG WLI CPENG Get al. A deep convolutional neural network with new training methods for bearing fault diagnosis under noisy environment and different working load [J]. Mechanical Systems and Signal Processing2018100439-453. [百度学术] 

14

LI TCHEN XYAN Ret al. WaveletKernelNet: An Interpretable Deep Neural Network for Industrial Intelligent Diagnosis [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems2022524): 2302-2312. [百度学术] 

15

ZHANG JSUN YGUO Let al. A new bearing fault diagnosis method based on modified convolutional neural networks [J]. Chinese Journal of Aeronautics2020332): 439-447. [百度学术] 

16

ZARE SAYATI M. Simultaneous fault diagnosis of wind turbine using multichannel convolutional neural networks [J]. ISA Transactions2021108230-239. [百度学术] 

17

ZHAO MJIA X. A novel strategy for signal denoising using reweighted SVD and its applications to weak fault feature enhancement of rotating machinery [J]. Mechanical Systems and Signal Processing201794129-147. [百度学术] 

18

CHEN LAn KHUANG Det al. Noise-boosted convolutional neural network for edge-based motor fault diagnosis with limited samples [J]. IEEE Transactions on Industrial Informatics2022199): 9491-9502. [百度学术] 

19

YANG CQIAO ZZHU Ret al. An intelligent fault diagnosis method enhanced by noise injection for machinery [J]. IEEE Transactions on Instrumentation and Measurement2023721-11. [百度学术] 

20

万周何俊增姜东. 基于参数优化SDP分析的转子故障诊断方法 [J]. 振动与冲击2023421): 81-88. [百度学术] 

WAN CHE J ZJIANG Det al. Rotor fault diagnosis method based on parameter optimization SDP analysis [J]. Journal of Vibration and Shock2023421): 81-88. [百度学术] 

21

侯东晓周子安程荣财. 基于GADF-TL-ResNeXt的滚动轴承故障诊断方法 [J]. 计量学报20234410): 1534-1542. [百度学术] 

HOU D XZHOU Z ACHENG R Cet al. Fault diagnosis method of rolling bearing based on GADF-TL-ResNeXt [J]. Acta Metrologica Sinica20234410): 1534-1542. [百度学术] 

22

RUIZ MMUJICA L EALF Set al. Wind turbine fault detection and classification by means of image texture analysis [J]. Mechanical Systems and Signal Processing2018107149-167. [百度学术] 

23

WANG QWU BZHU P FLiPeihuaet al. ECA-Net: Efficient channel attention for deep convolutional neural networks[C]// IEEE/CVF conference on computer vision and pattern recognitionSeattle, America2020. [百度学术] 

24

ZHANG WPENG GLICet al. A New Deep Learning Model for Fault Diagnosis with Good Anti-Noise and Domain Adaptation Ability on Raw Vibration Signals [J]. Sensors2017172):425. [百度学术] 

25

ZHAO MZHONG SFU Xet al. Deep Residual Shrinkage Networks for Fault Diagnosis [J]. IEEE Transactions on Industrial Informatics2020167): 4681-4690. [百度学术] 

26

刘俊孚岑健黄汉坤. 零小样本旋转机械故障诊断综述 [J]. 计算机工程与应用20246015): 42-54. [百度学术] 

LIU J FCEN JHUANG H Ket al. Review on zero or few sample rotating machinery fault diagnosis [J]. Computer Engineering and Applications20246015): 42-54. [百度学术]