一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法
未命名
10-08
阅读:134
评论:0

一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法
技术领域
1.本发明涉及一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,属于利用计算机模型检测轴承的技术领域。
背景技术:
2.在现代工业的发展过程中,大型机械设备如数控机床已呈现出复杂化、自动化以及集中化的发展趋势,常处于高负荷、变工况的连续运行状态。尽管数控机床技术能够很好地对批量加工工件的精度和质量进行准确控制,但在实际工作过程中,数控机床经常会因为各种因素出现故障,从而不能高效地运行。例如,数控机床关键工件的磨损会对加工工件的精度和质量产生直接影响,甚至可能引发安全事故导致机床停机和损坏。为确保数控机床的正常工作以及便利维修,必须加强设备初期的可靠性设计,并实施在线监测和健康管理。然而,数控机床设备结构复杂,子部件之间产生较强的耦合干涉,加之运行过程中内外非线性因素如阻尼、变刚度和时变外载荷等的影响,使得精确的物理模型难以建立并应用于监控和预测。在大数据背景下,各国都在促使基于数据驱动的健康评估框架搭建形成以及信息管理系统的开发,因此故障预测与健康状态管理(prognostics and health management,phm)应运而生。
3.在传统的剩余寿命预测领域,通常使用卷积神经网络或自编码器作为特征提取网络,用于提取退化特征,构建健康指标;使用循环神经网络进行寿命预测。对于卷积神经网络来说,其更适合处理图像等二维数据,而针对轴承的剩余寿命预测,往往处理的数据是一维时间序列振动信号数据。对于自编码器网络而言,其针对不同的轴承故障类型,需要设计不同的自编码器的结构,加大了工作量;同时,自编码器在提取故障特征时,容易出现特征损失的问题,导致提取的故障特征不准确;自编码器更容易出现过拟合问题。对于传统的循环神经网络来说,其存在梯度爆炸和梯度消失的问题,尤其在处理长时间序列数据时此类问题更为严重。
4.由于实际工况下采集的轴承历史运行状态数据存在大量的噪声干扰,如果直接输入到特征提取网络中,会极大地降低提取特征的有效性,但传统的卷积神经网络以及自编码器网络自身并不具备降噪的功能,往往需要在输入到特征网络之前,先进行振动信号数据降噪操作。而在数据降噪操作过程中,一旦故障信号被误过滤掉了,会导致后续算法的彻底失败,所以这种将信号降噪和特征提取分离开的思路存在问题。
技术实现要素:
5.针对现有技术的不足,本发明提出一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法。
6.发明概述
7.针对以上技术问题,本发明采用信号降噪和特征提取一体化方法,即深度残差收
缩网络drsn-cs,进行自适应信号降噪和自动提取退化特征;使用双向门控循环单元bigru作为寿命预测网络,相比传统的循环神经网络,更好地解决梯度消失和梯度爆炸问题,模型结构更加简单,计算速度更快,能够在更短时间内学习到更长的时间序列信息,同时bigru模型中的门控机制可以有效地控制信息地流动,提高网络的泛化能力。
8.本发明所述预测方法:首先对原始轴承振动信号进行归一化处理;然后利用drsn-cs模型学习并提取深层退化特征构建健康指标;最后将得到的健康指标输入到预测模型bigru+mlp中完成剩余使用寿命预测。
9.本发明详细的技术方案如下:
10.一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,包括:
11.s1:使用min-max标准化方法对原始轴承振动信号数据集进行归一化处理;
12.s2:搭建drsn-cs模型,将归一化后的数据集输入到drsn-cs模型中,得到一维轴承退化特征;
13.s3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;
14.s4:搭建bigru+mlp预测模型,将所述健康指标输入所述bigru+mlp预测模型,以训练最优bigru+mlp预测模型。
15.由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络训练时间增加,甚至引起网络无法收敛;为了避免此类问题的出现以及方便后续数据的处理,加快网络学习速度,本发明使用min-max方法对原始振动信号数据集进行归一化操作,将所有样本的输入信号其均值接近对0或与其均方差相比很小,有效去除振动信号中幅值影响,使得信号的频率、相位等特征更加清晰,能够更好地进行轴承故障特征提取;
16.本发明以xjtu-sy滚动轴承加速寿命试验数据集中的bearing1_3文件下的数据为例,将归一化结果进行可视化展示。bearing1_3数据集是3号轴承在工况1下,以25.6khz的采样频率,每间隔1min采集一次,采样时间持续1.28s,每次采集的样本点为32768,并将获取的振动信号保存为到csv文件中,依次为1.csv、2.csv
……
158.csv,每个csv文件中包含水平方向和垂直方向的振动信号。具体描述如表1所示下:
17.表1bearing1_3数据集介绍
[0018][0019]
bearing1_3数据集中1.csv文件中的原始振动信号数据如图4所示:
[0020]
将原始振动信号数据集中的数据值映射到[0-1]区间内,转换函数如下:
[0021][0022]
在公式(1)中,x
*
为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值;归一化后,如图5所示。
[0023]
根据本发明优选的,所述s2具体包括:
[0024]
s21:搭建drsn-cs模型,
[0025]
所述drsn-cs模型为深度残差收缩网络,结构图如图6所示,其包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个relu激活函数、一个全局均值池化和一个全连接输出层;
[0026]
所述残差网络包括:3个批标准化层、3个relu激活层、2个卷积层、全局均值池化层、2个全连接层、sigmoid函数层以及一个跨层恒等路径;其中c表示输入数据的通道数,w表示输入数据的宽度,1表示输入数据的高度,k表示卷积核个数,conv表示卷积层,m表示全连接层中的神经元数量,α表示放缩系数;“/2”表示通过以2的步长移动卷积核来减少输入数据的宽度;当k=c时,输出数据的通道数为c;针对以上输入数据高度为1的表述,是因为在本发明中,以一维振动信号作为输入,所有使得输入数据和卷积核的高度始终置为1,具体结构图如图7a、图7b所示;
[0027]
s22:利用drsn-cs模型提取一维轴承退化特征
[0028]
根据s1中的描述可知,获取的数据在三种工况下取得,数据的采样频率为25,6khz,每个1min记录一次,每次采样时间为1.28s,即每个样本包含了32768个采样点,获取的数据包含了水平方向振动信号和垂直方向振动信号,为了避免垂直方向受到外力后,导致主轴变换,从而对轴承垂直方向的振幅产生影响,只考虑水平方向振动信号;本发明中,在对原始水平方向振动信号归一化的基础上,以32768个采样点为一组构建数据集,最终的数据集大小为(32768*1);
[0029]
将s1归一化处理后的数据集输入所述drsn-cs模型,最终输出一维退化特征,并平滑处理得到健康指标;
[0030]
所述drsn-cs模型参数具体如表2所示:
[0031]
表2 drsn-cs模型参数
[0032][0033]
表3中,出现的(3,2,64),第一个参数代表卷积核大小,第二个参数代表步长,第三个参数代表卷积核个数;
[0034]
以工况1下bearing1_3数据集为例,图8为利用drsn-cs模型提取一维轴承退化特征。
[0035]
根据本发明优选的,所述s3具体包括:采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值;简单移动平均算法的计算公式如下所示:
[0036][0037]
在公式(2)中,v
t
代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑处理后的当前时刻的振动程度值,即是后续的健康指标;v
t-n
代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值;平滑后得到的健康指标如图9所示。
[0038]
根据本发明优选的,所述s4的具体方法,包括:
[0039]
所述bigru+mlp预测模型包括:长短时记忆网络lstm、门控循环单元gru和多层感知机mlp,其中门控循环单元gru组成了双向门控循环单元bigru;
[0040]
如图11所示,双向门控循环单元bigru通过一个正向gru传递信息和一个反向gru传递信息,从不同方向对输入数据进行特征提取,不仅可以学习到前一时刻数据对后一时刻数据产生的影响,也可以学习到后一时刻数据与前一时刻数据的关联关系,能够捕捉到被单向gru忽视掉的时序特征,从而提高了模型预测的准确度;
[0041]
所述双向门控循环单元bigru包括:一个输入层、一个正向gru层、一个反向gru层、一个拼接层以及一个dropout层;所述正向gru层负责将输入数据从前向后的信息编码到隐藏状态向量中,正向gru层的隐藏状态向量包含了当前时间步以前的输入信息;反向gru负责将输入数据从后向前的信息编码到隐藏状态向量中,反向gru层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;dropout层用于避免过拟合问题,具体各层网络结构如图12所示:
[0042]
所述多层感知机mlp,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”,层与层之间采用全连接的结构,跨层之间没有相连;通过隐藏层的加入,多层感知机弥补了单层线性回归的局限性,具体的网络结构图如图13所示;
[0043]
为了提高预测结果的准确率以及更快收敛,将bigru网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元,bigru+mlp网络的具体结构如图14所示;
[0044]
将drsn-cs网络提取的健康指标作为bigru+mlp预测模型的输入,最终完成剩余使用寿命预测,基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法完整网络结构图如图15所示。
[0045]
根据本发明优选的,所述预测方法,还包括:对所述bigru+mlp模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:
[0046]
平均绝对值误差,英文mean absolute error,英文简写mae;均方根误差,英文root mean square error,英文简写rmse,对模型的准确度进行评价,得到的损失值越小,说明预测值与真实值的误差越小,预测越准确,具体公式如下所示:
[0047]
[0048][0049]
在公式(3)、(4)中,mae表示预测值与真实值之间差值的绝对值的平均偏差;rmse表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i个样本的预测标签值;yi表示第i个样本的真实标签值。
[0050]
本发明的技术优点包括:
[0051]
(1)考虑到实际的数据是在强噪声背景下采集的,采用一种面向强噪声数据的深度学习方法
‑‑
深度残差收缩网络(drsn-cs)作为特征提取网络,其将自适应信号降噪和特征提取集成到一个网络中,避免了传统的将二者分开处理时常出现的问题,即在信号降噪过程中误过滤掉一些有用的特征信息,导致后续的算法错误。
[0052]
(2)结合输入数据为时间序列数据的特点,使用bigru网络,通过合并前向和后向信息流,更好地了解数据中的上下文和依赖关系,捕获和表示复杂特征,帮助模型做出更准确的预测。
[0053]
(3)尽管在bigru在提取序列信息时,展现出强大的融合前后信息的能力,但在将输出结果映射到目标结果时,其收敛速度较慢,且预测波动较大,为此,将bigru的输出结果输入到三层感知机中,增强网络的非线性表达能力,加快收敛。
附图说明
[0054]
图1是本发明机械轴承rul预测方法流程示意图;
[0055]
图2是工况1水平方向振动信号示意图;
[0056]
图3是工况1垂直方向振动信号示意图;
[0057]
图4是本发明中1.csv文件数据原始水平方向振动信号图;
[0058]
图5a是本发明中1.csv文件数据原始水平方向振动信号图;
[0059]
图5b是图5a归一化后的水平方向振动信号图;
[0060]
图6是深度残差收缩网络结构图;
[0061]
图7a是输入数据示意图;
[0062]
图7b是本发明卷积核示意图;
[0063]
图8是利用本发明所述bearing1_3提取的一维退化特征示意图;
[0064]
图9是bearng1_3数据集健康指标;
[0065]
图10是单个gru网络结构图;
[0066]
图11是bigru网络结构图;
[0067]
图12是bigru各层网络结构图;
[0068]
图13是多层感知机网络结构图;
[0069]
图14是bigru+mlp预测模型结构图;
[0070]
图15是drsn-cs和bigru+mlp预测模型完整网络结构图;
[0071]
图16是网络损失值示意图;
[0072]
图17是bigru+mlp预测模型训练损失图;
[0073]
图18是bearing1_2数据集剩余寿命预测结果图。
具体实施方式
[0074]
下面结合实施例和说明书附图对本发明做详细的说明,但不限于此。
[0075]
实施例1、
[0076]
如图1所示,一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,包括:
[0077]
s1:使用min-max标准化方法对原始轴承振动信号数据集进行归一化处理;
[0078]
s2:搭建drsn-cs模型,将归一化后的数据集输入到drsn-cs模型中,得到一维轴承退化特征;
[0079]
s3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;
[0080]
s4:搭建bigru+mlp预测模型,将所述健康指标输入所述bigru+mlp预测模型,以训练最优bigru+mlp预测模型。
[0081]
由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络训练时间增加,甚至引起网络无法收敛;为了避免此类问题的出现以及方便后续数据的处理,加快网络学习速度,本发明使用min-max方法对原始振动信号数据集进行归一化操作,将所有样本的输入信号其均值接近对0或与其均方差相比很小,有效去除振动信号中幅值影响,使得信号的频率、相位等特征更加清晰,能够更好地进行轴承故障特征提取;
[0082]
本发明以xjtu-sy滚动轴承加速寿命试验数据集中的bearing1_3文件下的数据为例,将归一化结果进行可视化展示。bearing1_3数据集是3号轴承在工况1下,以25.6khz的采样频率,每间隔1min采集一次,采样时间持续1.28s,每次采集的样本点为32768,并将获取的振动信号保存为到csv文件中,依次为1.csv、2.csv
……
158.csv,每个csv文件中包含水平方向和垂直方向的振动信号。具体描述如表1所示下:
[0083]
表1 bearing1_3数据集介绍
[0084][0085]
bearing1_3数据集中1.csv文件中的原始振动信号数据如图4所示:
[0086]
将原始振动信号数据集中的数据值映射到[0-1]区间内,转换函数如下:
[0087][0088]
在公式(1)中,x
*
为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值;归一化后,如图5所示。
[0089]
所述s2具体包括:
[0090]
s21:搭建drsn-cs模型,
[0091]
所述drsn-cs模型为深度残差收缩网络,结构图如图6所示,其包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个relu激活函数、一个全局均值池化和一个全连接输出层;
[0092]
所述残差网络包括:3个批标准化层、3个relu激活层、2个卷积层、全局均值池化层、2个全连接层、sigmoid函数层以及一个跨层恒等路径;其中c表示输入数据的通道数,w
表示输入数据的宽度,1表示输入数据的高度,k表示卷积核个数,conv表示卷积层,m表示全连接层中的神经元数量,α表示放缩系数;“/2”表示通过以2的步长移动卷积核来减少输入数据的宽度;当k=c时,输出数据的通道数为c;针对以上输入数据高度为1的表述,是因为在本发明中,以一维振动信号作为输入,所有使得输入数据和卷积核的高度始终置为1,具体结构图如图7a、图7b所示;
[0093]
s22:利用drsn-cs模型提取一维轴承退化特征
[0094]
根据s1中的描述可知,获取的数据在三种工况下取得,数据的采样频率为25,6khz,每个1min记录一次,每次采样时间为1.28s,即每个样本包含了32768个采样点,获取的数据包含了水平方向振动信号和垂直方向振动信号,为了避免垂直方向受到外力后,导致主轴变换,从而对轴承垂直方向的振幅产生影响,只考虑水平方向振动信号;本发明中,在对原始水平方向振动信号归一化的基础上,以32768个采样点为一组构建数据集,最终的数据集大小为(32768*1);
[0095]
将s1归一化处理后的数据集输入所述drsn-cs模型,最终输出一维退化特征,并平滑处理得到健康指标;
[0096]
所述drsn-cs模型参数具体如表2所示:
[0097]
表2 drsn-cs模型参数
[0098][0099][0100]
表3中,出现的(3,2,64),第一个参数代表卷积核大小,第二个参数代表步长,第三个参数代表卷积核个数;
[0101]
以工况1下bearing1_3数据集为例,图8为利用drsn-cs模型提取一维轴承退化特征。
[0102]
所述s3具体包括:采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值;简单移动平均算法的计算公式如下所示:
[0103][0104]
在公式(2)中,v
t
代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑
处理后的当前时刻的振动程度值,即是后续的健康指标;v
t-n
代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值;平滑后得到的健康指标如图9所示。
[0105]
所述s4的具体方法,包括:
[0106]
所述bigru+mlp预测模型包括:长短时记忆网络lstm、门控循环单元gru和多层感知机mlp,其中门控循环单元gru组成了双向门控循环单元bigru;
[0107]
如图11所示,双向门控循环单元bigru通过一个正向gru传递信息和一个反向gru传递信息,从不同方向对输入数据进行特征提取,不仅可以学习到前一时刻数据对后一时刻数据产生的影响,也可以学习到后一时刻数据与前一时刻数据的关联关系,能够捕捉到被单向gru忽视掉的时序特征,从而提高了模型预测的准确度;
[0108]
所述双向门控循环单元bigru包括:一个输入层、一个正向gru层、一个反向gru层、一个拼接层以及一个dropout层;所述正向gru层负责将输入数据从前向后的信息编码到隐藏状态向量中,正向gru层的隐藏状态向量包含了当前时间步以前的输入信息;反向gru负责将输入数据从后向前的信息编码到隐藏状态向量中,反向gru层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;dropout层用于避免过拟合问题,具体各层网络结构如图12所示:
[0109]
所述多层感知机mlp,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”,层与层之间采用全连接的结构,跨层之间没有相连;通过隐藏层的加入,多层感知机弥补了单层线性回归的局限性,具体的网络结构图如图13所示;
[0110]
为了提高预测结果的准确率以及更快收敛,将bigru网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元,bigru+mlp网络的具体结构如图14所示;
[0111]
将drsn-cs网络提取的健康指标作为bigru+mlp预测模型的输入,最终完成剩余使用寿命预测,基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法完整网络结构图如图15所示。
[0112]
实施例2、
[0113]
如实施例1所述预测方法,还包括:对所述bigru+mlp模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:
[0114]
平均绝对值误差,英文mean absolute error,英文简写mae;均方根误差,英文root mean square error,英文简写rmse,对模型的准确度进行评价,得到的损失值越小,说明预测值与真实值的误差越小,预测越准确,具体公式如下所示:
[0115][0116][0117]
在公式(3)、(4)中,mae表示预测值与真实值之间差值的绝对值的平均偏差;rmse表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i
个样本的预测标签值;yi表示第i个样本的真实标签值。
[0118]
结合上述实施例1、实施例2,对bigru+mlp预测模型训练及预测结果分析
[0119]
训练bigru+mlp预测模型,将从drsn-cs网络中获得的健康指标划分训练集train和验证集vaild,使用训练集训练出最佳预测模型,最终将测试集输入到最佳预测模型中进行剩余寿命预测。本发明选用工况1下的bearing1_3数据提取的健康指标作为训练集,将工况1下的bearing1_2数据提取的健康指标数据集作为测试集,用于剩余寿命预测。为方便训练标签的确定,根据实际健康指标长度,设置时间窗口的大小,由于本发明选用的健康指标长度较短,适当将时间窗口的大小调小,设置为5,即每连续取5个数据作为一个时间序列,即根据前5个时刻中的数据值预测下一时刻的数据值,移动步长为1。
[0120]
训练标签以每个采样点间隔时间为单位,采用轴承剩余寿命占全寿命周期的百分比进行确定,根据轴承的已使用时间通过该标签可计算出轴承的使用寿命。该标签方法满足以下公式:
[0121][0122]
其中,p
t
表示第t个时间序列的轴承使用寿命在全寿命周期的占比;t表示时间窗口的大小,本发明选择5;n表示全寿命周期,即采样点个数。
[0123]
之后,将标记好的训练集输入到bigru+mlp预测模型中进行训练,根据上述描述可知,数据集进入到bigru+mlp预测模型中,依次经过输入层、正向gru层、反向gru层、连接层、dropout层、感知机层1、感知机层2以及感知机层3,最终输出预测值。具体流程如下:
[0124]
第一步:将上述得到的每个时间序列中的数据输入到输入层,输出序列output1,大小为(5*1)。
[0125]
第二步:将第一步得到序列output1输入到正向gru层,学习当前时间步之前的输入信息;本发明设置每层gru的隐藏单元为128个,得到输出序列output2,大小为(5*128)。
[0126]
第三步:将第一步得到的序列output1输入到反向gru层中,学习当前时间步之后的输入信息;此层的隐藏单元依旧为128个,得到输出序列output3,大小为(5*128)。
[0127]
第四步:将第二步正向gru得到的输出output1和第三步反向gru得到输出output2在同一时间步进行拼接,得到最终的bigru输出output4,大小为(5*256)。
[0128]
第五步:将第四步得到的输出序列output4,输入到全连接层,将全连接层神经元与输出序列output4中的每个元素都连接,生成能够反映时间序列数据关键特征的新表示,达到降维和特征提取的作用;本发明中,设置全连接层的神经元个数为128,则得到输出序列output5,大小为(1*128)。
[0129]
第六步:将第五步的输出序列outpu5输入到dropout层进行正则化,避免在训练网络时出现过拟合问题,输出序列output6大小为(1*128)。
[0130]
第七步:将第六步的输出序列output6,作为第一层感知机的输入,与该层中的隐藏层的神经元进行全连接;本发明设置第一层感知机中隐藏层的神经元个数为70,得到隐藏层输出output7,大小为(1*70)。
[0131]
第八步:将第一层感知机中隐藏层的输出output7,作为第二层感知机的输入,与该层中的隐藏层的神经元进行全连接;本发明设置该层的隐藏层神经元个数为30,最后得到隐藏层的输出output8,大小为(1*30)。
[0132]
第九步:将第二层感知机中隐藏层的输出output8,作为第三层感知机的输入,与
该层中的隐藏层的神经元进行全连接,之后送入输出层进行输出;本发明设置该层的隐藏层神经元个数为1,最后得到输出即为剩余寿命预测值,大小为(1*1)。
[0133]
bigru+mlp预测网络网络参数如下:
[0134]
表3bigru+mlp预测网络参数
[0135][0136]
该网络的训练损失值如图16所示,可从图中看出,本发明使用的网络收敛效果较好,训练损失值较低。使用测试集进行相应轴承的剩余使用寿命预测,得到rmse值为0.0149,mae值为0.0138。下图为使用本发明中方法得到的预测值与真实值的对比示意图,如图17所示。
[0137]
同时,使用本发明中方法得到的结果,在平均绝对值误差、均方根误差上均表现良好,证明了本发明提出方法对轴承剩余使用寿命预测的有效性,能够为滚动轴承剩余使用寿命预测研究提供参考,如图18所示。
[0138]
具体应用场景:
[0139]
选取xjtu-sy滚动轴承加速寿命试验数据集实施一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,具体包含以下步骤:
[0140]
s1:获取轴承的全生命周期振动信号
[0141]
获取轴承振动信号所用的轴承加速寿命测试平台由西安交通大学机械工程学院雷亚国教授团队联合实验室设计,由浙江长兴昇阳科技有限公司加工制造。为获取轴承的全寿命周期振动信号,分别通过安装在测试轴承的水平和垂直方向上的加速度传感器采集振动信号。试验设置的采样频率为25.6khz,采样间隔为1min,每次采样时间为1.28s;且包含三种不同工况,如表4所示。原始信号的全寿命周期振动信号如图2和图3所示:
[0142]
表4轴承加速寿命试验工况
[0143][0144]
s2:特征提取
[0145]
由于原始振动信号数据值的范围差异较大,且常包含一些奇异样本数据,这些奇异样本数据的存在会导致网络无法收敛,甚至影响预测的准确率,所以采用min-max(最小最大)标准化方法对原始数据进行归一化处理,将值映射到[0-1]区间内,转换函数如下:
[0146]
[0147]
其中max为样本数据最大值,min为最小值,x为样本数据。
[0148]
s3:搭建特征学习网络drsn-cs
[0149]
1、drsn-cs基本网络结构
[0150]
深度残差网络在卷积神经网络的基础上进行了改进,增加了一个残差学习结构,通过引入跨层恒等连接,降低了模型训练的难度,提高了特征学习能力。但在实际场景中,一些大型机器通常含有大量噪声,这导致残差网络的学习能力下降。为了减低噪声的干扰,深度残差收缩网络通过通道内共享阈值的方法对深度残差网络中的残差模块进行了改进。改进后的残差模块中,将一个软阈值函数作为非线性转换层,同时嵌入一个子网络,通过注意力机制自动设置软阈值化所需要的阈值。这种方式,通过之前的卷积层,将一些重要的特征转化成绝对值比较大的值,将不必要的特征转化成绝对值较小的值;之后通过子网络学习得到两者之间的界限;最终通过软阈值化将重要特征置为非零,不必要特征置为零进行输出。
[0151]
完整的深度残差收缩网络结构图如图6所示。其包括了一个输入层、一个卷积层、若干残差模块、一个批标准化、一个relu激活函数、一个全局均值池化和一个全连接输出层。
[0152]
其中残差模块包含了3个批标准化层、3个relu激活层、2个卷积层、全局均值池化层、2个全连接层、sigmoid函数层以及一个跨层恒等路径。
[0153]
其中c表示特征图的通道数,w表示特征图的宽度,k表示卷积核个数,conv表示卷积层。当k=c时,输出的特征图的通道数为c。
[0154]
2、搭建特征学习网络drsn-cs,提取一维轴承退化特征
[0155]
将步骤二中提取的特征数据集划分训练集和测试集,其中以32768个采样点为一组。本发明选用3*3的小卷积核,移动步长为2,卷积核个数为64,具体参数如表5所示。
[0156]
表5drsn网络结构参数
[0157][0158][0159]
以工况下bearing1_5数据集作为训练集,bearing1_3数据集作为测试集,图16为drsn-cs模型训练得到的损失值,图8为提取的一维退化特征;
[0160]
3、退化特征平滑处理—健康指标
[0161]
本发明采用简单移动平均算法对一维退化特征进行处理,使得数据更平滑,数据含噪声更少,过滤掉一些异常值。简单移动平均算法的计算公式如下所示:
[0162][0163]
其中,v
t
代表下一时刻的预测值;v
t-n
代表前n时期的实际值。
[0164]
平滑后得到的健康指标如图9所示。
[0165]
s4:搭建bigru+mlp预测模型,输出预测结果
[0166]
1、bigru+mlp基本网络结构
[0167]
2、bigru+mlp模型
[0168]
3、性能评价指标
[0169]
4、bigru+mlp模型训练及预测结果分析
[0170]
本发明选用工况1下的bearing1_5数据提取的健康指标作为训练集,选取[0,52]范围内的数据,设置对应的训练标签为[52:0];将工况1下的bearing1_3数据提取的健康指标数据集作为验证集,用于验证模型训练的好坏,设置对应的标签为[158:0]。在训练过程中,选择adam算法作为优化器,训练次数为100;在多次实验中优化参数,最终确定最佳批处理大小(batch_size)为64,过拟合率(dropout)为0.2,学习率(learn rate)为0.0004。具体如表6所示。
[0171]
表6网络训练相关参数
[0172][0173]
根据以上内容可知,使用本发明中方法得到的结果,在平均绝对值误差、均方根误差上均表现良好,证明了本发明提出方法对轴承剩余使用寿命预测的有效性,能够为滚动轴承剩余使用寿命预测研究提供参考。
技术特征:
1.一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,包括:s1:使用min-max标准化方法对原始轴承振动信号数据集进行归一化处理;s2:搭建drsn-cs模型,将归一化后的数据集输入到drsn-cs模型中,得到一维轴承退化特征;s3:对一维轴承退化特征进行平滑处理,得到健康指标;划分预测模型的训练集和测试集;s4:搭建bigru+mlp预测模型,将所述健康指标输入所述bigru+mlp预测模型,以训练最优bigru+mlp预测模型。2.根据权利要求1所述一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,在s1中,对轴承的全生命周期振动信号进行min-max归一化处理,将数据集中的数据值映射到[0-1]区间内,转换函数如下:在公式(1)中,x
*
为对当前数据点x归一化处理后的标准值;max为样本数据最大值;min为样本数据最小值。3.根据权利要求1所述一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,所述s2具体包括:s21:搭建drsn-cs模型,所述drsn-cs模型为深度残差收缩网络,包括:一个输入层、一个卷积层、若干残差网络、一个批标准化、一个relu激活函数、一个全局均值池化和一个全连接输出层;所述残差网络包括:3个批标准化层、3个relu激活层、2个卷积层、全局均值池化层、2个全连接层、sigmoid函数层以及一个跨层恒等路径;s22:利用drsn-cs模型提取一维轴承退化特征将s1归一化处理后的数据集输入所述drsn-cs模型,最终输出一维退化特征,并平滑处理得到健康指标。4.根据权利要求1所述一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,所述s3具体包括:采用简单移动平均算法对一维退化特征进行处理,简单移动平均算法的计算公式如下所示:在公式(2)中,
t
代表下一时刻的预测值,预测值代表经过简单移动平均方法平滑处理后的当前时刻的振动程度值,即是后续的健康指标;v
t-n
代表前n时期的实际值,实际值代表原始的一维退化特征,也就是原始的振动程度值。5.根据权利要求1所述一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,所述s4的具体方法,包括:所述bigru+mlp预测模型包括:长短时记忆网络lstm、门控循环单元gru和多层感知机mlp,其中门控循环单元gru组成了双向门控循环单元bigru;所述双向门控循环单元bigru包括:一个输入层、一个正向gru层、一个反向gru层、一个拼接层以及一个dropout层;所述正向gru层负责将输入数据从前向后的信息编码到隐藏状
态向量中,正向gru层的隐藏状态向量包含了当前时间步以前的输入信息;反向gru负责将输入数据从后向前的信息编码到隐藏状态向量中,反向gru层的隐藏状态向量包含了当前时间步之后的输入信息。之后经过拼接层将两个方向的输出在每个时间步上进行拼接,将正向和反向的信息结合起来,获得全局的输入信息;全连接层用于将拼接层输出的向量进行线性变换,以获得更高维度的特征表示;dropout层用于避免过拟合问题:所述多层感知机mlp,包括输入层、隐藏层和输出层,其中所述隐藏层被看作是输入层和输出层之间的虚拟一层,作为“二次输入”;将bigru网络的输出结果送入三层感知机中,将隐藏层与输出层进行全连接,即当前层的神经元连接前一层的所有神经元;将drsn-cs网络提取的健康指标作为bigru+mlp预测模型的输入,最终完成剩余使用寿命预测。6.根据权利要求1-5任意一项所述一种基于drsn-cs和bigru+mlp模型的机械轴承剩余使用寿命预测方法,其特征在于,所述预测方法,还包括:对所述bigru+mlp模型的准确度进行评价的方法,采用均绝对值误差和均方根误差进行评价:平均绝对值误差,英文mean absolute error,英文简写mae;均方根误差,英文root mean square error,英文简写rmse,具体公式如下所示:error,英文简写rmse,具体公式如下所示:在公式(3)、(4)中,mae表示预测值与真实值之间差值的绝对值的平均偏差;rmse表示预测值和真实值之间差值的平方的平均偏差的平方根;n表示样本数量;表示第i个样本的预测标签值;y
i
表示第i个样本的真实标签值。
技术总结
一种基于DRSN-CS和BiGRU+MLP模型的机械轴承剩余使用寿命预测方法,采用信号降噪和特征提取一体化方法,即深度残差收缩网络DRSN-CS,进行自适应信号降噪和自动提取退化特征;使用双向门控循环单元BiGRU作为寿命预测网络,相比传统的循环神经网络,更好地解决梯度消失和梯度爆炸问题,模型结构更加简单,计算速度更快,能够在更短时间内学习到更长的时间序列信息,同时BiGRU模型中的门控机制可以有效地控制信息地流动,提高网络的泛化能力。本发明所述预测方法:首先对原始轴承振动信号进行归一化处理;然后利用DRSN-CS模型学习并提取深层退化特征构建健康指标;最后将得到的健康指标输入到预测模型BiGRU+MLP中完成剩余使用寿命预测。用寿命预测。用寿命预测。
技术研发人员:张让勇 郭文杰 闫蕊 顾笑言 刘琦
受保护的技术使用者:齐鲁工业大学(山东省科学院) 山东山科智控数字化科技有限公司
技术研发日:2023.06.06
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/