风力发电机行星齿轮箱数据集 | 写论文再也不用担心没数据集啦!
继上次推荐的航空发动机轴承数据集,今天给大家推荐一个风力发电机行星齿轮箱公开数据集,该数据集是继东南大学行星齿轮箱数据集的第2个行星齿轮箱数据集,该数据集有5种健康状态、8个转速,还考虑了不同安装效果,诊断起来更具有挑战性。该数据集是2023年公开的,因此目前基于该数据集的论文不是很多,小伙伴们赶紧用起来吧!对于研究风力发电机故障诊断的小伙伴们,再也不用担心写论文找不到数据啦。
论文信息
论文题目:
A review on deep learning in planetary gearbox health state recognition: Methods, applications, and dataset publication
DOI:10.1088/1361-6501/acf390
期刊:Measurement Science and Technology
年份:2023年
作者:Dongdong Liu1* , Lingli Cui1 , and Weidong Cheng2
机构:
1)Key Laboratory of Advanced Manufacturing Technology, Beijing University of Technology, Beijing, China ;
2) School of Mechanical, Electronic and Control Engineering, Beijing Jiaotong University, Beijing, China
摘要
行星齿轮箱在机械传动中具有多种优点,但其复杂的结构和复杂的工作方式给故障诊断带来了很大的挑战。深度学习在智能故障诊断中受到越来越多的关注,并已成功应用于行星齿轮箱故障诊断,避免了用信号处理方法人工分析复杂故障特征的困难。本文介绍了一种基于深度学习的行星齿轮箱健康状态识别方法。 首先,分析了行星齿轮箱复杂的振动特性给故障诊断带来的挑战。其次,根据深度学习在行星齿轮箱故障诊断中的普及程度,简要介绍了六种主流算法,即自编码器 (AE) 、深度玻尔兹曼机 (DBM)、卷积神经网络(CNN)、Transformer、生成对抗网络(GAN)和图神经网络(GNN),以及它们的一些变体。然后,综述了这些方法在行星齿轮箱故障诊断中的应用。最后对本研究的研究前景和面临的挑战进行了讨论。根据面临的挑战,本文介绍了一个数据集,以方便今后的研究。
数据获取: 数据github下载链接
上述链接若打不开,文末有百度网盘链接。
目录
-
引言
-
行星齿轮箱振动特性和挑战
-
深度学习概述
3.1 自编码器
3.2 受限玻尔兹曼机
3.3 卷积神经网络及其变体
3.4 Transformer
3.5 生成对抗网络
3.6 图神经网络
-
深度学习在行星齿轮箱故障诊断中的应用
4.1 自编码器
4.2 受限玻尔兹曼机
4.3 卷积神经网络及其变体
4.4 Transformer
4.5 生成对抗网络
4.6 图神经网络
-
研究展望
-
公开数据集
6.1 现有公开数据集
6.2 数据集公开
-
总结
-
README.md
注:本文主要是想分享公开数据集,如果想了解本文综述其它部分内容,请再自行阅读原论文。
小编能力有限,若有不足,烦请多多指正。
1. 引言
频率成分的有效识别是旋转机械故障的常用方法。例如,如果一个滚动轴承有一个局部故障,故障特征频率将存在于轴承的包络谱,当故障发生在滚动轴承的外圈、内圈和滚动体等不同部位时,其频率值也会有所不同。当齿轮发生故障时,在齿轮啮合频率(GMF)附近会出现边带,通过分析边带与齿轮啮合频率之间的间隔值可以定位齿轮的故障。然而,由于行星齿轮箱复杂的结构和运行模式导致其复杂的调制特性,通过频谱分析实现故障诊断是具有挑战性的。如图1 (a)所示,行星齿轮箱通常包括太阳轮、多个行星齿轮、齿圈、行星架和行星轴承。有多个啮合副,行星齿轮和行星轴承,分别如图1(b)和©所示,不仅绕自己的轴旋转,而且还绕太阳轮的轴旋转此外,故障分量和传感器之间的传输路径总是时变的,因此,由于行星齿轮箱具有独特的振动特性,常用的定轴齿轮箱和轴承故障诊断方法并不适用于行星齿轮箱。研究人员已经发展了许多有效的方法来实现行星齿轮箱的故障诊断,如发展特殊的滤波方法来去除千扰分量并提出先进的时频分析(TFA) 方法以更好地识别边带,这些方法已经取得了很大的成功,但基于频率识别的方法依赖于在很大程度上依赖于专家知识,并且生成频谱并分析频率内容是耗时的。
图1 (a) 行星齿轮组 (b)太阳轮和行星轮的啮合对 ©行星滚动轴承的示意图
已经发表了几篇总结智能故障诊断方法研究综述。然而,在文献[28],主要回顾了传统的基于机器学习的方法。在文献[14]和[17],方法主要集中在轴承和定轴齿轮箱故障诊断进行了综述。很少有出版物介绍行星齿轮箱故障诊断。在文献[29],仅对智能轴承故障诊断方法进行了综述。与滚动轴承和定轴齿轮箱相比,行星齿轮箱由于其复杂的运动机理、复杂的时变传递路径和多个啮合振动的干扰等因素,实现准确的健康状态识别更加困难。各种工作讨论挑战,并提出了解决这些问题的方法,如构建动态模型,以揭示特殊的振动性质;安装内部传感器,以消除传输路径的影响;并开发新的专用滤波器,以分离啮合振动。深度学习为行星齿轮箱健康状态识别提供了新的解决方案,并发表了卓有成效和有意义的工作。
据我们所知,目前还没有关于深度学习在行星齿轮箱故障诊断中应用的综述。本文分析了行星齿轮箱的振动特性以及故障诊断面临的挑战,介绍了深度学习在行星齿轮箱故障诊断中的主流方法,并对深度学习在行星齿轮箱故障诊断中的应用进行了全面综述。 最后,我们分析了本研究所面临的挑战,并提出了几个展望。考虑到高价格的行星齿轮箱试验台,以方便研究分析的挑战,发布了一个数据集。我们希望本文能为研究生、机构和公司提供对行星齿轮箱振动特性、深度学习方法原理的初步了解,更重要的是,深度学习方法在行星齿轮箱故障诊断中的应用。
本综述的其余部分安排如下。在第2节分析了行星齿轮箱的振动特性。第3节介绍了6种主流的深度学习算法。第4节介绍了深度学习方法在行星齿轮箱中的应用。在第5节中,公开行星齿轮箱数据集。第6节介绍了本文的研究前景。结论在第7节。
2. 行星齿轮箱振动特性和挑战
图2(a)和(b)分别说明了定轴齿轮组和带静止内齿圈的行星齿轮组的传动图。定轴齿轮箱由齿轮啮合副组成,两个齿轮绕其定轴转动。因此,定轴齿轮箱的振动是非常简单的。正常的齿轮箱只有齿轮啮合频率(gear meshing frequency, GMF)和它的谐波。当齿轮发生故障时,随着故障齿轮轴频的间隔,其谐波和GMF将出现边带。
图2 (a)定轴齿轮系传动图 (b)带静止齿圈的行星齿轮组传动图
对于一个行星齿轮箱,总是有多个行星齿轮围绕它们的未固定的轴旋转。如图1 (a) 所示,行星齿轮组由太阳轮、齿圈和四个行星齿轮组成。太阳轮绕自己的轴旋转,内齿圈是静止的,四个行星齿轮绕各自的轴旋转,并绕固定的太阳轮轴公转。也可以看出,这些行星齿轮运行之间的太阳轮和齿圈,所以他们两个同时啮合。 此外,在每个行星齿轮中有一个滚动轴承,它们也绕着自己的轴旋转,并围绕固定的太阳轮旋转。因此,行星齿轮箱的振动表现出以下特点:
(1)行星齿轮箱独特的结构和复杂的工作方式导致了更为复杂的频率成分。当行星齿轮箱中的一个部件发生故障时,除了行星齿轮箱中的GMF外,其周围还存在着复杂的边带及其谐波。这些边带与GMF或其谐波的间隔是故障齿轮的轴旋转频率和其相应的特征频率的各种组合。另外,不同部位的故障会引起不同的故障特征频率。因此,与定轴齿轮箱相比,振动信号中含有更多复杂的频率成分。此外,复杂的边带和GMF谐波之间的间隔是非常接近的,这使得它很难识别它们并定位故障。
(2)多个时变传动路径的存在增加了揭示行星齿轮箱振动特性的难度。因为总是有几个行星齿轮,除了内齿圈故障外,在一个故障部件和安装在行星齿轮箱外壳上的传感器之间有多个传输路径。此外,使用行星齿轮时,传动路径是时变的。因此,故障齿轮的振动将由于所造成的干扰和耗散效应的路径而产生衰减,使得难以揭示所收集的信号的故障特征。
(3)行星轴承的振动与定轴齿轮箱中的轴承相比,很难检测到。即使是定轴齿轮箱,滚动轴承的振动特性也弱于强啮合振动。对于行星轴承而言,由于行星轮、内齿圈和太阳轮之间复杂的啮合振动和复杂的传动路径,使得行星轴承的健康监测更具挑战性。
通过以上分析可以发现,相对于定轴齿轮箱,行星齿轮箱的故障诊断更加困难。研究人员致力于揭示行星齿轮箱的特性。随着深度学习的快速发展,它已经成为一种很有前途的方法来识别机械健康状态,并有望从收集的数据中自动学习故障信息。因此,针对行星齿轮箱的故障诊断,开发了各种先进的深度学习模型。在接下来的两节中,简要介绍了在行星齿轮箱故障诊断中常用的深度学习方法,并对深度学习在行星齿轮箱故障诊断中的应用进行了综述。
3. 深度学习概述
迄今为止,各种深度学习结构已经被研究过,关于这个主题的研究仍在迅速增长。在本节中,只简单介绍一些已经应用在行星齿轮箱故障诊断中的主要深度学习方法,以使第四节中涉及的高级方法更容易理解。
注:本节只摘抄了原论文的一些模型图,大家可以学学优秀论文绘图的一些配色和技巧。如需了解更多,请自行阅读原文。
3.1 自动编码器(Autoencoder, AE)及其深度模型
图3 AE的结构
3.2 受限玻尔兹曼机(Restricted Boltzmann machine, RBM)
图4 (a)RBM、(b)DBN和©DBM的结构
3.3 卷积神经网络及其它的变体
图5 2DCNN的架构
3.4 Transformer
图6 (a)Scaled Dot-Product attention (b) 多头自注意力(MSA)
3.5 生成对抗网络Generative adversarial network, GAN)
图7 GAN的流程
3.6 图神经网络(Graph neural network, GNN)
图8 度矩阵、邻接矩阵和拉普拉斯矩阵之间的关系
图9 双层GCN
4. 深度学习在行星齿轮箱故障诊断中的应用
图10 选定的深度学习方法在行星齿轮箱故障识别中的比例
4.1 自编码器及其深度模型
图11 判别稀疏自编码器(discriminative sparse autoencoder DSAE)结构
表1 基于AE的故障诊断方法参考列表
4.3 卷积神经网络
图12 WPT-HSCNN模型流程图
图13 DEFT-CNN模型流程图
图14 ACW-CNN模型结构
表2 基于CNN故障诊断模型的文献列表
4.4 Transformer
图15 VATN(variational attention-based transformer network)模型结构
图16 MCDT(multisensor cross-domain transformer)模型结构
4.5 生成对抗网络(GAN)
图17 基于WT-CNN-GAN方法流程图
4.6 图神经网络(GNN)
图18 MRF-GConv结构
5. 研究展望
虽然深度学习在行星齿轮箱故障诊断方面取得了很大的成功,但仍有很大的提升空间,尤其是在实际应用中。相应地,本文提出了一些研究挑战和展望
(1) 模型可解释性:深度学习方法可以从行星齿轮箱的原始振动信号中自动学习隐藏的特征。然而,这些模型的计算机制是无法解释的,因此它们被视为黑箱。目前已经做了一些轴承故障诊断模型解释的工作了。据我们所知,目前还没有行星齿轮箱故障诊断模型解释的报道。用于行星齿轮箱故障识别的模型必须加以解释,基于故障信息的决策是令人怀疑的,因为行星齿轮箱比较复杂,故障信息是难以学习的。建议在深度学习模型中加入行星齿轮箱数据调幅和调频特性的模块,使模型主要关注故障相关信息。
(2) 深层多传感器模型:故障元件与传感器之间存在多条时变的传递路径,由于耗散和干扰的影响可能会衰减故障元件的振动。从理论上讲,来自不同位置的振动信号将是互补的,所以构建深度模型,融合从多个传感器收集的数据与一个适当的传感器布置将有助于提高精度。此外,在频率解调方法中,与振动信号相比,编码器的数据更简单可用于多传感器智能故障诊断。 在基本模型方面考虑到Transformer的特征提取能力和图模型对多传感器的高交互度量能力,Transformer模型和GNN模型将非常适合于多传感器数据融合。
(3) 基于特征的迁移深度学习 (Feature-based transferable deep learning, FTDL)模型:FTDL模型通过域自适应方法在轴承故障诊断研究中取得了成功,这有助于实现无标签数据的目标机器设备故障识别。不同故障部位引起的轴承振动信号幅值调制有明显差异,而行星齿轮箱不同故障部位引起的振动信号没有明显差异且行星齿轮箱中的元件较多。 因此,在目标行星齿轮箱没有标签数据的情况下,实现跨行星齿轮箱故障识别是比较困难的。一种很有潜力的方法是利用多传感器融合方法实现域自适应,从而使模型更容易地从各种源数据中学习域不变特征。此外,与流行的CNN相比,Transformer表现出良好的全局特征捕捉能力。从理论上讲,Transformer在域适应领域将提供更好的结果,因为工况主要是产生不同幅值大小的故障脉冲。
(4) 非平稳条件下的深度模型:行星齿轮箱总是在非平稳条件下运行。例如,风力发电机中的行星齿轮箱的旋转速度经常由于风力和方向的变化而波动。非平稳条件将引起更复杂的调制特性,例如振动信号的振幅、相邻脉冲的间隔以及时频表征(Time-frequency representatives, TFR)中随时间变化的特征频率,这就增加了深度模型提取特征的难度。然而,相关出版物很少。因此,深入研究对转速波动和负荷变化具有鲁棒性的深度模型,对于将智能诊断方法推向实际工业应用具有重要的现实意义。 虽然一些技术,如最大平均偏差(maximum mean discrepancy, MMD)和对抗训练,都被用来提高工况鲁棒性,但是它们只适用于几个不同的固定速度。适当的组合先进的信号处理方法,如阶次跟踪、时频方法、稀疏理论和深度学习和深度学习模型将有利于提高精度。也许,将编码器数据合并到模型中是提高速度自适应能力的有效方法。
(5) 开源数据及安装效果研究:在实际应用中,与提供训练数据的机器相比,被监测机器需要重新安装,因此安装效果是实际应用中的一个重要因素。由于行星齿轮箱的结构复杂,以及行星轴承等部件的故障特征,是非常弱的,如果使用在相同安装下收集的相同数据来训练和测试模型,则无法确定从训练数据中学习到的表示是故障信息还是安装信息。因此,分享更多的根据实际应用收集的数据,以吸引更多的关注是有意义和价值的。
(6) 模型泛化:虽然已经验证的深度模型可以产生较高的识别结果,但它们仅在实验室实验测试台上进行过测试。大多数试验台结构简单,运行平稳,但在实际应用中,被监测机械往往比较复杂,而且行星齿轮箱的载荷随其载荷的实时变化而变化。此外,故障类型比齿轮或轴承上的制造故障更复杂。预计在真正的工业应用中收集到的更多数据将可用于进一步测试这些模型,并进一步推动研究人员开发出更有用的深度模型。为了提高模型的泛化能力,除了开发新的模型结构外,建议在模型中加入物理机理或领域知识,使其学习到更多的故障信息,这显然可以提高对运行工况或新设备的泛化能力。
6.公开数据集
6.1现有公共数据集
基于深度学习的故障诊断模型通常需要大量的数据来优化,因此高质量的数据对于模型的构建和测试是必不可少的。然而,在实际的工业应用中,数据收集成本是很高的,实验测试平台通常是昂贵的。幸运的是,我们的研究有几个公开的数据集。常用的数据集包括CWRU轴承数据集,IMS全寿命周期数据,PU轴承数据集,MFPT轴承数据集和XJTU-SY轴承加速寿命实验数据集,PHM2009定轴齿轮箱数据集,和东南大学行星齿轮箱数据集,可以看出,大多数公共数据集与轴承故障有关,而且,据我们所知,只有一个可用的公共行星齿轮箱数据集,这是发表在参考文献[165],并可以从链接下载[166]。
东南大学行星齿轮箱数据集是从一个传动系动态模拟器中收集的。有四个故障工况,每个健康条件考虑两个运行工况。采集了X、Y、Z三个方向的振动信号。该数据集通常用于智能行星齿轮箱故障诊断。
图19 风力发电机组传动系统试验台
6.2 数据集公开
在本节中,介绍了从北京交通大学风力发电机传动系统试验台的行星齿轮箱中收集的数据集(名为"WT-Planetary gearbox dataset”),如图19所示。试验台由电机、行星齿轮箱、定轴齿轮箱和负载装置组成。有四个行星齿轮围绕一个太阳轮旋转。太阳轮的五种健康状况如图20(b)-(f)所示。振动数据由Sinocera CA-YD-1181加速度计采集,速度脉冲由编码器采集。所有通道的采样率设置为48kHz。表3中列出了行星齿轮箱的详细参数以及两个关键故障相关频率与输入轴频率之间的关系。数据集的优势列举如下。
图20 (a)行星齿轮箱的内部结构 (b)健康状况 ©齿轮断齿 (d)齿轮磨损 (e)齿根裂纹 (f)缺齿
表3 行星齿轮箱参数
注:fr代表太阳轮的旋转频率。
(1)体积大。每种健康状况的数据收集时间超过5分钟。对于最流行的CWRU数据集,信号长度约为10秒。在以前的论文中,样本长度通常设置为1000到2000点。如果我们将样本的长度设置为2000,那么对于每一种健康状况,在不进行重叠运算的情况下,可以得到7000多个样本,这对于深度网络优化来说已经足够了。 (2)多传感器数据。如第4.3节所述,编码器信号更简单,包含丰富的故障信息,各种研究已经验证了它们在基于信号解调的行星齿轮箱故障诊断中的优势。对于数据集来说,x和y方向的两个振动信号和行星齿轮箱输入轴的编码器数据是同时收集(每个工况"Data“中的前三个通道)可用于多传感器深度学习模型的研究。 (3)运行工况。跨域故障诊断是基于深度学习的故障诊断的一个重要分支。在这个数据集中,八个速度条件,即20Hz,25Hz,30Hz,35Hz,40Hz,45Hz,50Hz,和55Hz,考虑了每个健康状况。这使得它非常适合于智能行星齿轮箱故障识别中的模型泛化和迁移学习任务的研究 (4)安装效果。如图21所示,在实际应用中用于训练的历史数据和实时数据必须从不同的装置中采集,因此在模型试验中应考虑装置因素。在这个数据集中,所有八个运行条件下的所有健康状况收集两次拆卸和安装的数据。
该设备包括振动传感器,编码器和数据采集卡被验证是有效的,在一个简单的轴承试验台我们已经分析了一些数据采集设备通过解调技术从测试平台收集到的相同的数据,可求出太阳轮的故障特征频率。这些数据是高质量的,有望为相关研究人员在这一课题上的研究提供便利。
WT-行星齿轮箱数据集可以从https://github.com/Liudd-BJUT/WT-planetary-gearbox-dataset链接中找到数据集。
图21 智能故障识别中的安装因素示意图
7.总结
本文对基于深度学习的行星齿轮箱故障诊断方法进行了综述。深度学习模型可以从收集到的数据中自动学习隐藏的特征,提供端到端的故障诊断,避免了行星齿轮箱结构复杂、工况错综复杂所带来的挑战。为使先进的深度学习方法的应用更易于理解,介绍了几种在行星齿轮箱故障诊断中已被广泛采用的深度学习方法的原理。然后,回顾了深度学习方法在最近五年时间框架中的应用。最后,我们为未来的研究提供了几个开放的课题虽然已经取得了可喜的成果,但要将上述方法推广到实际应用中仍存在一些挑战。强烈期望研究更多的实际工况,如安装的效果,以确保深度模型是基于故障信息作出决定,而不是干扰因素。因此,我们将尽最大努力解决这些挑战。
8. README.md
This dataset was published in
Dongdong Liu, Lingli Cui, and Weidong Cheng. A review on deep learning in planetary gearbox health state recognition: Methods, applications, and dataset publication, Measurement Science and Technology, DOI 10.1088/1361-6501/acf390,
which is expected to facilitate the investigations on the challenges mentioned in Section 5.
Detailed descriptions on this dataset can be found in Section 6.2 of the paper.
This dataset is introduced in the JOURNAL paper. Please state this to avoid any conflict of interest.
WT-planetary-gearbox-datasets 2023-8-22
数据集获取方法:公众号《故障诊断与python学习》后台回复“风力发电机齿轮箱公开数据集”