基于类对比簇分配异构迁移学习的空间滚动轴承寿命阶段识别

刘峰良 李锋 汤宝平 汪永超 田大庆

刘峰良, 李锋, 汤宝平, 等. 基于类对比簇分配异构迁移学习的空间滚动轴承寿命阶段识别 [J]. 工程科学与技术, 2024, 56(1): 256-266. doi: 10.15961/j.jsuese.202300291
引用本文: 刘峰良, 李锋, 汤宝平, 等. 基于类对比簇分配异构迁移学习的空间滚动轴承寿命阶段识别 [J]. 工程科学与技术, 2024, 56(1): 256-266. doi: 10.15961/j.jsuese.202300291
LIU Fengliang, LI Feng, TANG Baoping, et al. Life Stage Identification of Space Rolling Bearings Based on Class-contrast Cluster-allocation Heterogeneous Transfer Learning [J]. Advanced Engineering Sciences, 2024, 56(1): 256-266. doi: 10.15961/j.jsuese.202300291
Citation: LIU Fengliang, LI Feng, TANG Baoping, et al. Life Stage Identification of Space Rolling Bearings Based on Class-contrast Cluster-allocation Heterogeneous Transfer Learning [J]. Advanced Engineering Sciences, 2024, 56(1): 256-266. doi: 10.15961/j.jsuese.202300291

基于类对比簇分配异构迁移学习的空间滚动轴承寿命阶段识别

基金项目: 中央高校基本科研业务费(2022CDZG–12);机械传动国家重点实验室开放基金资助项目(SKLMT–KFKT–201718);四川省重点研发项目(2020KJT0117–2020YFQ0039)
详细信息
    • 收稿日期:  2023-04-16
    • 网络出版时间:  2023-08-01 03:00:57
  • 作者简介:

    刘峰良(1998—),男,硕士生. 研究方向:机械设备状态监测;故障诊断. E-mail:1562021338@qq.com

    通信作者:

    李锋, 副教授,E-mail:lifeng19820501@163.com

  • 中图分类号: TH113;TP391.4

Life Stage Identification of Space Rolling Bearings Based on Class-contrast Cluster-allocation Heterogeneous Transfer Learning

  • 摘要: 针对变工况条件下因样本数据分布差异大、可训练用样本较少以及不同寿命阶段样本数量不均等造成的空间滚动轴承寿命阶段识别准确率较低的问题,提出一种无监督迁移学习方法——类对比簇分配异构迁移学习(CAHTL)。在CAHTL中,通过异构迁移学习将历史工况下少量有类标签样本和当前工况的无类标签样本(即待测样本)迁移到公共特征空间内,使得不同工况样本之间的分布差异最小化;利用源域聚类簇点构建目标域样本特征的正负样本实现两域样本的数量再分配,再对两域正负样本进行对比学习以使待测样本分类性更好;通过计算待测样本与聚类簇点的相似度完成待测样本分类,且该分类过程无需参数学习,因此可避免样本不均等情况下对于不同寿命阶段样本识别准确率差距过大和在少有类标签训练样本情况下网络出现过拟合的问题;利用随机梯度下降和动量更新对CAHTL参数进行不同步更新,以保持样本特征的一致性并提高CAHTL的收敛速度。CAHTL可利用空间滚动轴承历史工况下的少量、非均等的已知寿命阶段的训练样本对当前工况的待测样本进行较高精度的寿命阶段识别。空间滚动轴承寿命阶段识别实例验证了该方法的有效性。

     

    Abstract: Life stage identification accuracy of space rolling bearings is low due to the large difference of sample distribution, the small number of available training samples, and the unequal number of samples at different life stages under variable working conditions. Therefore, this paper proposes a novel unsupervised transfer learning method called class-contrast cluster-allocation heterogeneous transfer learning (CAHTL). This method firstly transfers a small number of labeled samples under historical working conditions and the unlabeled samples (i.e., the testing samples) under the current working conditions into a public feature space through heterogeneous transfer learning, so as to minimize the distribution difference between the samples under different working conditions. After that, the positive and negative samples of sample features in target domain are constructed by using cluster points in source domain to achieve the number redistribution of two domain samples, and then contrastive learning on the positive and negative samples in two domains is carried out to make a better classification characteristic on the testing samples. Then, the classification of testing samples is completed by calculating the similarities between the testing samples and the cluster points without parameter learning, which can prevent the large difference in identification accuracy of samples at different life stages in the case of unequal samples and the over fitting of CAHTL in the case of few labeled training samples. Finally, the stochastic gradient descent and momentum renewal are used to asynchronously update the CAHTL parameters to maintain the consistency of sample features and improve the convergence speed of CAHTL. CAHTL can use few and unequal training samples at known life stages under historical working conditions of space rolling bearings to identify the life stages of testing samples under the current working conditions with high accuracy. The effectiveness of the proposed CAHTL is verified by an experiment of identifying the life stage of a space rolling bearing.

     

  • 空间飞行器的机械部件能否正常运转、实现预定功能和达到预期服役寿命,很大程度上取决于飞行器中各机械部件内滚动轴承的寿命和可靠性。由于实时监测空间飞行器在轨运行状态下的轴承寿命状态成本昂贵且很难做到及时更换或维修故障轴承[1],为了保证安装到空间飞行器的滚动轴承能满足任务需求,目前国内外研究机构(如中国国家航天局、美国国家宇航局、俄罗斯联邦航天局等)通常采用地面模拟空间环境开展空间滚动轴承加速寿命试验来识别空间滚动轴承的寿命阶段,进而从大量候选空间滚动轴承中筛选出最优寿命轴承(即被识别为正常阶段的轴承)安装到空间飞行器中。

    在(地面模拟)空间在轨环境下,空间滚动轴承的失效一般是由固体润滑膜的磨损造成的精度失效,相比于早期故障或典型破坏性故障状态,空间滚动轴承在精度失效状态及其之前的有效寿命阶段内的振动特征更为微弱。一方面,模拟空间环境的设备(如:真空泵)内部空间狭小,且在该狭小空间内存在多组轴承同时试验,导致空间轴承振动信号受到强烈的环境噪声、电机变频振动、电磁辐射等干扰,这些干扰成分与空间轴承真实振动信号的低频段分量混叠、耦合[12]。另一方面,空间滚动轴承一般工作在变工况条件下:模拟空间环境下滚动轴承往往采取径向无加载、轴向加载方式开展加速寿命试验,随着轴承磨损,轴承间隙改变,空间轴承所受轴向载荷将发生持续性的变化;此外,由于真空室容量限制,难以实施电机转速的闭环控制[14],故空间轴承的转速并不稳定。地面模拟空间环境下空间滚动轴承加速寿命试验的特殊性使空间滚动轴承的运行、退化和失效过程与地面常规环境下的传统滚动轴承有明显差异,导致地面模拟空间环境下空间滚动轴承寿命阶段识别具有较大的挑战性。

    地面模拟空间环境下空间滚动轴承寿命阶段识别的研究起步较晚,相关研究案例还较少。吴昊年等[3]采用无重复均匀随机抽样和多分类器来改进均衡分布适配,再用改进后的均衡分布适配对空间滚动轴承进行寿命阶段识别。董绍江等[4]采用多层降噪技术、经验模态分解方法以及卷积神经网络(ICNN)对空间滚动轴承进行故障诊断。Dong等[5]利用沙利斯熵(TEK)得到积函数信号熵特征,将提取的信号熵特征经主成分分析后输入到优化模糊c均值模型(OFCM)中进行空间滚动轴承寿命阶段识别。陈仁祥等[6]结合线性局部切空间排列(LLTSA)维数约简和最近邻分类器对地面模拟空间环境下的空间滚动轴承进行寿命阶段识别。然而,模拟空间环境下的空间滚动轴承寿命阶段识别是在变工况条件[2]下展开的,以上基于数据概率分布一致性假设的机器学习方法并不能很好地适应变工况环境。此外,以上机器学习方法需要大量带类标签的历史工况(源域)数据进行训练,而且要求各寿命阶段训练数据占比均等。但受试验周期和成本影响,地面模拟空间环境下的加速寿命试验仅能获得部分历史工况下的少量空间滚动轴承全寿命样本用于分类模型的训练,且空间轴承不同寿命状态的时间跨度的不均等以及截尾试验往往造成各个寿命状态的样本数量不均等(截尾试验容易造成精度失效前的正常状态样本居多,而精度失效后的样本数量较少)[79]。复杂的地面模拟空间环境试验条件暴露了以上机器学习方法用于空间滚动轴承寿命阶段识别的局限性。

    迁移学习(TL)[1012]在样本概率分布不一致条件下具有良好的域泛化性能,因此为变工况条件下的空间滚动轴承寿命阶段识别提供了全新解决思路。对比学习(CL)[1316]是一种自监督学习范式,它通过比较数据对之间的“相似”或者“不同”以获取数据的高阶信息来对无标签数据集进行自监督学习,且其在定义正负样本方面的灵活性使得其在少样本情况下可以对两域样本进行灵活再分配,因此用于解决少样本分类问题具有潜力。因此,本文结合迁移学习和对比学习的优势,提出一种无监督迁移学习方法——类对比簇分配异构迁移学习(CAHTL)用于空间滚动轴承寿命阶段识别。CAHTL可以在源域有类标签样本较少以及不同类别样本数量不均等的情况下对目标域(即空间滚动轴承当前工况)的待测样本进行较高精度的寿命阶段识别。

    CAHTL的网络结构框架如图1所示,主要由异构迁移学习网络、同域泛对比学习网络以及簇分类网络构成。

    图  1  CAHTL的网络结构框架
    Fig.  1  Structure frame diagram of CAHTL
    下载: 全尺寸图片

    首先,对空间滚动轴承原始振动加速度信号样本做适应Transformer编码器输入形式的编码预处理,并构建异构迁移学习网络将源域和目标域编码后特征映射到一个公共特征空间,达到将不同分布的样本在公共特征空间内同分布的目的,同时构造特征迁移损失函数对异构迁移学习网络进行预训练来寻找该网络最优参数集,以加速CAHTL的收敛;其次,利用聚类簇点构建正负样本实现公共空间中两域样本特征的数量再分配,再对两域正负样本进行对比学习来解决少样本类判别问题;随后,计算待测样本与聚类簇点的相似度来预测待测样本的伪类标签并构造分类损失函数,以防止样本不均等情况下不同寿命阶段样本识别准确率差距过大和在少有类标签训练样本情况下网络出现过拟合的问题;然后,结合随机梯度下降法和动量更新对待训练的CAHTL模型参数进行不同步训练和更新;最后,将目标域待测样本输入训练好的CAHTL网络完成对待测样本寿命阶段的划分。

    记空间滚动轴承源域振动加速度样本集为$ {{\boldsymbol{S}}_{\mathrm{D}}} $,目标域振动加速度样本集为$ {{\boldsymbol{T}}_{\mathrm{D}}} $。分别取来自$ {{\boldsymbol{S}}_{\mathrm{D}}} $$M$个有类标签样本和来自$ {{\boldsymbol{T}}_{\mathrm{D}}} $$L$个无类标签样本作为CAHTL的原始输入。假设源域类空间YS和目标域类空间YT各存在$ K $个类别(即$ K $个寿命阶段)。单个源域样本和单个目标域样本分别记为:

    $$ \left\{ \begin{array}{l} {\boldsymbol{x}}_{\mathrm{S}}^{{m}} = \left( {{i_1},{i_2}, \cdots ,{i_n},{i_{n + 1}},{i_{n + 2}} ,\cdots ,{i_N}} \right) , m \in \left( {1,2, \cdots ,M} \right); \\ {\boldsymbol{x}}_{\mathrm{T}}^{{l}} = ({u_1}, {u_2}, \cdots ,{u_n},{u_{n + 1}},{u_{n + 2}}, \cdots ,{u_N}) , l \in \left( {1,2, \cdots ,L} \right) \end{array}\right. $$ (1)

    式中,$i$$u$分别代表源域和目标域样本中的不同元素,$n$代表不同元素所处序列位置,$N$代表源域或目标域样本中元素的个数。

    首先,将空间滚动轴承原始振动加速度信号样本按照时间域${ T}$切分成$R$个等长区域,记为${T'} = ( T_1',T_2', \cdots , T_n', \cdots ,T_R' )$,同时记切分后的源域和目标域小区域样本分别为$ {\boldsymbol{S}} = \left\{ {\left. {{{\boldsymbol{S}}_r}\left| {r \in 1,2, \cdots ,R} \right.} \right\}} \right. $$ {\boldsymbol{T}} = \left\{ {\left. {{{\boldsymbol{T}}_r}\left| {r \in 1,2, \cdots ,R} \right.} \right\}} \right. $,每个小区域长度均假设为$d$。该样本域切分过程可表示为:

    $$ \left\{ \begin{array}{l} {\boldsymbol{x}}_{\mathrm{S}}^{\mathrm{G}} = G\left( {{\boldsymbol{x}}_{\mathrm{S}}^{\mathrm{m}}} \right) = \left( {{{\boldsymbol{S}}_1},{{\boldsymbol{S}}_2}, \cdots ,{{\boldsymbol{S}}_j}, \cdots ,{{\boldsymbol{S}}_{{R}}}} \right), \\ {\boldsymbol{x}}_{\mathrm{T}}^{\mathrm{G}} = G\left( {{\boldsymbol{x}}_{\mathrm{T}}^{\mathrm{l}}} \right) = \left( {{{\boldsymbol{T}}_1},{{\boldsymbol{T}}_2}, \cdots ,{{\boldsymbol{T}}_j}, \cdots ,{{\boldsymbol{T}}_{{R}}}} \right) \end{array}\right. $$ (2)

    式中,$ G( \cdot ) $表示域切分操作。

    $$\left\{ \begin{array}{l} {\boldsymbol{x}}_{{{\mathrm{S}}}}^{{m}} = \underbrace {{i_1},{i_2}, \cdots ,{i_d}}_{T_1'},\underbrace {{i_{d + 1}}, \cdots ,{i_{2d + 1}}}_{T_2'},\cdots ,\underbrace {{i_{N - d + 1}}, \cdots ,{i_N}}_{T_R'} \;;\\ {\boldsymbol{x}}_{\mathrm{T}}^{l} = \underbrace {{u_1},{u_2}, \cdots ,{u_d}}_{T_1'},\underbrace {{u_{d + 1}}, \cdots ,{u_{2d + 1}}}_{T_2'},\cdots,\underbrace {{u_{N - d + 1}}, \cdots ,{u_N}}_{T_R'} \end{array}\right.$$ (3)

    在域切分好后的每个小区域样本$ {\boldsymbol{x}}_{\mathrm{S}}^m $$ {\boldsymbol{x}}_{\mathrm{T}}^l $前需要增加一个可学习、可更新的嵌入向量${\boldsymbol{C}} = \left\{ {\left. {{{\boldsymbol{C}}_r}\left| {r \in 1,2, \cdots ,R} \right.} \right\}} \right.$。由于Transformer编码器[9,1718]要将多个小区域样本归结为一个判别类,因此这个追加的嵌入向量$C$就是多个小区域样本共同寻找的类别信息。该嵌入过程可以表示为:

    $$ \left\{ \begin{array}{l} {}^C{\boldsymbol{x}}_{\mathrm{S}}^G = C\left( {{\boldsymbol{x}}_{\mathrm{S}}^G} \right) = \left( {{}^{{C_1}}{{\boldsymbol{S}}_1},{}^{{C_2}}{{\boldsymbol{S}}_2}, \cdots ,{}^{{C_r}}{{\boldsymbol{S}}_j}, \cdots ,{}^{{C_R}}{{\boldsymbol{S}}_R}} \right) , \\ {}^C{\boldsymbol{x}}_{\mathrm{T}}^G = C\left( {{\boldsymbol{x}}_{\mathrm{T}}^G} \right) = \left( {{}^{{C_1}}{{\boldsymbol{T}}_1},{}^{{C_2}}{{\boldsymbol{T}}_2}, \cdots ,{}^{{C_r}}{{\boldsymbol{T}}_j}, \cdots ,{}^{{C_R}}{{\boldsymbol{T}}_R}} \right) \end{array}\right. $$ (4)

    式中,$ C( \cdot ) $表示向量嵌入操作,$ {\boldsymbol{x}}_{\mathrm{S}}^G = ( {{\boldsymbol{S}}_1},{{\boldsymbol{S}}_2}, \cdots , {{\boldsymbol{S}}_j}, \cdots , {{\boldsymbol{S}}_R} ) $$ {\boldsymbol{x}}_{\mathrm{T}}^G = \left( {{{\boldsymbol{T}}_1},{{\boldsymbol{T}}_2}, \cdots ,{{\boldsymbol{T}}_j}, \cdots ,{{\boldsymbol{T}}_R}} \right) $

    切分后的小区域样本虽然是按照原先位置顺序重组后输入Transformer编码器,但Transformer编码器的多头注意力模块却不能直接捕捉到小区域样本之间的位置信息。因此,为小区域样本增加一个相对位置编码[19]过程来补充小区域样本相对位置信息,该相对位置编码过程如下:

    $$ \left\{ \begin{array}{l}{{\boldsymbol{P}}}_{({T}_{n}',2i)}={\sin}({T}_{n}'/10\;000^{2i/d}),\\ {{\boldsymbol{P}}}_{({T}_{n}',2i+1)}={\cos}({T}_{n}'/10\;000^{(2i+1)/d}) \end{array}\right. $$ (5)

    式中,${{\boldsymbol{P}}_{(T_n',2i)}}$${{\boldsymbol{P}}_{(T_n',2i{\text{ + }}1)}}$分别表示位置$T_n'$$T_n' \in ( T_1', T_2', \cdots ,T_R' )$)处位置编码向量${{\boldsymbol{P}}_{T_n'}}$的第$2i$$ (2i+1)$个分量,$d$是位置编码向量的维度。

    最后,将位置编码向量集${{{{\boldsymbol{P}}}}^m}{{ = }}\{ {\boldsymbol{P}}_{T_1'}^m,{\boldsymbol{P}}_{T_2'}^m, \cdots {\boldsymbol{P}}_{T_n'}^m, \cdots , {\boldsymbol{P}}_{T_R'}^m \}$${{{{\boldsymbol{P}}}}^l}{{ = }}\{ {{\boldsymbol{P}}_{T_1'}^l,{\boldsymbol{P}}_{T_2'}^l, \cdots {\boldsymbol{P}}_{T_n'}^l, \cdots ,{\boldsymbol{P}}_{T_R'}^l} \}$与经过域切分、向量嵌入等处理后的样本相加,该过程可以表示为:

    $$ \left\{ \begin{array}{l} {\boldsymbol{C}}\left( {G\left( {{\boldsymbol{x}}_{\mathrm{S}}^m} \right)} \right) + {p^m} = {}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^G = \left( {{}_{P_{T_1'}^m}^{{C_1}}{{\boldsymbol{S}}_1},{}_{P_{T_2'}^m}^{{C_2}}{{\boldsymbol{S}}_2}, \cdots ,{}_{P_{T_n'}^m}^{{C_r}}{{\boldsymbol{S}}_j}, \cdots ,{}_{P_{T_R'}^m}^{{C_R}}{{\boldsymbol{S}}_R}} \right), \\ {\boldsymbol{C}}\left( {G\left( {{\boldsymbol{x}}_{\mathrm{T}}^l} \right)} \right) + {p^l} = {}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^G = \left( {{}_{P_{{{T}}_1'}^l}^{{C_1}}{{\boldsymbol{T}}_1},{}_{P_{T_2'}^l}^{{C_1}}{{\boldsymbol{T}}_2}, \cdots ,{}_{P_{T_n'}^l}^{{C_r}}{{\boldsymbol{T}}_j}, \cdots ,{}_{P_{T_R'}^l}^{{C_R}}{{\boldsymbol{T}}_R}} \right) \end{array}\right. $$ (6)

    相加后的结果$ {}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^G $$ {}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^G $即可分别作为Transformer编码器的一个源域和目标域输入样本。将$ {}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^G $$ {}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^G $输入到Transformer编码器${\boldsymbol{En}}\left( \cdot \right)$中映射得到源域和目标域的高维特征${\boldsymbol{f}}_{\mathrm{S}}^{{x}}$${\boldsymbol{f}}_{\mathrm{T}}^{{x}}$。假设第$ g $次训练后异构迁移学习网络的参数集合为$ {{\boldsymbol{\theta}} _g} $,则该特征映射过程表达如下:

    $$ \left\{ \begin{array}{l} {\boldsymbol{f}}_{\mathrm{S}}^{{x}}\left( {{{\boldsymbol{\theta}} _g}} \right) = {\boldsymbol{En}}\left( {{}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^{\mathrm{G}},{{\boldsymbol{\theta}} _g}} \right), \\ {\boldsymbol{f}}_{\mathrm{T}}^{{x}}\left( {{{\boldsymbol{\theta}} _g}} \right) = {\boldsymbol{En}}\left( {{}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^{\mathrm{G}},{{\boldsymbol{\theta}} _g}} \right) \end{array}\right. $$ (7)

    Transformer编码器由于其多头注意力[9]机制很好地利用了样本元素之间的相关性,因此其所提取的高维特征具有较好的类别表征性。

    接着,将Transformer编码器提取的源域和目标域高维特征通过异构迁移学习网络迁移到同一个公共特征空间内,即首先通过特征分布差异度量函数$T( \cdot )$来构造如下特征迁移损失函数:

    $$ {J_{\mathrm{g}}}\left( {{{\boldsymbol{\theta}} _{\mathrm{g}}}} \right) = {T_{\mathrm{g}}}\left( {{\boldsymbol{f}}_{\mathrm{S}}^{\mathrm{x}}\left( {{{\boldsymbol{\theta}} _{\mathrm{g}}}} \right),{\boldsymbol{f}}_{\mathrm{T}}^{\mathrm{x}}\left( {{{\boldsymbol{\theta}} _{\mathrm{g}}}} \right)} \right) $$ (8)

    式(8)采用最大均值差异度量函数作为分布差异度量函数$T( \cdot )$。然后,通过优化该特征迁移损失函数来学习异构迁移学习网络的参数,以实现源域样本高维特征向目标域样本高维特征的迁移(也就是将源域和目标域高维特征迁移到同一个公共特征空间内),使得它们之间的概率分布差异最小化。优化特征迁移损失函数的过程就是用随机梯度下降法对异构迁移学习网络的参数$ {{\boldsymbol{\theta}} _{\text{g}}} $进行更新的过程,对$ {{\boldsymbol{\theta}} _{\text{g}}} $进行一次更新的表达式如下:

    $$ \begin{split} {{\boldsymbol{\theta}} _{{\mathrm{g}} + 1}} =& {{\boldsymbol{\theta}} _{\mathrm{g}}} - \alpha {\nabla _{\boldsymbol{\theta}} }{J_{\mathrm{g}}}\left( {{{\boldsymbol{\theta}} _{\mathrm{g}}}} \right) = {{\boldsymbol{\theta}} _{\mathrm{g}}} - \alpha {\nabla _{\boldsymbol{\theta}} } {T_{\mathrm{g}}}\left( {{\boldsymbol{f}}_{\mathrm{S}}^x\left( {{{\boldsymbol{\theta}} _{\mathrm{g}}}} \right),{\boldsymbol{f}}_{\mathrm{T}}^x\left( {{{\boldsymbol{\theta}} _g}} \right)} \right) = \\& - \alpha {\nabla _{\boldsymbol{\theta}} } {T_{\mathrm{g}}}({\boldsymbol{En}}({}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^G,{{\boldsymbol{\theta}} _g}),{\boldsymbol{En}}({}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^G,{{\boldsymbol{\theta}} _{\mathrm{g}}})) \\[-4pt] \end{split}$$ (9)

    式中,$\alpha $为异构迁移学习网络参数的学习率。

    重复执行式(7)~(9)所示更新过程,直到将异构迁移学习网络的参数训练至收敛,就完成了对特征迁移损失函数的优化,也即完成了对异构迁移学习网络的预训练。由于后续的同域泛对比学习网络每一次更新前的初始参数都是由训练异构迁移学习网络得到的全局最优解,所以以最后更新好的全局最优解(即预训练好的异构迁移学习网络参数集$ {{\boldsymbol{\theta}} _\tau } $)作为同域泛对比学习网络的起始点(即初始值)去学习该对比学习网络的参数时仅需要较少迭代次数就能使同域泛对比学习网络达到收敛,即又好又快地适应新的对比学习任务,因此预训练好的异构迁移学习网络具有良好的泛化性和域适配性。

    将空间滚动轴承源域有类标签(即已知寿命阶段)样本$ {}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^G $$ \left( {m \in 1,2, \cdots ,M} \right) $(其对应的类标签为$ {{\boldsymbol{y}}_{\mathrm{s}}} = \left\{ {y_{\mathrm{s}}^m\left| {m \in 1,2, \cdots ,M} \right.} \right\} $)和目标域无类标签待测样本$ {}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{T}}^G $$ \left( {l \in 1,2, \cdots ,L} \right) $输入到预训练好的异构迁移学习网络中得到两域高维特征$ {{\boldsymbol{f}}_{\mathrm{S}}}({{\boldsymbol{\theta}} _\tau }) $$ {{\boldsymbol{f}}_{\mathrm{T}}}({{\boldsymbol{\theta}} _\tau }) $,即:

    $$\left\{ \begin{array}{l} {{\boldsymbol{f}}_{\mathrm{S}}}({{\boldsymbol{\theta}} _\tau }) = {\boldsymbol{En}}\left( {{}_{{}^{{p^m}}}^C{\boldsymbol{x}}_{\mathrm{S}}^{\mathrm{G}},{{\boldsymbol{\theta}} _\tau }} \right), \\ {{\boldsymbol{f}}_{\mathrm{T}}}({{\boldsymbol{\theta}} _\tau }) = {\boldsymbol{En}}\left( {{}_{{}^{{p^l}}}^C{\boldsymbol{x}}_{\mathrm{S}}^{\mathrm{G}},{{\boldsymbol{\theta}} _\tau }} \right) \end{array}\right. $$ (10)

    然后,由以上两域高维特征值的分布差异度量函数来构造异构迁移学习网络的特征迁移损失函数如下:

    $$ J\left( {{{\boldsymbol{\theta}} _\tau }} \right) = T\left( {{{\boldsymbol{f}}_{\mathrm{S}}}({{\boldsymbol{\theta}} _\tau }),{{\boldsymbol{f}}_{\mathrm{T}}}({{\boldsymbol{\theta}} _\tau })} \right) $$ (11)

    由于模拟空间环境下空间滚动轴承两域样本中都存在强烈的复杂信号干扰,使得空间轴承两域不同类别(不同寿命阶段)样本在公共特征空间内间隔很小甚至出现交汇、混叠现象,将导致分类(寿命阶段识别)精度不高;同时由于源域可用样本数量有限导致网络被训练时容易出现过拟合问题,因此采用聚类簇点和构造同域泛对比学习对公共特征空间内的两域样本高维特征进行数量再分配和类判别。

    将异构迁移学习网络输出的源域高维特征$ {{\boldsymbol{f}}_{\mathrm{S}}}({{\boldsymbol{\theta}} _\tau }) $聚类成$ K $类,得到$ K $个蕴含类别信息的聚类中心(即聚类簇点),该过程表达如下:

    $$ \left[ {{{\boldsymbol{Cn}}^1},{{\boldsymbol{Cn}}^2}, \cdots ,{{\boldsymbol{Cn}}^j}, \cdots ,{{\boldsymbol{Cn}}^K}} \right] = Cn\left( {{{\boldsymbol{f}}_{\mathrm{S}}}({{\boldsymbol{\theta}} _\tau })} \right) $$ (12)

    式中,$Cn\left( \cdot \right)$表示k–means聚类算法。

    用得到的聚类中心${{\boldsymbol{Cn}}^j}$来对目标域样本特征进行正、负样本判别。对于每一个目标域待判别样本特征$ {\boldsymbol{f}}_{\mathrm{T}}^{\mathrm{l}}({{\boldsymbol{\theta}} _\tau }) $来说,正样本${{\boldsymbol{f}}_{{x^ + }}}$为该待判别样本特征与聚类中心$C{n^j}$一一比较之后相似度最大的聚类中心,即:

    $$ \begin{aligned}[b] & {{\boldsymbol{f}}}_{{x}^{+}}={{\boldsymbol{Cn}}}^{j},如果\\& \delta ({{\boldsymbol{f}}}_{{x}^{+}},{{\boldsymbol{Cn}}}^{j})=\mathrm{max}\{\delta ({{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta }}}_{\tau }),{{\boldsymbol{Cn}}}^{1}),\delta ({{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau }),{{\boldsymbol{Cn}}}^{2}), \cdots ,\\&\qquad \qquad \quad\; \delta ({{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau }),{{\boldsymbol{Cn}}}^{j}),\cdots, \delta ({{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau }),{{\boldsymbol{Cn}}}^{K})\} \end{aligned}$$ (13)

    式中:$\delta \left( \cdot \right)$表示相似度度量函数,其中$\delta \left( \cdot \right) \in \left[ { - 1,1} \right]$,采用余弦相似度函数作为相似度度量函数$\delta \left( \cdot \right)$;而负样本${{\boldsymbol{f}}_{{x^ - }}}$则是除去正样本外的所有其它源域和目标域样本特征。通过以上正负样本判别层使得目标域不同类别的样本特征都有了与自己对应的唯一正样本${{\boldsymbol{f}}_{{x^ + }}}$$\lambda $$\lambda \leqslant M + L - 2$)个负样本,从而使目标域不同类别样本特征的数量趋向于均衡化,这样较好地解决了两域样本数量再分配问题。

    得到正、负样本之后,构造如下同域泛对比学习损失函数${L^{\text{*}}}\left( {{{\boldsymbol{\theta}} _\tau }} \right)$

    $$ {L}^{{*}}\left({\theta }_{\tau }\right)=-{\displaystyle \sum _{l=1}^{L}\mathrm{lg}\frac{\mathrm{exp}\left({{\boldsymbol{f}}}_{{\mathrm{T}}}^{l}({{\boldsymbol{\theta}} }_{\tau })\cdot {{\boldsymbol{f}}}_{{x}^{+}}/t\right)}{{\displaystyle \sum _{i=1}^{\lambda }\mathrm{exp}({{\boldsymbol{f}}}_{{\mathrm{T}}}^{l}({{\boldsymbol{\theta}} }_{\tau })\cdot {{\boldsymbol{f}}}_{{x}^{-(\text{i})}}/t)}}} $$ (14)

    式中,$t$为温度超参数,用来控制样本分布的形状。通过优化该同域泛对比学习损失函数,可以让相似的正样本对的距离越来越近,而让不相似的负样本相距越来越远,这样有利于对目标域各类别样本特征进行分类。

    计算目标域待测样本的高维特征与不同聚类簇点$ {{\boldsymbol{Cn}}^j}\left( {j \in 1,2, \cdots ,K} \right) $的相似度,并选择相似度最大的聚类簇点所对应的类标签作为空间滚动轴承目标域待测样本的预测伪类标签$ {k_l} $$ {k_l} $代表目标域第$l$个样本对应的伪类标签),该过程表达如下:

    $$ \hat y_{\mathrm{T}}^l = {k_l} = \mathop {\arg \max }\limits_{j \in (1,2, \cdots ,K)} \delta ({{\boldsymbol{Cn}}^{{j}}},{\boldsymbol{f}}_{\mathrm{T}}^{{l}}({{\boldsymbol{\theta}} _\tau })) $$ (15)

    计算该目标域待测样本属于伪类标签$ {k_l} $的概率如下:

    $$ p(\hat y_{\mathrm{T}}^l = \left. {{k_l}} \right|{\boldsymbol{f}}_{\mathrm{T}}^l({{\boldsymbol{\theta}} _\tau })) = \frac{{{\mathrm{exp}}(\delta ({k_l},{\boldsymbol{f}}_{\mathrm{T}}^l({{\boldsymbol{\theta}} _\tau })))}}{{\displaystyle\sum\limits_{k = 1}^K {{\mathrm{exp}}(\delta (k,{\boldsymbol{f}}_{\mathrm{T}}^{{l}}({{\boldsymbol{\theta}} _\tau })))} }} $$ (16)

    将所有目标域待测样本属于其对应的伪类标签概率的负对数之和作为分类损失函数,该分类损失函数推导如下:

    $$\begin{aligned}[b] \varPhi \left( {{\theta _\tau }} \right) =& - \sum\limits_{l = 1}^L {{\mathrm{lg}}(\hat y_{\mathrm{T}}^{{l}} = {k_l}\left| {f_{\mathrm{T}}^l({\theta _\tau })} \right.)}= \\& - \displaystyle\sum\limits_{l = 1}^L {{\mathrm{lg}}\frac{{{\mathrm{exp}}(\delta ({k_l},{\boldsymbol{f}}_{\mathrm{T}}^{{l}}({\theta _\tau })))}}{{\sum\limits_{k = 1}^K {{\mathrm{exp}}(\delta (k,{\boldsymbol{f}}_{\mathrm{T}}^{{l}}({\theta _\tau })))} }}} \end{aligned} $$ (17)

    然后,结合异构迁移学习网络的特征迁移损失函数$J\left( {{{\boldsymbol{\theta}} _\tau }} \right)$、同域泛对比学习损失函数${L^{\text{*}}}\left( {{{\boldsymbol{\theta}} _\tau }} \right)$以及分类损失函数$ \varPhi \left( {{{\boldsymbol{\theta}} _\tau }} \right) $作为CAHTL的联合损失函数${\zeta ^{\text{*}}}\left( {{{\boldsymbol{\theta}} _\tau }} \right)$,该联合损失函数表达如下:

    $$ \begin{aligned}[b] {\zeta }^{\text{*}}\left({{\boldsymbol{\theta}} }_{\tau }\right)=&\rho J\left({{\boldsymbol{\theta}} }_{\tau }\right)+\psi {L}^{\text{*}}\left({{\boldsymbol{\theta}} }_{\tau }\right)+\varPhi \left({{\boldsymbol{\theta}} }_{\tau }\right)=\\& \rho T({{\boldsymbol{f}}}_{{\mathrm{x}}}^{{\mathrm{s}}}\left({{\boldsymbol{\theta}} }_{\tau }\right),{{\boldsymbol{f}}}_{{\mathrm{x}}}^{{\mathrm{T}}}\left({{\boldsymbol{\theta}} }_{\tau }\right))-\\&\psi {\displaystyle \sum _{l=1}^{L}\mathrm{lg}\frac{\mathrm{exp}\left({{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau })\cdot {{\boldsymbol{f}}}_{{x}^{+}}/t\right)}{{\displaystyle {\sum }_{i=1}^{\lambda }\mathrm{exp}({f}_{{\mathrm{T}}}^{l}({{\boldsymbol{\theta}} }_{\tau })\cdot {{\boldsymbol{f}}}_{{x}^{-(\text{i})}}/t)}}}-\\&{\displaystyle \sum _{l=1}^{L}{\mathrm{lg}}\frac{{\mathrm{exp}}(\delta ({k}_{l},{{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau })))}{{\displaystyle \sum _{k=1}^{K}{\mathrm{exp}}(\delta (k,{{\boldsymbol{f}}}_{{\mathrm{T}}}^{{{l}}}({{\boldsymbol{\theta}} }_{\tau })))}}} \end{aligned}$$ (18)

    式中,$\rho $$\psi $为联合损失函数的平衡约束参数,分别用于约束异构迁移学习网络和同域泛对比学习网络的局部寻优行为。

    需要对联合损失函数${\zeta ^{\text{*}}}\left( {{{\boldsymbol{\theta}} _\tau }} \right)$进行优化并且在不同批次训练过程对CAHTL更新网络参数。由于基于传统随机梯度下降的参数更新方式更新速度慢而且聚类中心$ {{\boldsymbol{Cn}}^j} $会随着训练批次的不同发生不同程度的改变,而一个快速改变的聚类中心又会降低正负样本储存器里所有正、负样本的一致性(这里的一致性是指每个样本特征的正、负样本在判别后保持不变),使得CAHTL难以收敛。因此,本文以动量更新的方式来解决在不同批次训练过程中聚类中心变化过大导致CAHTL难以收敛的问题。待一次随机梯度计算完成之后,将返回结果进行梯度累加并计算本次训练后的参数集均值,此时并不立即更新参数集,而是将该均值作为下一次训练的基础参数集进行动量更新。该参数集动量更新过程如下:

    首先,由随机梯度下降法得到第$\gamma $次训练后的CAHTL参数集$ {{\boldsymbol{\theta }}_\gamma } $,再进行梯度累加并计算该次训练后的CAHTL参数集均值$ {{\overline{\boldsymbol{\theta}} _\gamma }} $,即:

    $$ \begin{split} {{\overline{\boldsymbol{\theta}} _\gamma }} {{ = }}&\overline \sum \left[ {{{\boldsymbol{\theta}} _\gamma } - {\alpha '}{\nabla _{\boldsymbol{\theta}} }{\zeta ^{{*}}}\left( {{{\boldsymbol{\theta}} _\gamma }} \right)} \right]= \\& \overline \sum \left[ {{{\boldsymbol{\theta}} _\gamma } - {\alpha '}{\nabla _\theta }\left( {\rho J\left( {{{\boldsymbol{\theta}} _\gamma }} \right){{ + }}\psi {L^{{*}}}\left( {{\theta _\gamma }} \right){{ + }}\varPhi \left( {{{\boldsymbol{\theta}} _\gamma }} \right)} \right)} \right] \end{split} $$ (19)

    式中,$ {\alpha '} $为CAHTL参数的学习率。

    接着,将上一次训练更新得到的参数集均值$ {{\overline{\boldsymbol{\theta}} _{\gamma - 1}}} $和当前次(即第$\gamma $次)更新得到的参数集均值$ {{\overline{\boldsymbol{\theta}} _\gamma }} $相结合来动量更新当前次的网络参数集均值如下:

    $$ {{\overline{\boldsymbol{\theta}} _\gamma }} {\text{ = }}\eta {{\overline{\boldsymbol{\theta}} _{\gamma - 1}}} + \left( {1 - \eta } \right) {{\overline{\boldsymbol{\theta }}_\gamma }} $$ (20)

    式中,$\eta \in \left[ {0,1} \right)$为动量参数,$\eta $的值越大,参数更新越缓慢。由式(20)可知,在每一次迭代训练过程中,会在很大程度上沿用上一次训练所产生的参数集进行参数集更新,同时会一定程度上应用当前批次训练产生的参数集进行更新,这使得聚类簇点不会产生大的突变,同时又能保证CAHTL能收敛。

    较少次地重复执行式(19)~(20)就能使CAHTL收敛,完成对CAHTL的参数微调,此时得到CAHTL对该分类任务的最优参数集$ {{\boldsymbol{\theta}} _\# } $,也即完成对CAHTL的训练。

    最后,再将空间滚动轴承目标域待测样本输入训练好的CAHTL,以计算出目标域待测样本的类标签$ y_{\mathrm{T}}^l $(即寿命阶段),即:

    $$ y_{\mathrm{T}}^l = \mathop {\arg \max }\limits_{j \in (1,2, \cdots ,K)} \delta ( {{{\boldsymbol{Cn}}^j},{\boldsymbol{f}}_{\mathrm{T}}^l({{\boldsymbol{\theta}} _\# })} ) $$ (21)

    这样就完成了利用空间滚动轴承原始振动加速度信号进行空间滚动轴承寿命阶段识别的全过程。由于式(15)~(18)所呈现的簇分类(即分类损失函数构造)过程以及式(20)所表达的对空间滚动轴承目标域待测样本的最终分类过程都未引入新的需要训练的参数,因此对待测样本分类的全过程都无需参数学习。

    所提出的基于CAHTL的空间滚动轴承寿命阶段识别方法的实现过程如图2所示,方法如下:

    图  2  CAHTL用于空间滚动轴承寿命阶段识别方法
    Fig.  2  Process of using CAHTL to identify the life stage of space rolling bearings
    下载: 全尺寸图片

    1)对空间滚动轴承源域和目标域原始振动信号样本做适应Transformer编码器输入形式的编码预处理;再将源域和目标域编码后的样本输入Transformer编码器得到相应的两域高维特征,通过特征分布差异度量函数对两域高维特征构造特征迁移损失函数;通过优化该损失函数即预训练异构迁移学习网络以达到将不同分布的样本在公共特征空间内最大化同分布的目的,并得到异构迁移学习网络的最优参数集。

    2)将源域少量有类标签的样本以及目标域无类标签的样本输入预训练好的异构迁移学习网络来构造异构迁移学习网络的特征迁移损失函数。

    3)对异构迁移学习网络输出的源域样本高维特征聚类得到包含不同类别信息的聚类簇点,以这些聚类簇点为祖点为目标域待判别样本特征(即目标域待测样本的高维特征)进行正负样本判别,使每个目标域样本特征都得到一个与自己对应的唯一正样本和$\lambda $个负样本,并将该判别结果存储在特征存储器中。得到正、负样本之后,构造同域泛对比学习损失函数,使得在公共特征空间内相似的正样本对相距越来越近,负样本与不同类的样本特征相距更远,以利于对目标域样本特征进行分类。

    4)计算空间滚动轴承目标域待测样本的高维特征与不同聚类簇点的相似度,并选择相似度最大的聚类簇点所对应的类标签作为待测样本的预测伪类标签,同时依据预测伪类标签来构造分类损失函数。

    5)结合异构迁移学习网络的特征迁移损失函数、同域泛对比学习损失函数以及分类损失函数来构造CAHTL的联合损失函数,采用随机梯度下降和动量不同步更新方式将联合损失函数训练至收敛,以完成对CAHTL参数的微调,即得到CAHTL的最优参数集。

    6)将训练好的CAHTL用于对目标域待测样本的分类,完成对空间滚动轴承的寿命阶段识别。

    实验数据主要来自重庆大学机械传动国家重点实验室搭建的地面模拟真空环境下空间滚动轴承振动监测(即加速寿命试验)平台上采集的空间滚动轴承加速寿命试验数据。平台主要由真空泵(可以实现温度范围–50 ℃~–150 ℃和压强范围105 Pa(大气)~10–5 Pa(高真空)的模拟空间环境)、轴承振动监测实验台架、压电式加速度传感器LANCE LC0151T、LANCE双积分信号调理器、NI数据采集卡NI 9234和计算机组成,如图3所示。实验工况见表1。空间滚动轴承振动信号监测、采集方案的实现路径如下:将型号均为C36018的空间滚动轴承1和2安装于真空泵中的振动监测实验台架上。真空泵正常运行后,在真空环境下轴承1和2均被加载7 kg的轴向预载(随着轴承磨损加剧,轴向载荷会发生持续性变化),分别在约1 000和约3 000 r/min的2种非平稳转速(转速不稳定是由电机非闭环控制引起)下运行(表1中的非稳态工况C1和C2),以模拟空间滚动轴承的空间服役状态并激励出空间轴承的振动响应信号。采用压电式加速度传感器、双积分信号调理器、NI数据采集卡和计算机中配套的数据采集软件对这两个空间滚动轴承进行振动监测,每隔2 h以25.6 kHz的采样频率采集一次振动加速度信号,直至这两个轴承都完全止动失效。截取每1 024个连续的振动加速度数据作为一个样本,最终采集到这两个空间滚动轴承全寿命期的总样本数均为744。

    图  3  空间滚动轴承振动监测平台
    Fig.  3  Vibration monitoring platform for space rolling bearings
    下载: 全尺寸图片
    表  1  实验工况表
    Table  1  Detailed working conditions
    实验平台工况转速载荷监测对象
    重庆大学
    C1约1 000 r/min7 kg
    (轴向预载)
    空间滚动轴承1
    C2约3 000 r/min7 kg
    (轴向预载)
    空间滚动轴承2
    辛辛那提大学C32 000 r/min6 000 lbs
    (径向载荷)
    1号常规滚动轴承

    表1中,工况C3的数据来自辛辛那提大学滚动轴承加速寿命退化实验台,该平台如图4所示。将4个型号为ZA–2115双列滚子轴承安装在轴承试验台的旋转轴上,使用转速为2 000 r/min的电机通过皮带驱动转轴,并通过弹簧机构在转轴和轴承上施加6 000 lbs(约为2 721.5 kg)的径向载荷,采样频率为20 kHz,每10 min采集一次轴承的振动加速度。对每次采集的数据截取前1 024个连续点作为一个样本,共获得1号双列滚子轴承全寿命期的984个样本。

    图  4  辛辛那提大学滚动轴承加速寿命退化实验台
    Fig.  4  Accelerated rolling bearing life cycle degradation test platform in University of Cincinnati
    下载: 全尺寸图片

    在寿命阶段识别实验开始前对3个工况下的3个(空间)滚动轴承全寿命数据进行寿命阶段划分。首先对这3个轴承的每个样本提取来自时域、频域和时频域的27个寿命阶段特征,然后用局部线性嵌入(LLE)方法[20]对所提取的寿命阶段特征进行维数约简,得到对应于每个样本的1维主特征量,再将所得1维主特征量输入3参数威布尔分布可靠度模型[21]以获得这3个轴承的可靠度评估曲线,如图5所示,相邻两时间间隔分别为2 h、2 h、10 min。由可靠度评估曲线将全寿命数据划分成正常状态、早期退化阶段、中期退化阶段、完全失效阶段等4个阶段:从空间滚动轴承运行安全性、稳妥性考虑,将可靠度0.9第1次出现对应的时间点作为划分正常阶段和早期退化阶段的时间点,该点也被视为空间滚动轴承精度失效阈值点[7];将可靠度0.5第1次出现对应的时间点作为划分早期退化阶段和中期退化阶段的分界点[22];将可靠度0.1第1次出现对应的时间点作为划分中期退化阶段和完全失效阶段的分界点[22]

    图  5  不同滚动轴承可靠度曲线
    Fig.  5  Reliability curves of different rolling bearings
    下载: 全尺寸图片

    CAHTL的参数设置如下:小区域长度$d = 32$,小区域切分个数$R{\text{ = 32}}$;Transformer编码器的个数$\alpha = 4 \times {e^{ - 2}}$,编码器内多头自注意力头数为4头,每个头的输入向量维度为32维;异构迁移学习网络参数的学习率$ \alpha = 4 \times {e^{ - 2}} $;同域泛对比学习网络中的聚类簇点个数$K = 4$,温度超参数$t{\text{ = }}0.05$;联合损失函数的平衡约束参数$ \rho $$\psi $一般在各自的经验区间$ \rho \in \left( {0,1} \right) $$ \psi \in \left( {0,1} \right) $内取值,这里取$ \rho = 0.3 $$\psi {\text{ = }}0.6$;CAHTL参数的学习率$ {\alpha '} = 4 \times {e^{ - 2}} $;由于公共特征空间中的源域和目标域高维特征都是由相同的网络结构(Transformer编码器)编码得到,因此两域样本特征一致性较强,故采用一个相对较大的动量参数,即$\eta {\text{ = }}0.92$,这样聚类簇点不会产生大的突变,同时CAHTL又能收敛。后续实验均沿用以上参数,不再做任何改变。

    在实验1(C2$ \to $C1)中,将工况C2下的空间滚动轴承2的正常状态阶段(S1)、早期退化阶段(S2)、中期退化阶段(S3)以及完全失效阶段(S4)的全寿命周期样本作为源域样本来识别工况C1(目标域)下的空间轴承1的全寿命样本的寿命阶段。实验开始前,分别从空间轴承2和空间轴承1的每一寿命阶段中各随机选取100个样本作为源域和目标域的总样本,即用于实验的源域和目标域总样本数均为400。

    在源域中按照1∶3∶4∶1的比例选取各阶段样本用作源域有类标签训练样本:S1、S2、S3和S4阶段样本数分别为$ Q/9 $$ 3Q/9 $$ 4Q/9 $$ Q/9 $,所有训练样本总数为$ Q $($ Q \leqslant 225 $);在目标域中也按相同方法选取样本,待测样本总数也为$ Q $。按照第2节所述的实现流程,将源域和目标域样本输入CAHTL,对目标域空间滚动轴承1进行寿命阶段识别。实验结束后,将CAHTL获得的识别准确率与其他4种典型迁移学习方法进行比较,包括中心力矩匹配(CMD)[23]、域迁移多核学习(DTMKL)[24]、迁移联合匹配(TJM)[25]和分发匹配嵌入(DME)[26]。使用k折交叉验证方法来优化CMD、DTMKL、TJM和DME的参数以确保能够获得最高的识别精度。优化后的参数如下:对于CMD,学习速率为$ \eta = {e^{ - 2}} $,平衡约束参数为0.30;对于DTMKL,正则化参数为0.30,子空间维数$ D = 3 $;对于TJM,正则化参数为0.25,子空间维数$ D = 4 $;对于DME,惩罚因子为0.25。

    为降低随机性带来的误差,取前30次实验结果的平均值作为每种方法最后的实验结果。不同方法的寿命阶段平均识别准确率对比如图6所示。当源域有类标签训练样本总数$Q = 27$时,CAHTL和其它4种方法的识别准确率对比如图7所示,不同方法对目标域待测样本详细寿命阶段识别结果见表2。此外,利用t分布随机邻域嵌入(t–SNE)算法[27]$Q = 27$时异构迁移学习前后CAHTL输出的高维特征降维到2维平面,以展示异构迁移学习前后CAHTL的两域最大化同分布效果和分类效果,结果如图8所示。

    图  6  空间滚动轴承1的4个寿命阶段的平均识别准确率
    Fig.  6  Comparison of the average identification accuracy of four life stages of space rolling bearing 1
    下载: 全尺寸图片
    图  7  Q=27时寿命阶段识别准确率
    Fig.  7  Life stage identification accuracy of space rolling bearing 1 when Q=27
    下载: 全尺寸图片
    表  2  不同方法对目标域待测样本的寿命阶段识别结果
    Table  2  Lifetime stages identified by different methods for target domain test samples
    待测样
    本编号
    待测样本所属
    真实寿命阶段
    不同方法的识别结果
    CMDDTMKLTJMDMECAHTL
    1S1S2S1S1S1S1
    2S1S1S3S2S1S1
    3S1S3S2S1S3S2
    4S2S2S1S1S2S2
    5S2S2S2S2S2S2
    6S2S3S1S1S3S3
    7S2S2S3S2S2S2
    8S2S2S2S3S3S2
    9S2S3S1S2S3S3
    10S2S3S1S3S1S3
    11S2S1S3S1S3S3
    12S2S2S3S1S2S2
    13S3S3S3S3S2S3
    14S3S2S3S2S3S3
    15S3S3S3S3S3S3
    16S3S4S2S2S4S2
    17S3S2S4S2S2S2
    18S3S4S2S4S2S4
    19S3S2S4S3S3S3
    20S3S4S2S4S2S4
    21S3S2S4S2S4S3
    22S3S2S2S3S3S3
    23S3S4S2S2S2S4
    24S3S3S3S3S3S3
    25S4S3S3S3S3S4
    26S4S2S2S4S4S4
    27S4S3S4S2S3S3
    图  8  异构迁移学习前后t–SNE的2维散点图
    Fig.  8  2D scatter plots of t–SNE before and after heterogeneous transfer learning
    下载: 全尺寸图片

    图67表2的对比结果可知,随着非均等的源域有类标签训练样本数量的减少,CAHTL和其它4种迁移学习方法的识别准确率和平均识别准确率总体上都有不同程度的下降,主要是由于对空间轴承1的4个寿命阶段待测样本训练都不均衡、不充分。但CAHTL的寿命阶段识别准确率和平均识别准确率的下降幅度相比其它4种方法而言是最小的;且CAHTL对4个寿命阶段的识别准确率和平均识别准确率始终比其它4种方法要高,避免了对不同寿命阶段的待测样本识别准确率差距过大(即对少样本寿命阶段的待测样本的识别准确率过低)问题。此外,由图8(a)8(b)的对比结果可知,CAHTL中的异构迁移学习网络不仅能使源域和目标域中样本在分布上更趋近一致,还能使两域中相同类别的样本更好地聚合在一起,同时又能使两域中不同类别的样本相对更为分散,因此CAHTL的确能够减小源域和目标域样本的分布差异性并提高对目标域待测样本的分类(即寿命阶段识别)精度。

    在实验2(C3$ \to $C1)中,将工况C3下的1号滚动轴承的全寿命样本作为源域样本来识别工况C1下的空间轴承1的全寿命样本(目标域样本)的寿命阶段。实验前,分别对工况C3下的1号滚动轴承和工况C1下的空间轴承1的每一寿命阶段各随机取80个样本作为用于实验的源域和目标域各寿命阶段的总样本,即用于实验的源域和目标域总样本数均为320。

    在源域中按照4∶1∶2∶3的比例选取各阶段样本用作有类标签训练样本:正常状态、早期退化、中期退化、完全失效阶段样本数分别为$ 2Q/5 $$ Q/10 $$ Q/5 $$ 3Q/10 $,即源域所有训练样本的总数为$ Q $($ Q \leqslant 200 $);在目标域中对正常状态、早期退化、中期退化和完全失效这4个寿命阶段按照3∶4∶1∶2的比例进行随机取样作为目标域待测样本,待测样本总数也为$ Q $。将CAHTL对目标域待测样本的寿命阶段识别准确率和平均识别准确率与其他4种迁移学习方法进行比较,对比结果如图9所示;当源域有类标签训练样本总数$Q = 30$时,CAHTL和其它4种被比较方法的寿命阶段识别准确率和平均识别准确率如图10所示。

    图  9  空间滚动轴承1的4个寿命阶段的平均识别准确率
    Fig.  9  Comparison of the average identification accuracy of four life stages of space rolling bearing 1
    下载: 全尺寸图片
    图  10  Q=30时寿命阶段识别准确率
    Fig.  10  Life stage identification accuracy of space rolling bearing 1 when Q=30
    下载: 全尺寸图片

    图910的对比结果可知,随着非均等的源域有类标签训练样本数量的减少,虽然CAHTL和其它4种迁移学习方法对空间轴承1的4个寿命阶段的待测样本的寿命阶段识别准确率和平均识别准确率总体上都有不同程度的下降,但是CAHTL的寿命阶段识别准确率和平均识别准确率的下降幅度相比其它4种方法仍然是最小的;且CAHTL对4个寿命阶段的识别准确率和平均识别准确率始终比其它4种方法要高。

    1)本文所提出的CAHTL中的异构迁移学习网络能够将历史工况下的少量有类标签样本和当前工况下的待测样本迁移到公共特征空间内,实现将不同分布的样本在公共特征空间内同分布的目的。

    2)由源域聚类簇点构建的目标域样本特征的正负样本可实现两域样本的数量再分配,对两域正负样本进行对比学习可以使待测样本具有更好分类性。

    3)CAHTL通过簇分类网络计算待测样本与聚类簇点的相似度完成待测样本分类,且该分类过程无需参数学习,因此可防止源域有类标签训练样本不均等情况下对于不同寿命阶段待测样本识别准确率差距过大和在少有类标签训练样本情况下网络出现过拟合的问题。

    4)利用随机梯度下降和动量更新对CAHTL参数进行不同步更新可保持样本特征的一致性并提高CAHTL的收敛速度。

    CAHTL的以上优势使得它可利用(空间)滚动轴承历史工况下的少量、非均等的已知寿命阶段的训练样本对空间滚动轴承当前工况下的待测样本进行较高精度的寿命阶段识别。

  • 图  1   CAHTL的网络结构框架

    Fig.  1   Structure frame diagram of CAHTL

    下载: 全尺寸图片

    图  2   CAHTL用于空间滚动轴承寿命阶段识别方法

    Fig.  2   Process of using CAHTL to identify the life stage of space rolling bearings

    下载: 全尺寸图片

    图  3   空间滚动轴承振动监测平台

    Fig.  3   Vibration monitoring platform for space rolling bearings

    下载: 全尺寸图片

    图  4   辛辛那提大学滚动轴承加速寿命退化实验台

    Fig.  4   Accelerated rolling bearing life cycle degradation test platform in University of Cincinnati

    下载: 全尺寸图片

    图  5   不同滚动轴承可靠度曲线

    Fig.  5   Reliability curves of different rolling bearings

    下载: 全尺寸图片

    图  6   空间滚动轴承1的4个寿命阶段的平均识别准确率

    Fig.  6   Comparison of the average identification accuracy of four life stages of space rolling bearing 1

    下载: 全尺寸图片

    图  7   Q=27时寿命阶段识别准确率

    Fig.  7   Life stage identification accuracy of space rolling bearing 1 when Q=27

    下载: 全尺寸图片

    图  8   异构迁移学习前后t–SNE的2维散点图

    Fig.  8   2D scatter plots of t–SNE before and after heterogeneous transfer learning

    下载: 全尺寸图片

    图  9   空间滚动轴承1的4个寿命阶段的平均识别准确率

    Fig.  9   Comparison of the average identification accuracy of four life stages of space rolling bearing 1

    下载: 全尺寸图片

    图  10   Q=30时寿命阶段识别准确率

    Fig.  10   Life stage identification accuracy of space rolling bearing 1 when Q=30

    下载: 全尺寸图片

    表  1   实验工况表

    Table  1   Detailed working conditions

    实验平台工况转速载荷监测对象
    重庆大学
    C1约1 000 r/min7 kg
    (轴向预载)
    空间滚动轴承1
    C2约3 000 r/min7 kg
    (轴向预载)
    空间滚动轴承2
    辛辛那提大学C32 000 r/min6 000 lbs
    (径向载荷)
    1号常规滚动轴承

    表  2   不同方法对目标域待测样本的寿命阶段识别结果

    Table  2   Lifetime stages identified by different methods for target domain test samples

    待测样
    本编号
    待测样本所属
    真实寿命阶段
    不同方法的识别结果
    CMDDTMKLTJMDMECAHTL
    1S1S2S1S1S1S1
    2S1S1S3S2S1S1
    3S1S3S2S1S3S2
    4S2S2S1S1S2S2
    5S2S2S2S2S2S2
    6S2S3S1S1S3S3
    7S2S2S3S2S2S2
    8S2S2S2S3S3S2
    9S2S3S1S2S3S3
    10S2S3S1S3S1S3
    11S2S1S3S1S3S3
    12S2S2S3S1S2S2
    13S3S3S3S3S2S3
    14S3S2S3S2S3S3
    15S3S3S3S3S3S3
    16S3S4S2S2S4S2
    17S3S2S4S2S2S2
    18S3S4S2S4S2S4
    19S3S2S4S3S3S3
    20S3S4S2S4S2S4
    21S3S2S4S2S4S3
    22S3S2S2S3S3S3
    23S3S4S2S2S2S4
    24S3S3S3S3S3S3
    25S4S3S3S3S3S4
    26S4S2S2S4S4S4
    27S4S3S4S2S3S3
  • [1] 徐鹏,皋军,邵星.基于AMCNN-BiGRU的滚动轴承故障诊断方法研究[J].振动与冲击,2023,42(18):71–80. doi: 10.13465/j.cnki.jvs.2023.18.009

    Xu Peng,Gao Jun,Shao Xing.Fault diagnosis method for rolling bearings based on AMCNN-BiGRU[J].Journal of Vibration and Shock,2023,42(18) 71-80 doi: 10.13465/j.cnki.jvs.2023.18.009
    [2] Han Baokun,Zhang Xiao,Wang Jinrui,et al.Hybrid distance-guided adversarial network for intelligent fault diagnosis under different working conditions[J].Measurement,2021,176:109197. doi: 10.1016/j.measurement.2021.109197
    [3] 吴昊年,陈仁祥,胡小林,等.改进均衡分布适配的滚动轴承寿命阶段识别[J].振动工程学报,2021,34(1):194–201. doi: 10.16385/j.cnki.issn.1004-4523.2021.01.022

    Wu Haonian,Chen Renxiang,Hu Xiaolin,et al.Life stage identification of rolling bearing based on improved BDA method[J].Journal of Vibration Engineering,2021,34(1):194–201 doi: 10.16385/j.cnki.issn.1004-4523.2021.01.022
    [4] 董绍江,裴雪武,吴文亮,等.基于多层降噪技术及改进卷积神经网络的滚动轴承故障诊断方法[J].机械工程学报,2021,57(1):148–156. doi: 10.3901/JME.2021.01.148

    Dong Shaojiang,Pei Xuewu,Wu Wenliang,et al.Rolling bearing fault diagnosis method based on multilayer noise reduction technology and improved convolutional neural network[J].Journal of Mechanical Engineering,2021,57(1):148–156 doi: 10.3901/JME.2021.01.148
    [5] Dong Shaojiang,Sheng Jinlu,Tang Baoping,et al.Bearings in simulated space conditions running state detecton based on Tsallis entropy-KPCA and optimized fuzzy c-means model[J].Noise Control Engineering Journal,2017,65(2):62–70. doi: 10.3397/1/376426
    [6] 陈仁祥,陈思杨,杨黎霞,等.基于振动敏感时频特征的航天轴承寿命状态识别方法[J].振动与冲击,2016,35(17):134–139. doi: 10.13465/j.cnki.jvs.2016.17.023

    Chen Renxiang,Chen Siyang,Yang Lixia,et al.Life state recognition method for space bearings based on sensitive time-frequency features of vibration[J].Journal of Vibration and Shock,2016,35(17):134–139 doi: 10.13465/j.cnki.jvs.2016.17.023
    [7] 张焱,汤宝平,韩延,等.融合失效样本与截尾样本的滚动轴承寿命预测[J].振动与冲击,2017,36(23):10–16. doi: 10.13465/j.cnki.jvs.2017.23.002

    Zhang Yan,Tang Baoping,Han Yan,et al.Life prediction for rolling bearings utilizing both failure and truncated samples[J].Journal of Vibration and Shock,2017,36(23):10–16 doi: 10.13465/j.cnki.jvs.2017.23.002
    [8] Xu Guanji,Hou Dongming,Qi Hongyuan,et al.High-speed train wheel set bearing fault diagnosis and prognostics:A new prognostic model based on extendable useful life[J].Mechanical Systems and Signal Processing,2021,146:107050. doi: 10.1016/j.ymssp.2020.107050
    [9] Wang Xu,Wang Tianyang,Ming Anbo,et al.Semi-supervised hierarchical attribute representation learning via multi-layer matrix factorization for machinery fault diagnosis[J].Mechanism and Machine Theory,2022,167:104445. doi: 10.1016/j.mechmachtheory.2021.104445
    [10] Mei Xueyan,Liu Zelong,Robson P M,et al.RadImageNet:An open radiologic deep learning research dataset for effective transfer learning[J].Radiology:Artificial Intelligence,2022,4(5):e210315. doi: 10.1148/ryai.210315
    [11] He You,Tang Hesheng,Ren Yan,et al.A deep multi-signal fusion adversarial model based transfer learning and residual network for axial piston pump fault diagnosis[J].Measurement,2022,192:110889. doi: 10.1016/j.measurement.2022.110889
    [12] Liu Guokai,Shen Weiming,Gao Liang,et al.Active federated transfer algorithm based on broad learning for fault diagnosis[J].Measurement,2023,208:112452. doi: 10.1016/j.measurement.2023.112452
    [13] Song Xiangyu,Li Jianxin,Lei Qi,et al.Bi-CLKT:Bi-graph contrastive learning based knowledge tracing[J].Knowledge-Based Systems,2022,241:108274. doi: 10.1016/j.knosys.2022.108274
    [14] Wang Biao,Lei Yaguo,Li Naipeng,et al.A hybrid prognostics approach for estimating remaining useful life of rolling element bearings[J].IEEE Transactions on Reliability,2020,69(1):401–412. doi: 10.1109/TR.2018.2882682
    [15] Yang Chun,Zou Jianxiao,Wu Jianhua,et al.Supervised contrastive learning for recommendation[J].Knowledge-Based Systems,2022,258:109973. doi: 10.1016/j.knosys.2022.109973
    [16] Adewoyin R A,Dueben P,Watson P,et al.TRU-NET:A deep learning approach to high resolution prediction of rainfall[J].Machine Learning,2021,110(8):2035–2062. doi: 10.1007/s10994-021-06022-6
    [17] 姚德臣,李博阳,刘恒畅,等.基于注意力GRU算法的滚动轴承剩余寿命预测[J].振动与冲击,2021,40(17):116–123. doi: 10.13465/j.cnki.jvs.2021.17.016

    Yao Dechen,Li Boyang,Liu Hengchang,et al.Residual life prediction of rolling bearing based on attention GRU algorithm[J].Journal of Vibration and Shock,2021,40(17):116–123 doi: 10.13465/j.cnki.jvs.2021.17.016
    [18] Wang Yida,Tan D J,Navab N,et al.SoftPool++:An encoder–decoder network for point cloud completion[J].International Journal of Computer Vision,2022,130(5):1145–1164. doi: 10.1007/s11263-022-01588-7
    [19] Duan Yiqun,Wang Zhen,Wang Jingya,et al.Position-aware image captioning with spatial relation[J].Neurocomputing,2022,497:28–38. doi: 10.1016/j.neucom.2022.05.003
    [20] Ye Zhuang,Yu Jianbo.Deep morphological convolutional network for feature learning of vibration signals and its applications to gearbox fault diagnosis[J].Mechanical Systems and Signal Processing,2021,161:107984. doi: 10.1016/j.ymssp.2021.107984
    [21] Montoya J A,Díaz-Francés E,Figueroa G.Estimation of the reliability parameter for three-parameter Weibull models[J].Applied Mathematical Modelling,2019,67:621–633. doi: 10.1016/j.apm.2018.11.043
    [22] 张小丽,王保建,马猛,等.滚动轴承寿命预测综述[J].机械设计与制造,2015(10):221–224. doi: 10.3969/j.issn.1001-3997.2015.10.057

    Zhang Xiaoli,Wang Baojian,Ma Meng,et al.A review of life prediction for roller bearing[J].Machinery Design & Manufacture,2015(10):221–224 doi: 10.3969/j.issn.1001-3997.2015.10.057
    [23] Yahia E,Premnath K N.Central moment lattice Boltzmann method on a rectangular lattice[J].Physics of Fluids,2021,33(5):057110. doi: 10.1063/5.0049231
    [24] Rahimi A,Gönen M.Efficient multitask multiple kernel learning with application to cancer research[J].IEEE Transactions on Cybernetics,2022,52(9):8716–8728. doi: 10.1109/TCYB.2021.3052357
    [25] Peng Jiangtao,Sun Weiwei,Ma Li,et al.Discriminative transfer joint matching for domain adaptation in hyperspectral image classification[J].IEEE Geoscience and Remote Sensing Letters,2019,16(6):972–976. doi: 10.1109/LGRS.2018.2889789
    [26] Jin Xiaona,Yang Xiaowei,Fu Bo,et al.Joint distribution matching embedding for unsupervised domain adaptation[J].Neurocomputing,2020,412:115–128. doi: 10.1016/j.neucom.2020.05.098
    [27] Chen Peng,Li Yu,Wang Kesheng,et al.A novel knowledge transfer network with fluctuating operational condition adaptation for bearing fault pattern recognition[J].Measurement,2020,158:107739. doi: 10.1016/j.measurement.2020.107739
图(10)  /  表(2)

本文结构

    /

    返回文章
    返回