海底观测科学作为新兴科学,在过去的20年里发展迅速,很多新项目和研究计划都着眼于建立长期运行的水下网络[1]。海底监测网主要由岸基基站、光电复合缆、水下接驳盒、观测仪器及传感器构成。海底主干缆的海底节点通过接驳盒相连,而节点上的接驳盒可再次扩展连接多个次接驳盒,观测仪器和传感设备则连接到各个次接驳盒的输出端口上。所以,接驳盒作为关键网络节点,实现了电能和通讯的中转,是海底观测网的中枢系统[2]。为了能提供稳定、可靠的电能和通讯平台,保证海底观测网长期海底运行,对接驳盒的故障检测就显得极为重要。然而,目前的接驳盒故障检测只对特定观测指标设置固定阈值,当某个观测值超过设定阈值时,即判断系统发生故障。阈值的设置主要依赖人工经验,缺乏适应性和动态性。当系统存在输入变化、工作点变化以及噪声等干扰时,往往会导致误报和漏报现象。并且,仅通过单个指标异常就判断出系统故障,没有对各观测指标进行综合分析,也会导致大量的误报。
信息系统中细微变化的慢慢积累最终导致系统出现本质的改变,即所谓的“量变引起质变”。人体的病变也是由各种细微变化的聚集和相互作用所导致的。机体免疫系统是人体对抗疾病最有效的防御机制,保护机体不受自身病变和外界入侵所带来的有害物质的影响。所以,机体免疫的生物特性及其机制为解决实际工程中机器设备的故障检测、诊断和恢复提供了新的思路和方法[3]。
1994年,生物免疫学家Matzinger[4]提出了危险理论,认为免疫系统不是依赖自我和非我进行区分,而是感知机体组织在遭受入侵时所产生的危险信号。当因内部或外部原因使得机体生理失去平衡时,机体受损细胞的内外环境都会发生变化。在变化的过程中会释放出被抗原提呈细胞所感知的危险信号。通过借鉴危险理论思想,Greensmith等[5–6]提出了树突状细胞模型及其算法(dendritic cell algorithm,DCA),模拟DC细胞的生物行为模式,并将它应用到异常检测中。Laurentys等[7]在动态系统的故障诊断中引入危险理论,实现了动态系统的故障自动检测功能。Cui等[8]采用DCA算法实现了旋转电机的实时故障诊断。Iftikhar等[9]通过引入危险理论和DC细胞,实现了复杂系统的未知故障检测和隔离。
DCA主要分为预处理阶段、检测阶段和分析阶段。在预处理阶段,DCA缺乏数据训练机制,主要依靠专家知识手动进行输入信号的分类[10]。人工方式效率低,容易出错,当问题非常复杂时往往无从下手。针对此问题,Gu等[11]提出了主成分分析统计方法处理应用数据,实现DCA输入信号的自动选择和分类,但是实用性和稳定性较差。Chelly等[12]提出了基于粗糙集的DCA特征选择和分类方法,与主成分分析方法相比更方便、精确。随后,Chelly等[13]针对基于粗糙集的数据预处理机制会造成信息丢失的问题,提出了基于模糊–粗糙集理论的改进方法。Chelly等提出的上述方法[12–13]在算法处理上需要较大的时间开销,不符合DCA轻量级的特征,且可靠性有待进一步的验证。其他DCA的预处理方法还包括关联系数和信息增益[14],这两种方法在信号的分类上缺乏自适应性。针对上述问题,作者提出了一种基于变化感知的危险信号定义方法,从系统特征的变化中提取DCA的危险信号和安全信号,提高DCA输入信号的自适应性。同时,针对标准DCA的抗原异常评价方式只能检测某个数据异常,无法反映系统的整体情况,提出通过计算成熟DC的细胞浓度评价系统的异常程度,从而判断系统是否有系统故障产生。最后,将基于改进DCA的故障检测方法在水下接驳盒故障检测环境中进行可行性验证。
1 DCA算法抗原提呈细胞是免疫系统中重要的免疫控制机制,其作用类似人类身体的入侵检测器,监控机体中潜在的外来入侵者,是先天免疫和适应性免疫之间的重要接口,起着承上起下的作用。DC细胞是已知功能最强的抗原提呈细胞之一,具有采集、处理、提呈抗原信息的能力,负责对入侵的微生物进行初始识别,并将识别到的抗原提呈给淋巴结中的T细胞,引起免疫应答。DCA算法模拟DC细胞的生物信号采样、融合、分析的抗原提呈过程。通过采集周围环境中的抗原所抽象出的输入信号,经过信号融合转换等过程,计算得到输出信号及其溶度来决定DC的状态,再根据DC的状态评价抗原的异常程度。
DC采集的输入信号包括:危险信号 (danger signals,DS)、安全信号 (safe signals,SS)、病原体相关分子模式(pathogenic associated molecular patterns,PAMP),以及致炎因子 (inflammatory cytokines,IC)。这些生物信号的含义及其隐喻如表1所示。
表1 生物信号及其隐喻 Tab. 1 Biological signal and metaphor |
![]() |
DC细胞有3种状态:未成熟DC(immature DC,iDC)、半成熟DC(semi-mature DC,smDC)、成熟DC(mature DC,mDC)。由iDC对输入信号进行采集、转换、计算得到输出信号,再依据输出信号的溶度决定iDC的迁移状态。DC输出3种信号:协同刺激分子 (costimulatory molecules,CSM)、成熟因子 (mature cytokines,Mat)、半成熟因子 (semi-mature cytokines,Semi)。其中,CSM为DC是否进行状态迁移的依据,决定了DC的生命周期。
在进行信号处理时,安全信号SS、危险信号DS和PAMP信号对不同输出信号的贡献度不一样。安全信号SS会增加半成熟因子溶度,抑制成熟因子溶度的输出;而危险信号DS和PAMP信号会增加成熟因子溶度;致炎因子IC起到放大其他信号的作用。在Greensmith等提出的人工DC模型中给出了信号转换的权值及信号处理公式[15]。
表2 信号转换的权值 Tab. 2 Weight of signal transformation |
![]() |
表2为输入信号和输出信号进行转换时的对应权值,它是由生物免疫学家通过实验得到。比如PAMP、DS、SS转换为CSM的权值分别是W1、W1/2、W1
${O_i} = \sum\limits_{j = 0}^2 {\left( {W{t_{ij}} \times {S_j}} \right)} \times \left( {1 + I} \right), {i} = 0,1,2$ | (1) |
式中:Oj为输出信号,O0为CSM,O1为Semi,O2为Mat;Sj为输入信号,S0为PAMP,S1为DS,S2为SS;Wtij为权值,i为表2中的行,j为表2中的列;I为致炎因子IC,本文暂不考虑致炎因子的影响。
DC是种群算法,在生命周期内,每个DC会对多个抗原进行随机采样。当某个DC的CSM到达迁移阈值时,如果成熟因子浓度大于半成熟因子浓度,DC由iDC迁移为mDC,被该DC提呈的每个抗原标记为危险抗原,设置抗原环境值为1,并进行累加;反之,迁移为smDC,被该DC提呈的每个抗原标记为安全抗原,设置抗原环境值为0。最后,抗原被提呈为危险的总次数除以抗原被提呈的总次数计算得到每个抗原的成熟环境抗原值 (mature context antigen value,MCAV),表示每个抗原的异常程度系数。一旦该抗原的MCAV值超过设定的异常阈值,则判定该抗原为异常。
2 故障检测模型作者在标准DC模型基础之上,提出了一种危险感知的接驳盒故障检测模型,该模型包括3个模块:危险感知模块、信号转换模块和异常评价模块,如图1所示。
通过采集抗原数据,DC细胞实时地将抗原释放的信号进行转换、累加。当观测指标值发生细微变化时,其变化情况都会被DC细胞感知到。当变化所产生的危险信号累积到一定程度,会最终导致DC细胞向成熟状态迁移。
![]() |
图1 危险感知的故障检测模型 Fig. 1 Fault detection model based on danger perception |
本模型将水下接驳盒的工作环境状态作为信号源,观测指标包括:电压、电流、温度、湿度以及漏水等。危险感知模块采集来自信号源的观测数据,将每次采集到的一组数据作为一个抗原。通过分析抗原中数据项类型、计算数据的变化程度,得到每个抗原释放的DS、SS和PAMP信号,对应变量XDS、XSS、XPAMP作为信号转换模块的输入。
在信号转换模块,DC接收来自危险感知模块的输入信号,经过信号转换处理,输出CSM、Semi、Mat信号,对应变量XCSM、XSemi、XMat。当XCSM>μ时,μ为迁移阈值,DC状态发生迁移。此时,如果XSemi>XMat,iDC迁移为smDC;否则,其迁移为mDC。最后,计算mDC的溶度δmDC得到系统的异常程度。
2.1 危险感知危险感知模块包括数据采集、变化检测和枚举判断3个子模块。数据采集模块负责监测系统的运行状态,将采集到的每组数据即抗原按照模拟量和枚举量分成两组。
模拟量数组
${X_{_{\rm DS}}} = \frac{{\displaystyle\sum\limits_{i = 0}^n {C{_i}} }}{n}$ | (2) |
枚举量数组
$\left\{\!\!\!\!\! \begin{array}{l}{X_{\rm PAMP}} = 1,{X_{\rm SS}} = 0,\;\; {\rm if} \ \exists {e_j} = 1,j \in m;\\{X_{\rm PAMP}} = 0,{X_{\rm SS}} = 1,\;\; {\rm if} \ \forall {e_j} = 0,j \in m\end{array} \right.$ | (3) |
在DC种群中随机选取DC细胞对输入信号DS、SS和PAMP进行采样,计算DC细胞的输出信号CSM、Semi、Mat,并进行累加。其中,信号转换公式采用标准DCA中的定义,如式(1)所示。依据水下接驳盒实验环境,本文提出的故障检测模型的信号转换权值如表3所示。
表3 故障检测模型中的信号转换权值 Tab. 3 Weight of signal transformation in fault detection model |
![]() |
2.3 异常评价
标准DCA[4]是通过计算每个抗原的异常程度,即MCAV值判断抗原是否异常。针对单个抗原的异常判断只能判断某个样本数据是否异常,无法反映整个系统的异常状态。因为单个抗原也就是一个样本数据,只反映了系统的一个瞬时状态。对于系统监测而言,除了瞬时状态异常的突发型故障,还有因系统老化或环境因素造成的渐变型故障。
机体免疫中单个抗原无法反映人体健康状况。而免疫系统的生理平衡,以及对病原体的识别和抗体的生成都离不开免疫细胞浓度的相互作用。所以,本文借鉴机体免疫中的细胞浓度作用机制,对标准DCA的异常评价进行改进,使其不再针对抗原进行评价,而是根据mDC细胞浓度评价整个系统的异常程度以发现潜在的危险。随着对危险信号的强弱感知,mDC的浓度会不断变化,一旦浓度超过阈值,就认为系统发生了故障。mDC的浓度计算公式如下:
${\delta _{\rm mDC}} = \frac{{{N_{\rm mDC}}}}{{{N_{\rm iDC}} + {N_{\rm mDC}} + {N_{\rm smDC}}}}$ | (4) |
将水下接驳盒故障检测作为模型验证的例子。采用接驳盒的工作状态作为数据源。通过构建人工DC细胞检测设备是否发生了渐变型故障。
3.1 观测指标水下接驳盒主要由控制腔和4个输出端口组成,其监测指标主要包括6大类:电压、电流、温度、湿度、漏水和接地电阻。具体指标如下:
1)控制腔(control cavity,CC):输入电压、输入电流、内载电压、内载电流、温度、湿度、漏水。
2)输出端口(output port,OP)1~4:输出电压、输出电流、接地电阻。
将每次采集到的所有指标值作为一个抗原。根据数据类型将抗原内的指标分为两组。接地电阻和漏水属于枚举量作为1组,其他指标属于模拟量归为1组。所以,抗原由两部分组成,表示如下:
1)模拟量数组
表4 控制腔的模拟量指标 Tab. 4 Analog indicators of control cavity |
![]() |
表5 输出端口的模拟量指标 Tab. 5 Analog indicators of output port |
![]() |
将每个指标归一化,并依据监测指标类型给出不同的变化阈值,所以定义阈值数组
2)枚举量数组E,作为枚举判断的输入,其成员包括控制腔的漏水和输出端口的接地电阻,如表6所示。
表6 枚举量指标 Tab. 6 Enumeration indicators |
![]() |
水下接驳盒一旦出现漏水或接地电阻故障,说明产生了绝对异常。所以,只要这些属性中有一个为1,就说明出现绝对异常,则XPAMP=1,XSS=0;如果所有属性都为0,则XPAMP=0,XSS=1。
3.2 实验分析采用水下接驳盒的真实数据模拟指标的线性变化。初始化DC种群包含20个iDC,生成抗原数据1 000个。实验分为两组进行测试:单指标渐变和多指标渐变。
1)单指标测试:控制腔输入电压UICC每次增加0.1 V。
2)多指标测试:控制腔输入电压UICC每次增加0.1 V,控制腔输入电流IICC每次增加0.005 A。
两次的实验结果如图2所示。通过图2可知:随着指标值渐变,mDC的浓度随时间逐渐增加。当浓度到达特定阈值时就可以发出告警,表明系统发生了渐变型故障。两组实验选取的指标变化步长都很微小,并且mDC浓度都是在很短时间内就能达到阈值,说明模型对因老化或环境因素造成的渐变型故障具有很好的检测能力。同时,第2)组测试较第1)组mDC的浓度增加更快,能更早地到达告警阈值而发现异常,这符合多指标比单指标的异常程度大且能较早被发现的实际情况。上述实验验证了本文方法在渐变型故障检测中的可行性。
![]() |
图2 改进DCA的渐变型故障检测结果 Fig. 2 Results of gradual fault based on improved DCA |
主元分析方法(principal component analysis,PCA)是基于多变量统计的故障诊断方法,在工业过程监控中常用于故障的检测和隔离。所以,采用PCA方法与本文方法进行性能对比。将1 000个正常的采样数据作为训练数据集,再用1 000个包含多指标(UICC和IICC)渐变故障的采样数据作为测试数据集,检测结果如图3所示。
![]() |
图3 PCA的渐变型故障检测结果 Fig. 3 Results of gradual fault based on PCA |
图3中,SPE是测试数据在残差空间的投影变化。通过对正常数据的计算得到PCA模型中正常状态下的SPE控制限。如果测试数据的SPE超过该控制限,说明产生了故障。
上述两种方法是在相同的实验环境下,采用相同的多指标渐变故障的测试数据进行测试。两种方法的性能采用检测点和准确度两个指标进行比较。检测点越小,说明检测到故障所需时间越短。两种方法在渐变故障检测中的实验结果比较如表7所示。
表7 两种方法渐变故障的检出点和准确度 Tab. 7 Detection point and accuracy of gradual fault detection with two methods |
![]() |
由表7可知:在改进DCA的故障检测实验中,得到mDC浓度超过报警阈值的平均样本检测点是175。而PCA的SPE超过正常控制线的平均检测点是416。由于机体免疫的快速响应机制,使得改进DCA方法能更早地检测出故障的发生时刻,检测速度远大于传统的数据统计分析方法。在检测的准确率上,改进DCA方法也比PCA方法更高。因此,本文方法在性能上优于PCA方法。
4 结 论在标准DC模型的基础上进行改进,引入基于变化的危险感知思想,在数据预处理阶段提出了一种新的输入信号选择机制。同时,改进模型的异常评价方式,使其不再针对单个抗原进行异常判断,而是评价整个系统的异常程度。
初步验证了改进模型在水下接驳盒渐变故障检测中的可行性。在未来的实验中,还要考察其他类型故障,进一步验证其通用性。此外,除了需要快速检测到故障,还必须分析故障产生的原因,对故障进行定位和恢复。所以,在后续改进中,会引入适应性免疫机制,增加故障诊断与恢复功能。
[1] |
Favali P,Person R,Barnes C R,et al.Seafloor observatory science[C]//Proceedings of the 2009 Sustained Ocean Observations and Information for Society(OceanObs’09).Venis:ESA Publication,2009,DOI:10.5270/OceanObs09.cwp.28.
|
[2] |
Lu Hanliang, Li Dejun, Yang Canjun. Design and implementation of underwater junction box prototype system for deep seafloor observatory network[J]. Journal of Zhejiang University (Engineering Science), 2010, 44(1): 8-13. |
[3] |
Bayar N, Darmoul S, Hajri-Gabouj S. Fault detection,diagnosis and recovery using artificial immune systems:A review[J]. Engineering Applications of Artificial Intelligence, 2015, 46(A): 43-57. |
[4] |
Matzinger P. Tolerance,danger,and the extended family[J]. Annual Review of Immunology, 1994, 12(1): 991-1045. DOI:10.1146/annurev.iy.12.040194.005015 |
[5] |
Greensmith J,Aickelin U,Cayzer S.Introducing dendritic cells as a novel immune-inspired algorithm for anomaly detection[C]//Proceedings of the 4th International Conference on Artificial Immune Systems ICARIS 2005.Heidelberg:Springer,2005,3627:153–167.
|
[6] |
Greensmith J,Gale M B.The functional dendritic cell algorithm:A formal specification with Haskell[C]//Procecdings of the 2017 IEEE Congress on Evolutionary Computation CEC 2017.Donostia:IEEE,2017:1787–1794.
|
[7] |
Laurentys C A, Palhares R M, Caminhas W M. Design of an artificial immune system based on danger model for fault detection[J]. Expert Systems with Applications, 2010, 37(7): 5145-5152. DOI:10.1016/j.eswa.2009.12.079 |
[8] |
Cui Delong,Zhang Qinghua,Xiong Jianbin,et al.Fault diagnosis research of rotating machinery based on dendritic cell algorithm[C]//Proceedings of the 2015 IEEE International Conference on Information and Automation ICIA 2015.Lijiang:IEEE,2015,10:1020–1025.
|
[9] |
Iftikhar K,Khan M T,de Silva C W.Fault detection with sensor fusion using intelligent immune system[C]//Proceedings of the 2016 IEEE 7th Annual Information Technology,Electronics and Mobile Communication Conference IEMCON 2016.Vancouver:IEEE,2016:1–6.
|
[10] |
Chelly Z, Elouedi Z. A survey of the dendritic cell algorithm[J]. Knowledge and Information Systems, 2016, 48(3): 505-535. DOI:10.1007/s10115-015-0891-y |
[11] |
Gu F,Greensmith J,Oates R,et al.PCA 4 DCA:The application of principal component analysis to the dendritic cell algorithm[EB/OL].(2009–01-01)[2016–09-01].https://ssrn.com/abstract=2830357.
|
[12] |
Chelly Z,Elouedi Z.RC-DCA:A new feature selection and signal categorization technique for the dendritic cell algorithm based on rough set theory[C]//Proceedings of the 11th International Conference on Artificial Immune Systems ICARIS 2012.Taormina:Springer,2012:152–165.
|
[13] |
Chelly Z,Elouedi Z.Improving the dendritic cell algorithm performance using fuzzy-rough set theory as a pattern discovery technique[C]//Proceedings of the 5th International Conference on Innovations in Bio-Inspired Computing and Applications IBICA 2014.Ostrava:Springer,2014:23–32.
|
[14] |
Gu F.Theoretical and empirical extensions of the dendritic cell algorithm[D].Nottingham:University of Nottingham,2011.
|
[15] |
Greensmith J,Aickelin U,Cayzer S.Detecting danger:The dendritic cell algorithm[M]//Robust Intelligent Systems.London: Springer,2008:89–112.
|