★ 北京广利核系统工程有限公司 赵小鹏,郄永学
关键词:高可靠性;电子设备;健康状态;核电板卡
随着工业技术的不断发展,高可靠性装备复杂任务处理系统的设计和部署越来越复杂。与此同时,非预期故障易引起系统跳机,不仅造成高额的维修花费,还会导致严重事故,这对系统的可靠性和安全性提出了更高的要求[1,2]。
健康状态评估技术是视情维修和预测及健康管理(Prognostics Health Management, PHM)的基础实现技术,也是系统可靠性、安全性的支撑与保证技术,同时其在运维技术的智能化发展过程中起着非常关键的作用[3]。健康状态评估技术的对象是有退化或失效性质的系统、子系统或者关键器件,其最终目的是通过研究对象的健康状态来指导运维策略的制定及开展。电子设备作为可靠性装备的关键组成部分, 一直是该领域研究的重点和难点。电子设备(本文特指应用于高可靠性装备的电子设备)由电路板、功能电路、电子元器件等逐层级组合构成,其健康状态是各层级组成单元健康状态的综合体现。目前电子设备仅有少量电子元器件的健康状态可以采用其输出电信号的变化进行表征,大部分电子元器件的退化无明显征兆,这也直接导致电子设备的功能电路级、电路板级甚至设备级的退化状态难以直接观测。当电子设备发生故障时,其电信号往往突然发生变化,且发生间隔时间很短。目前还没有合适的可观测的外在征兆来刻画电子设备从正常到故障的衰退过程,即电子设备的健康状态难以表征,这是电子设备PHM技术的一个关键难点[4]。研究显示,电子设备在运行过程中普遍存在着比较薄弱的环节,这些环节常常会引起设备的性能退化或者故障。因此,研究关键的薄弱环节对于研究电子设备的健康评估是业界的应对途径[5,6]。
基于以上问题,本文分析了电子设备现有状态评估方法, 并以数据驱动评估方法为重点,研究了基于工况的评估多模型建立策略,提出了相应的模型参数的辨识方法,最后基于板卡DCDC芯片老化实验数据开展仿真验证,证明了该策略的有效性。
1 电子设备健康状态评估方法
目前已有的电子设备状态评估方法主要可以分为三大类别:经典评估方法、基于数据的评估方法和基于模型的评估方法。需要指出的是, 实际应用中这些方法间并没有非常严格的界限,往往是互相融合交叉使用。此外,对于状态评估方法的选择还需要综合考虑如评估方法最终用户、监测技术水平、模型建立的复杂性、训练及检验模型的要求及现有数据的可用性等一系列因素。
1.1 经典评估方法
(1)层次分析法
层次分析法(Analytic Hierarchy Process, A H P ) 由 美 国 匹 兹 堡 大 学 教 授 T . L . 萨 迪 (T. L.Saaty)于20世纪70年代初提出。其通过确定同一层次各评估指标的初始权重, 并定量化地描述定性因素使定性信息与定量信息有机结合,整个过程体现了分解、判断、综合的思维分析逻辑, 是一种系统的评价方法。文献 [7]采用该方法开展健康状态评估,通过对研究对象健康状态进行层次分析量化, 同时,给出研究对象的健康状态与故障状态指标, 并将当前健康状态分别与典型的健康状态、故障状态进行比较,从而得出当前研究对象的健康状态。但是这种方法中利用的定性信息相对其他方法要多,会导致评估结果主观化。基于此,文献 [8]提出了一个基于贝叶斯网络的状态评估模型。该模型针对变压器预防性试验数据, 首先建立了一个健康状态量化的分层模型, 实现了对变压器的历史、当前、未来状态的评估,然后利用模糊隶属度函数确定了分层模型各参数的阈值和分值, 最终建立了基于贝叶斯网络的变压器状态评估模型,提高了其状态评估的准确性。
(2)模糊理论法
模糊理论(Fuzzy Theory)是研究和处理模糊性现象的理论。在实际过程中,设备状态及其机理间存在大量不确定性和模糊性,传统精确数学理论难以描述其关系。模糊理论可对人类模糊思维和模糊语言加以定量分析, 为解决不确定性和模糊性提供了有效途径[9]。模糊理论适用于定性、定量信息并存的系统评估。现有研究多采用模糊综合评价及模糊识别的方法,融合系统基础技术数据、运行数据、检修数据等各类数据,分析对象工作状态并对其健康状态进行评估,为设备的状态检修决策提供了依据。文献 [10]针对航天器健康评估,提出了基于模糊变权原理的健康状态评估方法,并结合AHP方法建立了从部件到系统的层次分析模型,其在航天器适应在轨状态变化及减弱主观评估影响方面效果良好。
1.2 基于数据的评估方法
(1)基于检测数据法
基于检测数据的健康状态评估方法主要是指在无先验知识的情况下对采集数据进行分析处理,并基于数据模型展开状态评估。Hu等人[11]针对风电转换器IGBT模块基板焊料疲劳故障,建立了基于壳体温度差的基板焊料疲劳评估方法,并以实际风力发电机转换器IGBT模块为例进行了状态评估,为健康状态评估提供了一种新的思路。
(2)基于健康指标法
基于健康参数的状态评估方法是在构造电子设备健康指数的基础上,通过对健康指数进行监测进而实现电子设备状态评估。例如,和麟等人[12]通过计算分析电子设备检测多参数之间的马氏距离,减少了电子设备健康状态评估方法的虚警概率;沈亲沐等人[13]采用累积插入损耗增益等特征对电连接器的使用状态进行了评估,并取得了较好的效果。
1.3 基于模型的评估方法
基于模型的状态评估方法是通过构造电子设备物理失效模型来对电子设备状态进行评估,主要包括物理模型和过程模型两种。基于物理的健康评估方法建立在对研究对象自身特性的深刻理解基础上,通过机理分析确定能够反映研究对象退化的性能指标,并建立状态数据与研究对象退化间的关系模型,实现对研究对象的健康评估[14]。基于过程模型的健康评估,通过对过程退化轨迹及系统状态的研究建立退化模型,从而达到对健康状态的评估[15]。
综上, 目前健康状态评估技术在机械系统中已有比较广泛的应用,但在电力电子的研究和应用中的发展略缓并且应用效果并不是很理想。其原因一方面在于由于现实困难,电力电子产品的退化机理相关研究甚少,难以把握其物理失效规律;另一方面,电子设备没有合适的特征参数来对其状态进行表征,且用于状态评估的特征参数难以获取。这给核电仪控设备的健康评估技术研究既带来了挑战又带来了机遇。在核电仪控设备健康状态评估研究中, 一方面可以通过研究状态健康参数的方式来对产品进行升级从而对其健康状态进行全面而广泛的监测,另一方面可以结合产品机理研究及监测数据,进一步研究健康状态评估算法。
2 基于多模型的电子设备健康状态评估算法
由以上分析可知,电子设备在运行过程中往往存在着影响其性能退化或故障的薄弱环节。同时,设备的实际运行工况会随环境因素或负荷变化,不同工况条件下设备综合特征存在一定差异,难以采用单一的线性模型来表示。因此,通过采集运行数据来构建过程多模型是一条适当合理的途径。
2.1 电子设备的评估多模型描述
一般地,时变系统可以通过若干子模型构成多模型形式来描述,因此电子设备的状态评估多模型可表达为式(1)[16]:

其中,y(k)代表k时刻时该电子设备的输出,该输出是k时刻所有子模型的综合作用;"为子模型个数;
为其子模型输出对应的归一化后的隶属度(即基函数),是调度变量p(k)的函数,可表示为式(2):

不同特征的子模型共同形成动态网络。在模型运算过程中,通过聚类的方式获得子模型个数及其对应隶属度,子模型通过综合方式来反映系统整体输出。其中,子模型的隶属度由过程数据特征确定,本研究结合工程应用特征采用Gaussian bells函数。
式(1)中的子模型yi (k)形式结合系统特征可以是线性或非线性模型,在此采用多入单出系统的带控制量的自回归模型(Controlled Auto-regressive Model, CAR),其表达式如式(3)所示:

其中,

分别代表系统的输出、 m x l维的输入和系统噪声干扰;
分别为模型的输出和输入的阶次。由此得多模型的最小二乘形式如式(4)所示:

其中,

2.2 多模型参数辨识算法
对电子设备的运行数据,可根据其运行环境或负载情况进行运行工况划分,通过对不同工况的辨识可得到不同工况下的模型(即子模型)。由(4)式可知,所划分子模型的参数可通过最小二乘方式拟合求解。过程中需定义全局优化指标或局部优化指标以确定模型参数,局部最优的方法计算量小、计算速度快且鲁棒性相对要强,在多数情况下表现得更为优越。本文基于局部最优策略,以多模型的实际输出与估计输出偏差的加权平方和为代价函数,得到子模型参数辨识的加权最小二乘递推方法,其代价函数表达形式为式(5):

其中,"为子模型个数;
,
i列向量;
为系统在k时刻的输出量。在局部参数求取中,

由此可得局部参数加权最小二乘递推公式如式(6)~(8)所示:

3 案例研究
本节基于核电仪控板卡某24V-24VDCDC开关电源老化试验数据进行算法仿真研究。开关电源是一种比较新型的电源,具有效率高、重量轻、可升、降压、输出功率大等优点。但由于其电路工作在开关状态,所以噪声比较大。其工作原理如图1所示。

图1 DCDC电路工作原理图
电路由空气开关K(实际电路中为三极管或者场效应管)、续流二极管D、储能电感L、滤波电容C等构成。开关闭合时,电源通过空开K、电感L给负载供电,并将部分电能储存在电感L以及电容C中。由于电感L的自感,在开关接通后,电流缓慢增大至电源电压值。一定时间后,开关断开,由于电感L的自感作用,将保持电路中的电流不变,即从左往右继续流。该电流流过负载, 从地线返回, 流到续流二极管D的正极,经过二极管D,返回电感L的左端,从而形成了一个回路。通过控制开关闭合跟断开的时间,即脉冲宽度调制(Pulse Width Modulation, PWM), 可以控制输出电压。而通过检测输出电压来控制开、关的时间,可以保持输出电压不变,从而实现稳压的目的。电源模块的可靠性直接影响了整个系统的可靠性水平。然而,受电源本身设计不当、设计师降额使用不当、散热设计不合理等多种因素影响, DC/DC电源模块在实际工作中易发生输出功能丧失等故障问题,而一些关键路径上的电源模块如果失效则会导致整个板卡功能的退化或者出现故障状态。因此,对关键位置DCDC芯片进行健康状态评估具有重要意义。
本文对某板卡24V-24V DCDC开关电源老化试验数据进行提取,该过程温度范围为25℃~125℃,性能参数为DC-DC电源的输出电压和输出电流。其中,输入电压和输出电压采用录波仪自动记录,每分钟自动记录一次数据;输出电流采用人工测量的方式,每两个小时测量一次。为保证数据的准确性, 共采取10700组输出电压加速老化数据。应用上述算法对该过程进行建模分析,并根据辨识曲线对处于试验环境中的同型号DCDC芯片进行健康状态评估,结果如图2所示。

图2 基于老化数据的电源状态辨识曲线
由图2可知,基于本方法所构建的健康评估模型,其辨识曲线能够很好地跟踪实际曲线,表明本文算法可以对电源模块的过程健康状态进行完整分析。此外,在预警和报警阈值已知的情况下,可以将设备的健康状态划分为健康状态、亚健康状态和故障状态三个区域,从而提升模型对设备状态分析的准确性。
与此同时,在确定设备状态预测的起始起点,如产生某种异常现象后,可以对其健康状态发展趋势进行预测,在模块故障阈值给定的情况下还可以对其剩余寿命进行预估。以实验板卡所标示的当前状态为例,若此时发生了电源异常报警,即使电池处于健康状态,仍然可以通过模型预测方式给出设备剩余寿命的预测值。目前,基于本研究所开发的健康状态监测平台已经投入实验运行,为现场操作及运维人员提供了直观有效的操作及运维业务参考。

图3 电源健康状态监测曲线
4 结论
本文首先从高可靠性装备电子设备的产品特征出发,研究了基于数据的多模型健康状态评估方法,提出了基于工况的多模型健康评估实现策略,描述了多模型构建方式及其参数的求取方法。该多模型参数可灵活调整,为电子设备健康评估提供了良好的理论依据。然后,本文以核电仪控板卡DCDC开关电源老化试验数据为对象,对该算法进行了仿真研究。结果表明,该方法对电源模块运行健康状态具有良好的评估效果,其在高可靠性装备电子设备健康评估领域的应用中具有可行性。
作者简介:
赵小鹏(1986-),男,河北蔚县人,高级工程师,博士,现就职于北京广利核系统工程有限公司,主要从事智能运维及核电DCS测试与验证方向的研究。
参考文献:
[1] 丁锋, 张艺馨. 面向健康监测的装备可靠性评估研究进展[J]. 航空制造技术, 2022, 65 (12) : 99 - 104.
[2] 许勇, 蔡云泽, 宋林. 基于数据驱动的核电设备状态评估研究综述[J]. 上海交通大学学报, 2022, 56 (3) : 267 - 278.
[3] 闻化, 胡志伟. 装备故障预测与健康管理能力验证评估技术[J]. 计算机测量与控制, 2019, 27 (11) : 260 - 264.
[4] 吕克洪, 程先哲, 李华康, 等. 电子设备故障预测与健康管理技术发展新动态[J] .航空学报, 2019, 40 (11) : 323285.
[5] Montanarig C, Hebner R, Morshuis P. An approach to insulation condition monitoring and life assessment in emerging electrical environments[J]. IEEE Transactions on Power Delivery, 2019, 34 (4) : 1357 - 1364.
[6] Vasan A, Pechtm G. Electronic circuit health estimation through kernell earning[J]. IEEE Transactions on Industrial Electronics, 2017, 65 (2) : 1585 - 1594.
[7] 叶卫东, 张金盛. 运用层次分析法对计算机健康状态评估[J].微计算机信息(测控自动化), 2009, 25 (7) : 216 - 217 + 237.
[8] 赵文清, 朱永利, 姜波, 等. 基于贝叶斯网络的电力变压器状态评估[J]. 高压电技术, 2008, 34 (5) : 1032 - 1039.
[9] 周立新, 丁志宏, 宋彦智, 等. 一种基于模糊综合评判的测控设备状态评估方法[J]. 测控技术, 2018, 37 : 394 - 398.
[10] 李鑫, 刘莹莹, 李赣华, 等. 基于模糊变权原理的卫星健康评估方法[J]. 系统工程与电子技术, 2014, 36 (3) : 476 - 480.
[11] Hu Y, Shi P, Li H. Health condition assessment of base - Plate solder for multi - Chip IGBT module in winIEEE Access, 2019, (7) : 72134 - 72142.
[12] 和麟, 雷偲凡, 刘洋. 基于距离度量和健康指数的电子设备健康评估方法[J]. 计算机测量与控制, 2017, (10) : 294 - 297.
[13] 沈亲沐. 振动环境中电连接器间歇故障机理与在线诊断技术研究[D]. 长沙: 国防科技大学, 2016.
[14] 李俨, 陈海, 张清江, 等. 无人机系统健康状态评估方法研究[J]. 系统工程与电子技术, 2011, 33 : 562 - 567.
[15] Shuai Z, Viliam M, Shaowei C, et al. Health evaluation method for degrading systems subject to dependent competing risks[J]. Journal of Systems Engineering and Electronics, 2018, 29 (2) : 436 - 444.
[16] 潘天红, 薛振框, 李少远. 基于减法聚类的多模型在线辨识算法[J]. 自动化学报, 2009, 35 (2) : 220 - 224.
摘自《自动化博览》2026年5月刊






案例频道