产品详情:基于内嵌物理约束神经网络模型的航空发动机数字工程模型
来源:乐鱼体育平台 发布时间:2025-01-07 09:01:47
基于数字化模型的航空发动机故障诊断与健康管理系统是航空发动机数字化智能化的重要应用,用于航空发动机状态监测和性能预估的数字化模型是健康管理系统的核心之一。本文给出了一种融合航空发动机领域知识与神经网络模型的策略,构建了内嵌物理约束的神经网络架构,基于该架构建立了用于航空发动机推力预估的数字模型。此外,给出了一种特征筛选方式,并利用不一样数据集对模型进行了验证。计算根据结果得出:数字模型推力预估的平均相对误差和峰值相对误差均小于常规神经网络模型。在一定的模型规模下,基于架构的数字模型的峰值相对误差仅为常规神经网络模型的1/4。通过物理约束,克服了数据驱动模型对大数据的依赖,指导了神经网络层的超参数设置。
目前,国际航空发动机主要制造商通过数字化、智能化技术方法优化了业务流程,实现了航空发动机由设计、制造到维护维修管理的高效规范运行。其中,航空发动机故障诊断与健康管理系统(Prognostics and Health Management,PHM)是实现航空发动机数字化智能化的重要一环,是用于保障航空发动机安全可靠运行的重要手段。PHM系统中一个主要的功能是实时评估航空发动机的健康状态,并以此信息优化对航空发动机的性能控制。而实时评估航空发动机健康状态的一种方法是状态监测,即利用采集的可测量参数如压力、温度、转速等数据,通过性能参数预估模型等方式获取航空发动机的健康状态信息。此外,控制发动机推力是发动机控制管理系统的本质目的。然而,由于机载条件的限制难以在空中直接测量发动机的推力,当前技术下主要是经过测量部分可测参数来间接计算发动机的性能,推力等性能参数并不直接反馈在控制闭环中。这种间接控制发动机推力的方式,为了补偿外因所导致的推力误差,限制了发动机性能潜力的发挥。在航空发动机数字智能化的框架下,模型基发动机操控方法是解决途径之一。模型基控制是指在发动机控制管理系统中嵌入性能参数预估模型,利用传感器数据信息通过模型映射出发动机推力等性能参数,并直接将预估的性能参数用在控制回路中,以此实现对发动机推力等性能参数的直接控制。综上可知,实现发动机性能参数预估是航空发动机数字化智能化的重要前提。
基于模型和滤波器的方法是实现状态监测和性能参数预估的有效方法之一。早在1989年,Luppold等将机载模型与卡尔曼滤波器结合提出了机载自适应模型STORM,并在后续与NASA合作后引入神经网络算法进行误差补偿,升级为e-STORM。由于航空发动机的工作环境多变,基于常规卡尔曼滤波技术建立的实时模型只能在小工作包线范围内使用。为实现技术在全包线范围内的适用,研究者改进了常规卡尔曼滤波器,提出了扩展卡尔曼滤波器方法,此类方法离线获取分段线性化的发动机状态变量模型及相应的卡尔曼滤波增益,而后进行在线的分段插值。后续有研究学者提出了基于非线性模型的常值增益扩展卡尔曼滤波方法,以代替线性模型。然而,基于模型的方法常常要进行假设条件,并且由于建模及数据处理所带来的误差,使得预测不够精确。
随着人工智能算法的不断发展,不依赖于数学模型的基于数据驱动的方法在性能参数预估上取得了不错的精度。Luan等通过整合过程神经元和循环神经网络,给出了监测航空发动机状态的混合模型。马敏等采用多尺度卷积神经网络、长短期记忆网络以及BP神经网络进行数据特征提取,实现了对航空发动机滑油监测数据的分析。此外,支持向量回归机、径向基网络在航空发动机推力估计和故障检测中表现出色。遗传算法(Genetic Algorithm,GA)、神经网络(Artificial Neural Network,ANN以及极限学习机(Extreme Learning Machine,ELM)也在航空发动机参数预估上取得了很好的效果。然而,基于数据驱动的方法没有统一的构建方式,且模型需要手动配置超参数,极大降低了模型构建的效率。此外,在没有物理约束的情况下仅依赖数据的数据驱动方法可能会产生超出人为认知范畴的结果。
为了解决基于数据驱动方法中物理含义缺失以及模型架构的设置问题,研究者提出了内嵌物理的机器学习方法。内嵌物理的机器学习方法一般分为三种,即观察偏倚、归纳偏倚和学习偏倚。观察偏倚是通过反映潜在的附加数据来引入物理约束。例如,图像的数据增强通过旋转、缩放、翻转和移动来获取反映物理一致性的新数据。然而,对于航空发动机测试数据而言,其获取代价昂贵,难以通过添加额外数据的方式来引入物理约束。归纳偏倚是通过整合领域知识的数学公式来定制干预模型架构,使其隐含满足物理约束。而学习偏倚则是通过干预数据驱动模型的训练阶段来引入物理约束。
然而,由于归纳偏倚和学习偏倚的实施与数学物理方法相关,对航空发动机参数预估而言,在短期内找到精准描述发动机各部件系统耦合的方程存在一定难度。
综上所述,讨论了基于模型和基于数据驱动的方法在参数预估上的效果。由于航空发动机飞行测量参数少、部件/系统耦合复杂等因素,基于模型的方法需要做出精度的让步,传统基于数据驱动的方法缺失物理含义而过于依赖数据。一种解决的策略是以模型应用领域的物理知识作为先验条件,对数据驱动方法进行约束。在众多数据驱动方法中,神经网络由于结构灵活、搭建简易、可塑性强,且具有强大的非线性映射能力,而受到广泛关注。基于此,本文给出一种将航空发动机领域知识嵌入神经网络的方式,形成内嵌物理约束的神经网络架构。并且,介绍一种参数选取方式,基于架构形成模型用于航空发动机性能参数的预估。通过引入物理约束,降低神经网络模型对数据的依赖程度,减少了数据处理、超参数设置所带来的额外时间成本消耗。通过对比常规数据驱动模型与给定架构模型的性能参数预估,验证架构的有效性。
一般地,传统的神经网络架构是通过纵向地堆叠神经网络层形成的,因此需要确定神经网络架构中的层数,各神经网络层的连接方式(诸如短路连接、并行等),以及各神经网络层的神经网络类型。常用的神经网络层有全连接层(Fully Connected layers,FC),循环神经网络层(Recurrent Neural Networks,RNN),和卷积神经网络层(Convolutional Neural Networks,CNN),而每一种神经网络层都有各自需要设置的超参数,因此针对具体应用而设计神经网络架构有必要进行多次试验优化获得,没有确定的形式。此外,对于循环神经网络这种时序网络而言,输入特征的顺序也影响着网络架构的搭建。相较而言,内嵌物理约束的神经网络架构虽然本质依旧为数据驱动,但是通过引入物理约束对网络架构进行干预和定制,以先验知识的方式指导网络架构中网络层数、连接方式、特征顺序的确定,减少了架构设计的试验次数。
航空发动机是基于空气动力学的热力机械,不同的部件以空气为工作介质反复进行着压缩、加热、膨胀和放热过程,但所有的部件和系统相互制约,在共同工作方程决定的状态下工作。另一方面,神经网络模型强大的非线性逼近能力,是通过堆叠多层神经网络层以增加神经网络节点而赋予的。网络模型中的各个神经网络层在学习特定特征的同时,又被损失函数反馈的误差来协调各神经网络层之间的状态。因此,通过以航空发动机工作过程中部件/系统之间的耦合关系作为航空发动机领域物理知识,结合神经网络层节点间的连接关系,形成内嵌物理约束的神经网络架构。整个架构由建模对象的物理内涵、数据驱动的训练方式和智能算法组成。
形成架构的第一步是,依据物理信息划分神经网络模型架构的层次结构。根据航空发动机运行结构,神经网络模型架构被分为三层:物理信息输入层、状态耦合层、参数映射层,其架构结构如图1所示。物理信息输入层对应于航空发动机的部件和系统,用于学习发动机部件和系统的特性。耦合层作为特征提取的中间层,与物理信息输入层存在单向链接关系。航空发动机部件、系统间的共同工作体现在耦合层上,它对物理信息输入层的学习状态进行了干预。架构的顶层是参数映射层,它建立了耦合层的抽象特征与航空发动机参数之间的关系。
构造架构的下一步是根据航空发动机结构来定制物理信息输入层。神经网络层的训练节点存储着关键信息,但纯粹由数据驱动训练而来的信息是不加限制、无物理意义的。因此通过对输入层的特征、输入结构进行物理信息的干预,赋予训练节点物理涵义从而定制神经网络层。以航空发动机试车试验结构为参考,将航空发动机整机拆分成主流路各主要部件、滑油系统、空气系统、附件系统等,并以此将航空发动机地面试车/机载测量的参数按上述划分进行归纳,物理信息输入层以测量参数来表示特定的部件和系统。因此,首先对从地面试车、高空试车和飞行试验中收集的所有航空发动机参数特征进行聚类,每个聚类分类代表航空发动机的部件或系统。而后根据建立模型的目标参数,过滤每个分类中的冗余聚类参数。通过此步,能直接筛选出神经网络模型的输入特征,不再需要进行额外的特征选择。至此,限定了物理信息输入层的输入特征需要满足的两个条件,一是规定为可测量参数/传感器参数,可测量参数体现了发动机的实时运行状态并作为数字模型与物理实体的交互通道;二是特征基于航空发动机结构进行了分类,能够快速地从聚类参数中选取代表部件/系统特性的参数,从而过滤掉冗余特征,减少计算工作量。
定制物理信息层的下一步是对上述的聚类参数进行组合,将具有并行结构的单层神经网络与航空发动机结构相融合。由于部件和系统的作用具有同等地位,因此接收数据的网络层子结构是并行的。此层中,所有并行子结构与部件/系统特征参数一一对应,划分为部件组和系统组。部件组参照航空发动机主流流经部件的次序进行排列,形成该网络层的主干结构。发动机系统对应的子结构以系统与主流部件的关联关系为参照插入至主干结构中。该层中的并行子结构接收了依照特定排列顺序的参数,记录和学习参数对应的部件/系统特性,因此称该层为“物理信息输入层”,位于模型架构的底层。
航空发动机试车试验测量参数与飞行测量参数存在异同,性能参数推力是发动机控制中的首要目标,然而飞行中无法直接测量推力,转而控制与推力相关的测量参数,如转速。但航空发动机制造、安装公差,以及使用所产生的性能退化都影响了推力与测量参数的关系。故此,针对性能参数预估需要对特征进行选取过滤,保证以下两点要求:
(1)输入特征为试车试验和实际飞行中均被测量的参数,而目标特征仅为试车试验测量参数。
(2)输入特征之间包含了发动机性能衰退信息,且输入特征与目标特征隐含的物理关系不受发动机性能衰退影响。
特征在聚类的基础上,被分为环境参数、外界输入参数、试车试验和飞行均测量参数,以及试车试验测量但飞行无法测量参数,如图2所示。其中的测量参数均指发动机性能参数。环境参数和外界输入参数作为“外界”参数,仅是驱动航空发动机运行的条件,与发动机性能并不存在直接关系。发动机部件性能衰退的影响会表征在被测的性能参数中,在特定运行条件下性能参数的数值表征了当前发动机的性能衰退状态,因此“外界”参数和部件性能参数之间的关系包含了性能衰退的信息。而发动机性能参数之间的映射关系表征的是发动机部件的热力学关系,此隐含的物理关系不受发动机性能衰退的影响。
因此,图2左侧框图参数之间的关系受发动机性能衰退的影响,而左侧框图与右侧框图参数之间的关系则不受影响。通过此分类,过滤到聚类的参数,以左侧框图参数作为模型的输入特征,而右侧参数作为模型的目标特征。
基于架构创建具体的计算模型,需要确定神经网络层的类型,在此对各神经网络层的特征输入结构进行简要介绍。图3给出时序数据以及各常用神经网络层输入特征结构。全连接神经网络层的输入特征如图3(b)所示,输入向量的维度为输入特征的个数;一维卷积神经网络层与循环神经网络层的输入均为矩阵,不同的是,循环神经网络层的特征矩阵并非一次性输入,而是按顺序依次输入维度为特征个数的向量,其中的序列长度(Sequencelength)为超参数,与循环神经网络层的循环结构体迭代次数一致。
模型通过确定架构各层神经网络层的具体网络结构建立。物理信息输入层使用双向的长短期记忆循环神经网络(Bidirectionallongshort-termneuralnetwork,Bi-LSTM)。展开的LSTM神经网络是一种并行结构,与物理信息输入层的结构相匹配。与单向的LSTM神经网络相比,Bi-LSTM神经网络不仅加强了输入特征之间的交互,消除了表征同一部件的不同测量参数次序所带来的影响,而且其更适用于描述发动机主流路结构。耦合层的神经网络与物理信息输入层一致,一方面加强了序列中参数的相关性,另一方面受约束于接收物理信息输入层的输出维度。映射层则使用全连接层,用于映射耦合输出与目标特征之间的关系。
LSTM神经网络是一种RNN,用于学习隐藏在序列中的信息,其中循环结构体的迭代次数决定了单次训练输入的信息量。输入特征的个数与神经网络节点数紧密联系,冗余特征的加入会增加模型的复杂度从而增加模型的训练时间,忽略关键特征可能会导致模型精度下降。此外,循环结构体迭代次数的确定是利用LSTM神经网络建立模型的重要一步。内嵌物理约束后,架构中的神经网络超参数以及输入特征均会被确定。
在内嵌物理约束的架构中,LSTM神经网络的序列数由部件/系统的参数量决定,并且由原先时间序列顺序演变成了空间序列次序。由于含义上的变化,输入特征的维度也被固定。一般特征维度由数据特征数确定,此处表示为单个部件/系统的特征数。通常情况下,输入特征的顺序需依据一系列的验算来确立,而本架构中的输入特征顺序直接由航空发动机类型确定。针对物理信息输入层,输入特征的维度不同于常规LSTM神经网络的输入类型,架构中的LSTM神经网络单元数由聚类参数的数目决定,序列长度等于部件参数、系统参数数目之和,特征维度固定为1,参数输入的示意图如图4所示。适用于物理信息输入层的LSTM输入输出特征具体见式(1),(2),即
数据集来源于混排涡扇发动机的地面试车(H=0.0m,Ma=0.0)性能模拟,该发动机性能仿线。该仿真模型是一种基于部件的航空发动机零维仿真模型,并进行设计点、非设计点性能仿线],此处不再赘述。
将性能仿真的样本点分为训练集、测试集和验证集。其中训练集与验证集的样本点一共10001,其中80%的样本数据作为训练集用于模型训练,剩余20%的数据量作为验证集以对训练过程的模型进行性能评估,测试集包含两部分:测试集1仿真使用的部件特性图与生成训练集数据的相同,样本点约为训练集的三倍;测试集2使用的部件特性图相较于训练集所设置的进行了衰变系数处理,样本点约为训练集的三倍。各数据集的推力趋势见图6。由于特征参数之间的量级差距较大,需要对数据进行归一化,以避免神经网络模型训练过程中损失函数被大量级的输入特征主导而忽视其他参数特征的学习。
为了验证内嵌物理约束的神经网络架构的有效性,通过模型对航空发动机推力的预估来进行试验验证。模型建立的主要流程如下:划分数据集并进行数据处理,设置模型、数据及训练过程的超参数,根据应用问题选择合适的损失函数和优化器对模型进行训练,对模型性能进行评估。本文模型训练的损失函数选用均方误差(MeanSquareError),即
本文基于常见的神经网络层进行对比模型的搭建,并通过对比分析来验证物理信息对于网络架构约束的有效性。选取的神经网络层包括全连接神经网络层、一维卷积神经网络层以及长短期记忆神经网络层。本文给出的网络架构限定为三层神经网络层,因此在构造对比模型时,主要以三层神经网络为主。结合混排涡扇发动机对象以及选定的输入特征,在内嵌物理约束的网络架构下,数据的传输顺序按照气流流经发动机主流路部件顺序进行,物理信息输入层处理不同时刻的输入特征根据发动机物理结构决定,具体见图7中内嵌物理架构与常规架构的对比。有别于其他传统基于数据驱动的模型,神经网络结构中隐藏单元的数量影响模型精度,难以与其他模型方法形成统一的对比标准,因此用常规架构搭建的模型作为对照。
隐藏单元的数量代表着神经网络架构的学习容量,为了突出物理信息对于网络架构中隐藏单元的连接形式的约束,需要确定所有网络架构模型的隐藏单元数量的对比范围。考虑到全连接的隐藏单元是最为基础的连接方式,因此以三层全连接神经网络层构建的基准模型进行隐藏单元数量试验计算,模型中全连接神经网络层后接ReLU激活函数,其计算时间和模型精度作为选取其他模型合适隐藏单元数量的参考。为保证基准模型的精度,本文以算例的训练集样本总量的倍数作为参考,设置基准模型中各个神经网络层的隐藏单元数量,并在神经网络层之间添加Dropout层来防止过拟合。此外,在基准模型计算确定隐藏单元数量范围后,设置各类常用神经网络模型和架构模型的隐藏单元数量,模型参数设置见表3。表中的模型命名以架构和网络节点为参考,AN表示模型以全连接层为主导,PI是本文架构构成的模型,CN和LN分别则是以常规卷积网络和长短期记忆网络构造的模型。S,M,L表示为模型节点规模依次由小到大。
对比模型的构建采用层级叠加的形式,所有模型输出层结构一致,网络层之间均设置丢弃率为0.3的Dropout层,因此就需要设置第一层与第二层的网络类型和隐藏单元数量。表3中,网络结构的数值表示对应网络层的隐藏单元数量,循环神经网络的序列长度SL(9)与输入特征数量保持一致,类型均为双向长短期记忆网络(表中标记为BiL),K(3)表示卷积核的大小为3;PI-X模型与PI-L模型设置一致,但修改了输入特征的输入顺序,Order表示不再按照物理结构而是随机排列输入特征;AN-F模型则为四层神经网络叠加构建。由于基于梯度下降的数据训练过程具有随机性,为了降低该随机性对测试结果的影响,所有模型均独立运算5次后进行性能评估。
模型在不同测试集上的计算结果见表4。表中,模型名字的下标表示测试集编号,对每个模型独立运算5次的结果进行统计作为性能评估,最大值、最小值、平均值均保留到小数点后三位,标准差保留小数点后四位小数。图8和图9分别展示了不同模型在两个测试集下对归一化推力的预估结果。图10为不同隐藏单元数的基准模型与内嵌物理约束的神经网络模型在测试集1的相对误差平均统计结果。图11为在选定隐藏单元数范围下,不同神经网络类型构建模型在测试集2的相对误差平均统计结果。图12展示了各神经网络类型构建模型以及内嵌物理约束的神经网络模型在测试集2的箱型图。后续为了方便表达,内嵌物理约束的神经网络模型简称为架构模型,基于常规神经网络架构的模型,即传统基于数据驱动的模型则简称为常规模型。
结合表4与图10可以看出,常规模型在测试集1上的性能表现远不及架构模型,虽然保持着较低的平均相对误差,但峰值误差近乎于架构模型的三倍。此外,隐藏单元数量的增加虽然对常规模型的平均峰值误差起到了一定的积极作用,但抬高了模型误差统计的最小值。而架构模型在测试集1表现优异,且隐藏单元的数量基本不影响模型的性能。通过表4的结果,增加隐藏单元的数量能降低模型的峰值相对误差,因此后续模型的隐藏单元总数范围在15000至20000上下浮动。考虑到产生测试集1与训练集的部件特性图一致,模型仅依赖训练数据也能得到良好的结果。然而,航空发动机数据获取与处理存在时间差异,因此模型训练数据与航空发动机运行数据存在衰退所造成的差异,且以衰退数据作为测试结果更能反映模型在健康管理系统中的作用。
结合表4与图11可以看出,对比传统基于数据驱动的模型,架构模型在测试集2上性能表现同样优异。测试集2与训练集数据存在的差异,常规模型的预测误差均显著上升,模型的平均相对误差超过了5%,平均峰值误差升至15%。架构模型中的物理约束能在一定程度上减缓模型对于数据的依赖,模型的平均相对误差和峰值误差基本控制在5%以内。常规模型中预测效果表现最接近架构模型的是LN模型。LN模型与构造架构模型的神经网络类型一致,均为双向长短期记忆网络层。同网络类型下,模型的训练和预测时间接近,但架构模型在统计下的平均相对误差和峰值相对误差均小于LN模型。此外,由图12(a)可以看出,架构模型相较于LN模型更稳定,虽然在训练过程中出现过较大的峰值相对误差,但双向长短期记忆网络模型的平均峰值相对误差几乎是架构模型的1.7倍。
图12(b)显示了不同隐藏单元总数的架构模型在测试集2上的表现,可以看出隐藏节点数越大,模型的预估误差越小,且模型越趋于稳定,在物理约束作用下,模型的精度提升还是需要依靠一定的隐藏单元总数,符合数据驱动模型的本质。再有,改变输入特征顺序(不以航空发动机结构顺序进行排列)后,架构模型的精度下降,对比双向长短期记忆网络模型,输入特征顺序对模型精度影响更大,这是由于架构模型中物理信息输入层的结构所导致的。
此外,表5给出了模型在不同包线训练数据下的模型性能结果。不同高度、马赫数直接影响着发动机的进口温度、进口压力,上述参数也作为了架构模型所选取的输入特征,因此在不改变模型架构的前提下可以处理不同包线中所验证的模型的设置与表3相同,而模型名称的下标依次表示验证模型性能的测试数据集的马赫数和高度(km),表头则给出了训练模型的数据集的马赫数和高度(km)。图13给出了不同仿真计算点下模型的一部分区间预测趋势。结合表5和图13可以看出,在神经网络节点总数接近的情况下,架构模型的预测结果能够基本跟踪推力数据点,而传统神经网络模型则在细节上难以获得满意的结果,从而导致其最大相对误差偏大。需要说明的是,模型的训练数据集与测试数据集的性能计算点差异过大,即数据特征的最值区间数值相差较大,则会导致模型的预测精度下降,例如基于高度5km马赫数为0.5的数据训练的PI-M模型,在测试数据的工况为高度5km,马赫数0.5的情况下,模型预测的平均相对误差仅为0.921%;而在测试数据的工况为高度10km,马赫数0.75的情况下,模型预测的平均相对误差超过了20%。这是由于为了处理特征间数值量级差异较大的问题,训练数据来进行了归一化处理而导致的。因此在实际模型部署的情况下需要训练多个模型,或是寻求将多工况模型统一的方法,这也是后续需要开展的工作之一。
(1)内嵌物理约束的神经网络架构能够指导神经网络模型的构建,物理约束作为先验知识,限制了神经网络模型中超参数的设置,并对特征进行了筛选和排序,减少了特征处理工作。无论在部件衰变的测试数据,还是在与训练数据同部件状态的测试数据,内嵌物理约束的神经网络模型在性能参数预估上误差波动小。
(2)内嵌物理约束的神经网络模型在航空发动机性能参数预估上表现良好,且隐藏节点总数对于模型性能影响较小。相较于传统神经网络模型,架构模型中的物理约束能降低模型结果的峰值相对误差。与基于全连接神经网络构建的模型相比,在隐藏单元数接近的情况下,架构模型的峰值相对误差仅为全连接模型的1/4。
(3)内嵌物理约束的神经网络模型性能表现更稳定,其平均相对误差小于用同神经网络类型构造的模型以及不按物理结构顺序输入的架构模型。其代价是增加了模型的复杂度而使模型训练时间变长。
本文开展了基于内嵌物理约束的神经网络模型对于航空发动机性能参数预估的研究,后续还将针对试验数据来进行模型构建和测试,加强完善模型的架构,并以此分析航空发动机系统与部件间的耦合作用。