摘要:拖拉机发动机是保证拖拉机正常运行的关键部件,目前主要采用振动信号开展发动机故障预测与状况识别。为此,提出了一种基于GRU的循环神经网络模型,通过对拖拉机发动机在不同作业条件下产生的音频信号进行分析,提取Mel作为主要特征,构建基于音频特征的拖拉机发动机状况识别系统。预测结果表明:系统能够准确地识别发动机的正常运行状态和不同类型的故障状况,对拖拉机发动机异常的识别率可以达到97.15%。研究结果可以提高拖拉机的运行安全性和可靠性,减少故障停机时间,提高农业生产效率。
加入收藏
拖拉机作为农业生产中重要的机械设备之一,其发动机的正常运行对农田作业的效率和质量至关重要。为了确保拖拉机发动机的可靠性和提前发现潜在的故障,许多研究致力于发动机故障预测与状况识别的方法和技术。
目前,主要采用振动信号进行故障预测和识别,相关研究进展主要包括特征提取和选择、分类算法、故障类别识别、多传感器数据融合等方面。
1)特征提取和选择:
通过分析拖拉机发动机振动信号,提取出与不同故障类型相关的特征。常用的特征包括频域特征(如功率谱密度、频谱峰值等)[1-2]和时域特征(如均方根值、峭度、波形因子等)[3-5]。同时,针对大量的特征还进行了特征选择,以提高分类器的效果和计算效率。
2)分类算法:
机器学习算法在拖拉机发动机故障预测和识别中得到了广泛应用。常见的算法包括支持向量机(SVM)、随机森林(Random Forest)、人工神经网络(ANN)和卷积神经网络(CNN)等[6-8]。这些算法能够学习振动信号中的模式,并准确地将不同的故障类型分类。
3)故障类型识别:
将振动信号与特定的故障类型关联起来,如识别发动机的轴承故障、气缸故障、曲轴故障等。通过建立针对不同故障类型的分类模型,可以实现准确的故障诊断和预测。
4)多传感器数据融合:
一些研究考虑将多个传感器的数据进行融合,如振动传感器、温度传感器和压力传感器等。通过融合多个传感器的信息,可以提高故障预测和识别的准确性、鲁棒性[9-10]。
以上方法存在一些限制,如传感器的安装和信号采集的复杂性,且由于拖拉机在开展不同的田间作业时会产生不同的音频信号,因此本文提出一种基于音频信号的拖拉机发动机状况识别模型,提取拖拉机不同的音频信号Mel倒谱系数作为主要特征,再通过试验进行模型验证。
1、拖拉机发动机音频信号产生机理
1.1 发动机内部音频信号产生机理
拖拉机在不同田间作业运行时产生的音频信号可以被视为车辆的噪声信号。这些信号由多个声源组成,在传播途径的角度上车内噪声信号可分为空气噪声和结构噪声[11-12]。
1)空气噪声主要源于发动机的排气、进气和排放系统,以及车辆与空气相互作用产生的气流声。这些噪声源会产生不同频率和振幅的声波,并通过车辆的外部空气传播。
2)结构噪声则是由车辆各部件的振动和共振引起的(如发动机、底盘、传动系统等),这些振动会导致车身、底盘和车厢的共振,进而产生声音。
在拖拉机行驶过程中,音频信号会受到路面激励、空气阻力和其他因素的影响,与非行驶状态下的拖拉机产生的音频信号存在明显区别。路面激励是指车辆轮胎与路面的接触所产生的振动和噪声[13]。行驶过程中,轮胎在不平坦路面上产生颠簸和摩擦,导致振动传递到车辆结构并产生噪声。这些振动和噪声会在音频信号中表现出来,与非行驶状态下的拖拉机产生的音频信号有明显差异。其次,空气阻力也会对音频信号产生影响。当拖拉机行驶时,空气流经车辆表面和空气开口(如进气口、排气管等)时会产生涡流和湍流,从而产生空气噪声。这些噪声会混入音频信号中,且与非行驶状态下的拖拉机产生的音频信号有所不同。
此外,还需考虑轮胎噪声和风噪对音频信号的影响。轮胎在行驶过程中会产生与路面摩擦相关的噪声,而风噪则是由行驶中的空气流动引起的噪声。这些噪声会叠加在音频信号中,使行驶状态下的拖拉机音频信号与非行驶状态下的有明显差异。
1.2 发动机外部音频信号分析
在拖拉机进行田间作业时,其运动特点通常包括加速度较小、瞬时速率较低等特征。同时,田间环境通常较为宽阔,背景噪声可以忽略不计。当拖拉机处于怠速状态时,音频信号相对较为稳定。此时,拖拉机发动机的噪声是主要的音频噪声成分,而轮胎噪声和风噪声相对较弱。
然而,一旦拖拉机进入工作状态并开始运行,随着运行速度的增加,拖拉机轮胎噪声和风噪声逐渐增强。这是由拖拉机在运行过程中轮胎与地面之间的摩擦和空气流动引起的,尽管这些噪声逐渐增强,但拖拉机发动机的噪声仍然是主要的音频噪声成分[14-15]。
因此,在进行拖拉机发动机状况识别时,需要重点关注和提取拖拉机发动机的音频信号特征,以准确判断发动机的运行状态和故障情况。同时,考虑到轮胎噪声和风噪声的逐渐增强,应对这些噪声的干扰进行适当的消除或降低,以提高状况识别的准确性和可靠性。
2、信号采集
2.1 端点检测
端点检测(VAD,Voice Activity Detection)是一种用于确定音频信号起始点和终止点的技术,目的是准确检测出音频中的有声段和无声段[16]。在音频信号中,有声段表示包含语音信息的部分,而无声段表示没有语音信息的部分(如静音或噪声)。进行端点检测时,可以将音频信号划分为连续的有声段和无声段,以便在语音处理和语音识别等应用中更精确地处理语音内容。
拖拉机发动机音频信号的端点检测是确定音频信号中发动机活动的起始点和终止点的过程。由于拖拉机发动机音频信号通常包含发动机工作和非工作状态的部分,端点检测可以准确地提取出发动机工作的有声段,并剔除非工作状态的无声段。在进行端点检测时,本文采用基于阈值的算法。该算法基于设置的阈值来判断音频信号的能量、过零率等特征,以确定音频信号中发动机活动的起始点和终止点。一般来说,发动机工作状态下的音频信号具有较高的能量和较高的过零率,而非工作状态下的音频信号则具有较低的能量和较低的过零率[17]。
端点检测技术的算法可以分为3类,如表1所示。这些算法在端点检测中起到不同的作用和应用,根据具体需求和音频环境的特点选择适合的算法,可以提高端点检测的准确性和可靠性。
表1 端点检测技术算法类型及特点
基于模型的VAD算法建立统计模型(如HMM、LSTM、GRU)描述有声段和无声段之间的转换。
由于采集设备资源有限,而采用基于阈值的算法可以减少计算和存储的需求,提高实时性和效率。同时,对于拖拉机发动机音频信号,其特点在运行状态下有明显的能量变化,可以设置适当的阈值来区分有声段和无声段。
2.1.1 短时平均过零率
拖拉机发动机音频信号的短时平均过零率是一种用于分析音频信号特征的指标,用来描述音频信号的频率变化情况,是指在一段时间内音频信号过零点的平均数量。过零点是指信号从正向到负向或从负向到正向的过渡点,也可以理解为信号从正值变为负值或从负值变为正值的点。
拖拉机发动机音频信号的短时平均过零率可以用于识别发动机的活动状态和频率特征。例如,在发动机运行时,短时平均过零率可能较高,是因为发动机活动会产生频率较高的振动;而在发动机非工作状态下短时平均过零率可能较低,是因为信号频率变化较小。通过对拖拉机发动机音频信号进行短时平均过零率的计算和分析,可以提取出音频信号的频率特征[18],为拖拉机发动机状况识别和故障预测提供有用的信息。拖拉机发动机信号x(t)的短时过零率定义为
其中,Z为拖拉机发动机信号过零率;ω(t)为窗函数;sgn(·)为符号函数;t1为窗函数起始采样点;t2为窗函数结束采样点。
通过加入门限的短时过零率计算,可以有效地排除噪声的影响,有助于更准确地分析拖拉机发动机音频信号的频率特征,为发动机状况识别和故障预测提供更可靠的数据和指标。
2.1.2 短时能量和短时平均幅值
在拖拉机发动机音频信号的分析中,短时能量和短时平均幅值可以用于描述音频信号的振幅变化情况。例如,在发动机运行时,由于振动较大,音频信号的短时能量和短时平均幅值可能较高;而在发动机非工作状态下振动较小,短时能量和短时平均幅值可能较低。通过对拖拉机发动机音频信号进行短时能量和短时平均幅值的计算和分析,可以提取出音频信号的振幅特征,为拖拉机发动机状况识别和故障预测提供有用的信息。
拖拉机发动机音频信号x(t)的短时能量定义式为
拖拉机发动机信号x(t)的短时平均幅值定义式为
短时平均幅值和短时能量都可以反映音频信号的强度,但它们在计算方式和特性上有所不同。短时平均幅值是音频信号在一段时间内振幅绝对值的平均值,计算的是振幅的平均大小,可以反映信号的整体强度水平;短时能量是音频信号在一段时间内的振幅平方的累加和,计算的是振幅的能量,可以反映信号的能量聚集程度和瞬时变化情况。
短时平均幅值和短时能量对比图如图1所示。短时平均幅值可以通过计算每个时间窗口内振幅的平均值得到,在图1中它可以表示为一个随时间变化的曲线,反映了信号的整体强度水平;短时能量可以通过计算每个时间窗口内振幅平方的累加和得到,在图1中它可以表示为一个随时间变化的曲线,反映了信号的能量聚集情况和瞬时变化。通过观察短时平均幅值和短时能量的图形对比,可以更全面地了解音频信号的强度特征,进而帮助分析拖拉机发动机音频信号的状况和故障预测。
图1 短时平均幅值和短时能量对比图
2.2 拖拉机发动机音频信号采集
本研究使用快速傅里叶变换对拖拉机怠速条件和运输条件下的音频信号进行频谱分析,并通过图2展示了频谱分布的结果。
图2 拖拉机怠速及运行条件下发动机音频信号采集示意图
其中,横轴表示频率,纵轴表示幅值,用于表示该频率下信号的强度或能量。当拖拉机处于不同的作业状态或运行速度时,频谱分布的峰值位置和幅值大小可能会发生变化。图2的频谱分布结果提供了对拖拉机音频信号的频率特征的视觉化呈现,有助于进一步分析和理解拖拉机在不同工况下的音频信号特征。
3、拖拉机发动机信号特征提取
本文中,由于采样频率为2 048 Hz, 每秒包含2 048个数据样本,如直接将这些数据样本作为模型的输入,会导致输入层的维度过大,增加模型的复杂性和计算成本。为了解决这个问题,需要对音频信号进行特征表示,将原始音频信号用较小尺寸的向量表示。常用的音频信号特征表示方法包括:
1)短时傅里叶变换(Short-Time Fourier Transform, STFT)。将音频信号分成小的时间窗口,在每个窗口内进行傅里叶变换,得到频谱表示。
2)梅尔频谱系数(Mel-frequency Cepstral Coefficients, MFCC)。通过对音频信号进行STFT,并应用梅尔滤波器组对频谱进行变换,得到表示音频在人耳感知中的重要频率成分的系数。
3)短时幅度包络(Short-Time Amplitude Envelope)。将音频信号分成小的时间窗口,计算每个窗口内信号的幅度,得到幅度包络曲线。
4)过零率(Zero Crossing Rate)。计算音频信号在每个窗口内穿越零点的次数。
本研究使用MFCC对拖拉机发动机音频信号进行提取,MFCC通过这些步骤将音频信号转换为一组具有较低维度的倒谱系数,工作原理如图3所示。
图3 MFCC提取示意图
这些系数在语音识别和音频分类等任务中表现出较好的性能。由于MFCC考虑了人类听觉系统的特性,它能更好地捕捉音频信号中的关键特征,并对环境噪声、语速变化等具有较强的鲁棒性。
3.1 信号预处理
基于MFCC的拖拉机发动机信号预测护理涉及以下步骤:
1)音频信号采集。使用适当的音频采集设备收集拖拉机发动机的音频信号。
2)预处理。对采集到的音频信号进行预处理,包括去噪、滤波和增益等步骤,以提高信号的质量和可靠性。
3)特征提取。应用MFCC算法对预处理后的音频信号进行特征提取。MFCC将音频信号转换为一组具有较低维度的倒谱系数,以捕捉关键的频率特征。
4)特征选择。从提取的MFCC特征中选择最具代表性和相关性的特征,以减少特征维度和提高模型的效果。
5)模型训练。使用机器学习或深度学习方法构建预测模型,将MFCC特征作为输入,拖拉机发动机的状态(如正常运行或故障类型)作为输出。通过训练模型,使其能够学习音频信号和发动机状态之间的关联。
3.2 MFCC信号特征提取
Mel频率是一种以人耳感知频率为基础的非线性刻度。在较低频率范围内,人耳对频率的分辨能力较高;而在较高频率范围内,人耳对频率的分辨能力较低。Mel频率与物理频率之间的关系式为
其中,fMel为Mel频率;f为物理频率。该公式描述了频率在低频范围内的线性关系,而在高频范围内则呈现出饱和的趋势。Mel频率fMel与物理频率f的关系如图4所示。
图4 Mel频率fMel与物理频率f关系示意图
1)预处理。将音频信号切分成短时帧,并对每一帧应用窗函数进行加窗,以减少频谱泄漏。
2)进行快速傅里叶变换(FFT)。对每一帧应用FFT算法,将时域信号转换为频域信号。
3)计算功率谱。对每一帧的频谱进行平方运算,得到功率谱。
4)应用Mel滤波器组。将功率谱通过一组Mel滤波器进行滤波。这些滤波器在Mel频率刻度上均匀分布,用于模拟人耳的频率感知特性。
5)取对数。对滤波器输出的能量值取对数运算,以增强低频部分的信息,并降低高频部分的动态范围。
6)应用离散余弦变换(DCT)。对取对数后的能量谱应用DCT,将频域的信息转换为倒谱系数。
7)选择MFCC系数。从倒谱系数中选择前几个(通常是13个)作为最终的MFCC特征。MFCC计算流程如图5所示。
图5 MFCC计算流程示意图
4、基于拖拉机发动机音频信号构建GRU循环神经网络模型
4.1 GRU循环神经网络模型
GRU(Gated Recurrent Unit)是一种循环神经网络(RNN)的变种,用于处理序列数据。与传统的RNN相比,GRU具有更强的建模能力和更好的梯度流动性。GRU的结构包括重置门、更新门等,GRU通过控制重置门和更新门的开关状态实现了对长期依赖和短期依赖的建模,并且减轻了梯度消失的问题,使得模型更加有效地处理长序列数据。
1)重置门(Reset Gate):
控制前一时刻的隐藏状态在当前时刻的重置程度,决定了前一时刻的隐藏状态对当前时刻的影响。
2)更新门(Update Gate):
决定前一时刻的隐藏状态与当前时刻的输入是否进行融合,以及融合的程度。
3)候选隐藏状态:
结合重置门和前一时刻的隐藏状态,计算得到候选隐藏状态,用于捕捉输入序列的相关信息。
4)更新隐藏状态:
根据更新门和候选隐藏状态,更新当前时刻的隐藏状态。
4.2 拖拉机发动机音频信号
拖拉机发动机音频信号提取部分信息如表2所示。其中,每一行代表一个特征,每一列代表一个样本或观测值。MFCC_1、MFCC_2和MFCC_3是MFCC系数的示例,Energy表示短时能量,Zero_Cross表示短时平均过零率。这些数值可能是对音频信号进行特征提取后得到的结果,用于后续的分类和识别任务。
表2 拖拉机发动机音频信号提取部分结果示例
4.3 模型预测结果与分析
4.3.1 预测准确率
预测准确率是衡量拖拉机发动机状况识别系统性能的关键指标。通过不断优化特征、模型和数据,可以提高预测准确率,从而实现更准确和可靠的拖拉机发动机状况识别和预测。本文以传统的LSTM模型、CNN模型和MLP模型为对照试验,对不同神经网络模型下预测准确率进行对比,结果如表3所示。由表3可以看出:基于音频特征的拖拉机发动机状况识别系统取得了令人满意的准确率,相较于传统的LSTM模型,采用GRU模型能够显著提高识别准确率,达到了97.15%;此外,CNN模型也表现出良好的性能,准确率为88.32%。
表3 不同模型预测准确率结果
4.3.2 特征向量对比试验
本研究进行了特征向量对比试验,比较了不同特征向量在拖拉机发动机状况识别任务中的性能,结果如表4所示。由表4可知:MFCC特征向量展现出最高的准确率,达到了82.31%,主要是因为MFCC是基于人类听觉系统的研究成果,具有较好的鲁棒性和与人耳听觉特性的匹配性,能够更准确地描述拖拉机发动机音频信号的特征,使得识别准确率较高;其次,Spectral Contrast特征向量的准确率稍低,为76.09%,但仍能区分不同状况下的音频信号;Chroma和Tonnetz特征向量的准确率分别为79.36%和75.12%,相对于MFCC而言稍逊。综上所述,MFCC特征向量在拖拉机发动机状况识别任务中表现出最佳的准确率,这对于改进和优化拖拉机发动机状况识别系统具有重要意义。
表4 不同模型特征向量对比试验结果
5、结论
1)通过对拖拉机发动机音频信号的采集和分析,提出了一种基于GRU循环神经网络模型的识别系统,并进行了试验评估,结果表明:系统能够准确地识别拖拉机发动机的正常运行状态和不同类型的故障状况,识别率达到97.15%。
2)与传统的振动信号识别方法相比,基于音频特征的方法具有更简单、更便捷的数据采集和处理流程。此外,还进行了特征向量对比试验,发现MFCC特征向量在拖拉机发动机状况识别中具有最佳的准确率。
3)未来的研究可以进一步优化系统算法,探索更多的音频特征提取方法,并拓展到其他农业机械的故障识别领域。
参考文献:
[1]叶香美,翁正国.履带式拖拉机的电子电路故障监测系统研究[J].农机化研究,2022,44(12):247-251.
[3]钟赛君,张擎鸣,王强胜,等.小型二冲程发动机气缸磨耗对活塞表面状况的影响分析[J].小型内燃机与车辆技术,2021,50(1):39-42.
[4]袁苗达.轮式拖拉机的发动机常见故障智能监测研究[J].农机化研究,2022,44(11):248-252.
[6]王龙,王宪成.喷油器技术状况对发动机寿命影响的研究方法[J].山西电子技术,2020(5):85-86,89.
[8]韩亚娟,章露露,雷小虎.基于改进FDOD度量的航空发动机健康状况评估[J].系统工程与电子技术,2022,44(11):3579-3586.
[10]王彦昆,康丽锋.基于物联网和卷积神经网络的拖拉机轴承故障诊断[J].农机化研究,2023,45(9):245-249.
[11]韩亚娟,杨玉琪.基于组合赋权法和未确知测度模型的发动机健康状况评估[J].运筹与管理,2020,29(4):204-211.
[14]靳莹,乔新勇,顾程.坦克发动机技术状况检测与评价方法研究[J].中国测试,2016,42(9):6-10.
[15]张中新.大马力拖拉机维护保养要点与常见故障维修[J].农机使用与维修,2023(1):83-85.
[17]冒兴峰,罗鹰,姜于亮,等.基于尾气监测的教学车辆发动机运行状况动态监控系统的设计[J].时代农机,2017,44(10):119-120.
[18]赵战彪,杨帆.基于贝叶斯判别的装甲装备发动机技术状况评估[J].装甲兵工程学院学报,2015,29(4):22-26.
基金资助:山西省教育科学“十四五”规划2022年度项目(GH-221002); 山西省教育科学“十三五”规划2020年度教育政策研究专项(ZC-20049);
文章来源:余建华.基于音频特征的拖拉机发动机状况识别系统设计[J].农机化研究,2025,47(02):228-233+238.
分享:
目前业内对提高气密检测精度已经做了大量研究。宣立明等人[1]对不同产品在使用气密设备时设定不同测试参数,来提升测量精度。魏子云[2]研究了变速箱总成充气时间、检测时间对气密检测精度的影响。杨伟等人[3]针对军用电子设备特点,选用差分式气密检测替代淋雨及浸泡测试,并采用红外热成像技术分析产品的泄漏位置。
2025-08-24电池模组由电芯经串并联方式组合,作为电池系统构成中的一个小型模块。目前纯电动车用的模组为12个电芯2P6S(2并联×6串联)组装而成。其基本组成包括:控制模组(BMS板),电池复合单体,导电联接件,塑料框架,冷盘,冷却管,两端的压板以及紧固件。
2025-07-20汽车产业链上的生产方和销售方都要寻找更加高效的、可以调整的销售渠道以适应这种变化的消费需求,这种渠道的整合与集成管理成为必然选择,传统渠道中各个企业单元之间的信息“孤岛”效应将被打破,结合信息化手段的解决方案将获得最大的资源整合优化效果。
2025-06-29若电池寿命问题得不到妥善解决,将导致两个严重问题:一是用户担忧电池损耗而回避使用超快充电桩,造成设施利用率低下;二是电池过早报废推高全生命周期成本,削弱电动车辆的经济性优势。因此,揭示超快充电对电池寿命的影响机制,并提出针对性优化策略,具有重大的经济价值和现实意义。
2025-05-18车载充电机作为新能源汽车不可或缺的核心部件,集充电机与直流变换器功能于一体。一方面,它将电网输入的交流电转换为适配车辆电池包的电压,实现对电池的充电;另一方面,在车辆高压上电成功后,充当低压电源,把动力电池的高压直流电转换为低压直流电,为低压器件供电并为车载蓄电池充电。
2025-05-18碳达峰、碳中和目标的提出,为汽车行业的发展带来了新的考验。汽车排放标准的不断提高,促使汽车行业加速变革,传统模式已不能满足要求。在此背景下,汽车向混动化、纯电化的发展成为必然趋势,软件定义汽车成为汽车新的架构模式。在这一转型过程中,合理分配电能成为整车能耗优化的关键环节。
2025-05-18电动汽车车载充电电源电路中,功率因数校正电路(PowerFactorCorrection,PFC)是重要组成部分。现有的功率因数校正电路的外接电源多为交流民用电,其功率受限制,最大功率为6.6kW。随着电动汽车产业进入规模化快速发展新阶段,充电基础设施匮乏、充电速度慢等问题日益突出,急需提升车载充电功率及兼容性。
2025-05-18企业想要在竞争激烈的国内外市场拔得头筹,能够精确反映企业经营状况的财务绩效便成了利益相关者的有力工具。新能源汽车企业虽然具有较高的成长性,但也需要较高的研发资金投入,受行业政策影响比较大,因此,以利润为财务绩效考核核心的传统绩效评价已不是最佳选择。
2025-05-13新质生产力的提出重塑着各个行业的生存与发展格局。汽车产业近年来正经历着前所未有的变局。新能源、智能网联、无人驾驶等技术颠覆了人们对传统汽车产品的认知,在营销端对传统汽车厂的营销组合带来了深层次的冲击。对于广大的传统车企来说,如何在营销端积极转型是摆在面前的一个重大问题。
2025-03-19能源安全、环境污染和气候变化被认为是工业革命以来制约世界发展的三大挑战。随着可持续发展理念的提出,相关问题越来越受到人们的关注。新能源汽车具有减少能量损失、缓解环境污染和环保等优势,在全球范围内越来越具吸引力。锂离子电池以其高容量、高效率、循环寿命长等优点,成为新能源汽车动力电池的首选[1~5]。
2025-01-14人气:4801
人气:3725
人气:2604
人气:2551
人气:1959
我要评论
期刊名称:农机化研究
期刊人气:2128
主管单位:黑龙江省农业委员会
主办单位:黑龙江省农业机械学会,黑龙江省农业机械工程科学研究所
出版地方:黑龙江
专业分类:农业
国际刊号:1003-188X
国内刊号:23-1233/S
邮发代号:14-324
创刊时间:1979年
发行周期:月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:4.369
影响因子:0.000
影响因子:0.000
影响因子:0.000
影响因子:0.000
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!