摘要:小目标检测是缺陷检测中的难点,存在检测效果差、速度慢、定位精度低等问题。针对锂电池胶带表面微缺陷特征信息少、识别准确率低的问题,提出融合多尺度信息的Faster R-CNN模型。首先,将残差网络ResNet—50与递归特征金字塔作为特征提取网络,提升对微小缺陷的特征提取能力;其次,通过感兴趣区域(ROI)校准模块消除原网络定位时2次量化取整引入的误差,提升缺陷定位精度;最后,优化损失函数,解决模型对难易样本间学习能力的不平衡问题。改进后Faster R-CNN模型对锂电池胶带表面微缺陷检测的平均精度高达97.9%,比原始Faster R-CNN提高2.1%。
加入收藏
新能源汽车市场的快速发展,使锂(Li)电池需求量急剧上升,带动锂电池相关材料产业的迅速扩张。锂电池胶带是在锂离子电池组装生产环节中,专用于电芯、极耳以及终止部位的胶带,起到绝缘、固定、防漏电的作用,被大量应用于锂离子电池上[1]。在生产中胶带基材与复合绝缘材料之出现脱层、起泡等现象,会造成胶带表面缺陷,降低锂电池胶带的抗酸碱性、防水性、耐热性等[2]。导致绝缘效果差,严重时会出现电池内部漏电或短路,引发爆炸等恶性事故。提升检测锂电池胶带缺陷检测准确率,对提高锂电池的安全性有重要意义。
2006年,Hinton G E等人[3]提出降维与逐层训练的方法后,深度学习开始飞速发展,基于深度学习的缺陷检测技术也取得了很大突破并大放异彩。Ren S等人[4]首次提出Faster R-CNN模型,在R-CNN基础上引入区域候选网络,经过端到端的训练生成高质量区域建议,提升了目标检测的精度与速度,在PASCAL VOC数据集的检测率达到73.2 %;Dong R等人[5]为解决光学遥感影像中小目标检测准确率低和耗时高的问题,将Faster R-CNN与迁移学习相结合,通过自动注释对象类别和对象位置来有效地标记遥感图像,在LEVIR数据集上的平均检测精度提升了17.8 %;Liu J等人[6]为提升对小缺陷的目标的检测精度,在Faster R-CNN加入自上而下的金字塔特征融合结构,改进后网络在铁路数据集中的mAP达81.2 %,高出原网络5.7 %;Ju J等人[7]针对铁路接触网绝缘子识别方法准确率低、多尺度目标识别效果差等问题,引入特征金字塔网络对深度特征图像和浅层特征图像进行融合,并通过高斯权重缩减函数优化传统的非极大值抑制算法,改进后Faster R-CNN算法的精确率检测的平均精度达到98.3 %。
本文针对锂电池胶带表面微缺陷特征信息少、识别准确率低的问题,提出融合多尺度信息的Faster R-CNN模型。将残差网络ResNet—50与递归特征金字塔作为特征提取网络,提升对微小缺陷的特征提取能力。通过感兴趣区域(region of interest, ROI)校准模块消除原网络定位时两次量化取整引入的误差,提升缺陷定位精度。同时优化损失函数,解决模型对难易样本间学习能力的不平衡问题。
1、特征融合改进Faster R-CNN模型
Faster R-CNN相较于单阶段目标检测算法在检测过程多加入了区域候选网络,先生成候选框,再对候选框进行分类,利用锚点机制将区域生成与卷积网络联系到一起,使得目标检测速率比Faster R-CNN模型大大提高[8]。本文在Faster R-CNN的网络结构的基础上将ResNet—50与递归特征金字塔融合构成主干特征提取网络,整体网络结构如图1所示。
图1改进Faster R-CNN整体结构
输入图像经5个卷积网络层得到多层特征图,低层特征图的信息和高层特征图的信息经递归特征金字塔进行融合。通过ROI校准网络得到固定长度的输出,对输出特征进行分类和回归得到目标位置。
1.1骨干网络替换
原始的Faster R-CNN算法使用了VGG—16作为其骨干网络,多卷积层的堆叠使用提高了模型的特征提取能力,但VGG—16模型总体参数量多达百万级,层数增加超过某个阈值还会导致深度网络退化问题,使得训练错误率随网络深度的增加越来越大。为解决此问题,本文引入残差结构,保持精度的同时,减少计算量,解决梯度消失和梯度爆炸问题。残差结构如图2所示。
图2残差结构示意
由图2可见,残差结构主要有残差映射与恒等映射,对每层的输入x,优化目标是H(x)=F(x)+x,通过残差结构会把优化目标转化成H(x)-x,减少训练难度。当学习到较饱和的准确率,学习目标跳转为恒等映射的学习,保证后面层不会造成精度下降。目前残差网络中最常使用的是ResNet—50以及ResNet—101。ResNet—50以及ResNet—101均有5个阶段。阶段1中包括卷积层、批归一化层以及ReLU激活函数。阶段2、3、5中堆叠的残差块相同,图像输入到输出的大小不变。阶段4中ResNet—101比ResNet—50多了17个卷积核。总体来看ResNet—101拥有更多的卷积层和更多的网络参数,可以捕捉到更多的特征和抽象信息,但其训练时间也较长,需要更大的计算资源[9]。为了选择合适的网络来替换原始Faster R-CNN算法的骨干网络,保证目标检测精度的同时,减少原模型中VGG—16的巨大参数量,将ResNet—50网络与ResNet—101网络在采集到的锂电池胶带表面缺陷数据集上的缺陷检测准确率与网络总体参数量进行比较结果如表1所示。
表1清晰度评价函数性能指标
从表1中的数据可知,不同主干网络在锂电池胶带面缺陷数据集上的测试中ResNet—50与ResNet—101网络的mAP比VGG—16高出0.4到0.5个百分点,ResNet—50与ResNet—101两个网络的mAP相差不大,但从参数量上比较,ResNet—101高于ResNet—50。参数量过大会导致迭代一次需要的时间大量增加,对硬件配置不高的电脑会导致显卡内存溢出。比较发现,在本文数据集上ResNet—50与ResNet—101网络在均值平均精度(mean average precision, mAP)、参数量方面表现均优于VGG—16网络,考虑到二者在平均精度均值近似的情况下,参数量方面的巨大差异,本文选择ResNet—50替换原有的VGG—16骨干网络。
1.2特征融合
在Faster R-CNN算法中,无论使用VGG—16还是ResNet—50卷积提取网络,都是单层特征提取网络。对输入的图像进行特征提取时,特征图的尺寸在卷积的过程中逐渐减小,对应的待检测目标的特征信息也在不断变小,会导致小目标的特征无法得到充分利用,降低微缺陷的检测精度,给锂电池胶带表面微小缺陷检测带来困难。为实现网络浅层特征和深层特征的融合,提升对小目标的特征提取,加入递归特征金字塔结构,有效地减少计算量和尺度消减问题,从而提高模型的效率和性能,递归特征金字塔结构示意如图3所示。
图3递归特征金字塔结构
图3中实线圆代表空洞空间金字塔池化模块用于实现两个特征金字塔间的级联,空洞空间金字塔池化针对不同大小的对象提取特征,并使用多个尺度的特征进行下采样,更好地描述对象的局部特征。随着空洞率的增加,空洞空间金字塔池化模块可以逐步扩大感受野,利用不同比例下的感受野和上下文信息,通过池化和降采样操作整合不同尺寸的特征。图3中虚线圆代表融合模块,其作用是将来自不同层和不同分辨率的特征进行融合和整合,从而生成更具表征性和识别性的特征图。
ResNet—50网络共有5个阶段,每个阶段中都有相似的残差块构成,所以融合时只对每个阶段中的第一个残差块进行修改,ResNet—50每个阶段的第一个残差块与递归特征金字塔反馈信息的融合过程如图4所示。
图4 ResNet—50与递归特征金字塔融合
图4中,x代表ResNet—50每个阶段的第一个残差块的输入,R(f)代表递归特征金字塔反馈回来的信息。反馈回来的特征信息作为融合时的输入经过一个1×1的卷积与ResNet—50每个阶段的第一个残差块的输出采用相加操作进行融合,将融合结果作为新的输出。ResNet—50与递归特征金字塔融合后提取出的特征图具有丰富的小目标信息,能更好的识别出微小缺陷。
1.3 ROI校准
Faster R-CNN算法的目标区域在原始图像上的大小映射到特征图上时,若出现小数区域会导致无法寻找,原Faster R-CNN算法采用直接取整操作,得到尺寸为固定大小的特征图,获得特征图的过程直接取整会产生量化误差,带来定位精度上的损失[10]。为了解决ROI池化这一缺点,进一步提升Faster R-CNN算法对微小缺陷的检测性能,本文提出采用ROI校准网络代替ROI池化,消除最大池化过程引入的误差。ROI校准是更为精确的位置校准方法,可以保持ROI内部位置信息和特征的一致性,提高检测精度。ROI校准示意如图5所示。
图5 ROI校准示意
图5中阴影部分表示ROI映射到特征图上的位置,阴影部分按照实际需求被分割为4个子区域,将每个子区域中设置4个采样点,每个采样点的像素值由特征图上最邻近区域的4个像素点通过双线性插值法[11]获取。之后,池化的过程在每个子区域中进行,最终得到尺寸平齐的输出。
1.4损失函数
Faster R-CNN采用的Smooth L1损失函数改进了L1损失函数的零点不平滑问题,但在Smooth L1损失函数中,对困难样本提供了更多的梯度信息,导致难易样本学习能力不平衡[12]。为解决此问题,设计了Balance L1损失函数相应的梯度公式为
其中,γ用于调整回归误差的上界,使不同任务间更加平衡。Balance L1损失函数公式如下
其中,参数需要满足0.5ln(b|x|+1)=γ,γ通常取1.5。通过Balance L1损失函数可以有效降低难易样本间的不平衡问题,增强对小目标困难样本的学习能力。
2、实验与分析
2.1实验数据采集与处理
在锂电池胶带领域,公开数据集少且缺少相关标注。针对该问题,本文搭建视觉采集系统,制作私有数据集。数据集采集系统如图6所示。
图6数据集采集系统
图6中采用的工业相机型号为Basler acA2440—20gc,镜头型号为MVL—MF2518M—5MPE,采用背向照明方式突出半透明胶带表面缺陷轮廓。
采集分辨率为800像素×360像素的图片共980张。为了使得数据更加接近锂电池胶带实际生产环境,通过镜头噪声、对比度增强、运动模糊3种传统数据增强对数据进行处理,将数据集扩大至1 470张。并采用生成对抗网络的数据增强方法,通过生成器和判别器两者相互博弈,生成接近于真实样本的数据。
数据增强后,锂电池胶带表面缺陷数据集达到了3 534张,其中包含白点缺陷数据1 142张,划痕缺陷数据1 368张,脏污缺陷数据1 024张。使用LabelImg工具对数据进行标注,标注后的锂电池胶带表面缺陷图片会生成.xml文件,包含锂电池胶带表面缺标记框的坐标以及缺陷类别等信息。按照4︰4︰2的比例将制作的锂电池胶带数据划分为训练集、验证集以及测试集。
2.2实验环境
本文实验是在Windows操作系统下进行,实验代码语言使用python。实验中需要将网络中涉及到的初始参数设为一致,学习率设为0.025,IoU设为0.5,迭代次数设为100,动量为0.9,权重衰减为0.000 5。具体实验环境配置如表2所示。
表2缺陷检测环境配置
2.3实验结果与分析
对改进后Faster R-CNN算法与改进前的比较,并通过消融实验,证明改进中每部分起到的作用,实验在制作的锂电池胶带数据集上进行,以mAP以及召回率(recall)作为评价指标。改进前后Faster R-CNN算法的mAP以及Recall值的结果如表3所示。
表3改进前后算法的mAP和Recall值
由表3可知,改进后算法对3类缺陷检测的平均准确率提升了2.1个百分点,证明改进后算法对于微小缺陷的检测水平有较大提升。同时,改进后算法的查全率比未改进前高出2.44 %。改进前后Faster R-CNN的损失曲线与平均精度曲线如图7所示。
图7改进前后算法损失曲线与准确率曲线
由图7(a)可见,改进前后算法的损失曲线均正常收敛未出现欠拟合的现象,改进Faster R-CNN的损失值低于原始网络,损失值下降到0.1左右趋于稳定。由图7(b)可见,改进后Faster R-CNN的准确率高于改进前,表明改进后Faster R-CNN的分类性能好。
为了验证改进4个部分的效果,本文进行了消融实验。将ResNet—50替换VGG—16改进部分简称为A,ResNet—50融合递归金字塔简称为B,ROI校准代替ROI池化简称为C,改进损失函数称为D。消融实验结果如表4所示。
表4消融实验
由表4可知,A部分使用残差网络降低了网络总体参数,但对缺陷识别准确率较原始网络仅提升了0.5 %;B部分通过多尺度融合可以有效提升对微缺陷的检测性能,mAP提升了1.7 %;C部分通过ROI校准使得缺陷定位更精准,mAP提升了0.3 %;D部分采用优化损失函数平衡难易样本间模型的学习能力,mAP提升了0.8 %。去掉改进4部分中的任意一部分,mAP均有所降低,表明对于锂电池胶带表面缺陷检测,4部分改进的有效性和相互促进性。
为进一步验证改进Faster R-CNN算法适用于锂电池胶带表面微缺陷检测,在制作的锂电池胶带数据集上分别对SSD、YOLOv3、YOLOX、Mask R-CNN、以及改进Faster R-CNN算法检测mAP进行了对比,检测结果如表5所示。
表5不同算法检测结果
由表5可知,改进的Faster R-CNN算法对缺陷检测的mAP为97.9 %,比SSD高出5.5 %,比YOLOv3高出13.8 %,比YOLOX高出9.9 %,比Mask R-CNN高出7.7 %。改进后Faster R-CNN算法对锂电池胶带表面微缺陷的检测精度高于其他4种检测算法。
将同一张图片分别输入SSD、YOLOv3、YOLOX、Mask R-CNN、Faster R-CNN以及改进Faster R-CNN,检测结果如图8所示。
图8检测效果示例
图8中矩形框标记出了缺陷位置,给出检测出的缺陷种类及其置信度。由图8可见,对图中所给的同一张图片,6种算法均可以检测出缺陷,但改进Faster-RCNN算法检测出缺陷的平均置信度最高。
3、结 论
本文对锂电池胶带表面缺陷展开研究,制作锂电池胶带表面缺陷数据集,针对Faster R-CNN模型对胶带表面微缺陷检测准确率不高的问题,采用ResNet50与递归特征金字塔对Faster R-CNN特征提取网络进行改进,提高对微小缺陷特征的利用;通过ROI校准消除ROI池化2次量化取整引入的误差,提升缺陷定位精度;对损失函数进行优化,平衡难易样本间模型学习能力。实验结果表明,改进后Faster R-CNN算法mAP达到97.9 %,提高了锂电池胶带表面微缺陷检测准确度。
参考文献:
[1]邱燕平,黄志奇,钟宏,等.锂电池胶带的研究进展[J].粘接,2019,40(2):19-22.
[8]胡均平,孙希.基于改进Faster R-CNN的近红外夜间行人检测方法[J].传感器与微系统,2021,40(8):126-129.
[10]张阳,刘小芳,周鹏成.改进Faster R-CNN的SAR图像船舶检测技术[J].无线电工程,2022,52(12):2280-2287.
基金资助:陕西省重点研发计划资助项目(2019GY—097);
文章来源:黄梦涛,付晨.改进Faster R-CNN微缺陷检测算法研究[J].传感器与微系统,2024,43(12):126-130.
分享:
电池充电是指电量累积到额定容量的过程。电量由外部进入电池元件内部时,变压器元件快速运行,将交流电量转化为可以长期存储的直流电量,但出于安全性考虑,充电量不会超过电池元件的额定电量存储水平。电池放电是指电量的持续输出。作为稳压型供电装置,电池只能提供直流传输状态的电量,且电池元件的最大供电能力与其额定电量水平相等。
2024-12-04新能源汽车市场的快速发展,使锂(Li)电池需求量急剧上升,带动锂电池相关材料产业的迅速扩张。锂电池胶带是在锂离子电池组装生产环节中,专用于电芯、极耳以及终止部位的胶带,起到绝缘、固定、防漏电的作用,被大量应用于锂离子电池上。在生产中胶带基材与复合绝缘材料之出现脱层、起泡等现象。
2024-12-04纯电动挖掘机由电池组供电,能量输出依靠电池系统的储能。电动挖掘机功率较大,需要电池具有较髙的容量。蓄电池的容量决定了工作续航时间;较大容量的电池可以维持较长的系统工作时间,但是大容量电池意味着较大的电池组重量及体积,会影响整机的续航能力。目前,安全性较高的磷酸铁锂(LFP)电池受到电动市场的青睐,内置蓄电池式电动挖掘机广泛采用LFP电池。
2024-11-11质子交换膜燃料电池(proton exchange membrane fuel cell, PEMFC)具有启动快、零排放、效率高等优点,然而其实际应用和商业化过程充满了挑战,水管理就是挑战之一,优化水管理是提高PEMFC性能和降低成本的重要举措.在PEMFC中,液态水的出现会导致通道内的压降增加,阻塞反应气体运输,反应气体分布不均匀。
2024-11-11阀控式密封铅酸(VRLA)蓄电池在长期的使用过程中,会受到水分流失、阴极劣化、正极板腐蚀等的影响,导致放电电压下降、内阻增加、实际满电容量下降。作为一种备用电源,VRLA蓄电池的运行状态直接影响工业生产,因而需要设计远程诊断和维护系统,实时掌握其健康水平。
2024-10-26在“碳中和”趋势的推动下,绿色低碳产业需求活跃,而风电产业是清洁能源的重要组成部分,全球风电正加速布局,风电产业的高速发展为风电机组控制系统行业带来了巨大的市场契机。
2024-10-26储能系统作为核心技术,具备能量转化、储存与按需释放的能力,在储能电网和新能源电动汽车中扮演关键角色。锂离子电池因高能量密度、长寿命和低污染等优点,在微电网和新能源汽车等领域被广泛应用。
2024-10-26风光储能技术利用风能和太阳能等可再生能源进行发电,并将其储存起来以供后续使用,有效缓解能源供应与需求之间的矛盾,同时减少对化石能源的依赖,对推动能源可持续发展具有重要意义。然而,风光储能技术也面临着一些挑战。
2024-10-26电池组作为电动汽车和储能系统的核心部件,其性能和安全性直接关系到整个系统的运行效率和可靠性。然而,在实际应用中,电池组中的单体电池由于制造差异、使用条件不同等因素,往往会出现性能衰退、内阻增加、容量衰减等异常现象。这些异常现象不仅会降低电池组的整体性能,还可能引发安全事故。
2024-10-23阀控式密封铅酸(VRLA)蓄电池在长期的使用过程中,会受到水分流失、阴极劣化、正极板腐蚀等的影响,导致放电电压下降、内阻增加、实际满电容量下降。作为一种备用电源,VRLA蓄电池的运行状态直接影响工业生产,因而需要设计远程诊断和维护系统,实时掌握其健康水平。
2024-10-23人气:6574
人气:5449
人气:3586
人气:3244
人气:3159
我要评论
期刊名称:传感器与微系统
期刊人气:4115
主管单位:中国电子科技集团公司
主办单位:中国电子科技集团公司第四十九研究所
出版地方:黑龙江
专业分类:科技
国际刊号:2096-2436
国内刊号:23-1537/TN
邮发代号:14-203
创刊时间:1982年
发行周期:月刊
期刊开本:大16开
见刊时间:1年以上
影响因子:3.316
影响因子:0.281
影响因子:0.629
影响因子:0.000
影响因子:0.000
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!