91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于YOLOv5的黑色素瘤图像检测仿真

  2024-04-16    140  上传者:管理员

摘要:针对黑色素瘤疾病在临床上存在检测准确率低以及人为主观性太强等问题,提出一种改进的YOLOv5目标检测模型BiC-YOLOv5。首先设计了一种双向特征提取网络BiFPN-L3替换原模型中的特征提取网络FPN,针对不同分辨率下的特征,使用多尺度特征融合的方式提取特征;其次,在骨干网络中融合CBAM注意力模块,设计了一种C3CBAM模块从通道与空间两个层面捕获特征信息以提升检测精度;最后,使用DIOU_loss损失函数,进一步提高模型的检测精度。通过仿真对比实现,BiC-YOLOv5的mAP值达到95.2%,相较原YOLOv5模型,精确度提高了5.2%,召回率提高了4.9%,mAP值提高了5.8%,可以有效的协助临床医学对黑色素瘤进行诊断。

  • 关键词:
  • 注意力机制
  • 特征提取网络
  • 皮肤癌
  • 皮肤镜图像
  • 黑色素瘤
  • 加入收藏

1、引言


皮肤癌作为几种常见的癌症之一,全世界每年大概有5百万病例[1],其中恶性黑色素瘤占皮肤癌死亡病变的75%。黑色素瘤早期患者的存活率可以达到 98.5%,而到了中期之后,存活率有明显的下降,降到了62.9%,进入晚期后,存活率更是只有19.9%[2],可知黑色素瘤对患者的生活带来了沉重的伤害,因此提升黑色素瘤在临床上的检测正确率能给患者带来更大的帮助。

为了提高黑色素瘤的检测正确率以及治疗概率,在临床医学上医生会选择使用皮肤镜检查来辅助诊断。据统计,相比于肉眼观察诊断,使用皮肤镜辅助诊断可以提升诊断准确性5%-30%不等[3]。目前临床医学上,基于医学图像的诊断方法已经成为当前诊断一些疾病的主要方法之一,但各类的医学图像本身也有自己的缺点,如何使用计算机视觉、图像检测技术对这些医学图像进行准确且高效的检测是当前的研究热点。

2020年,钱宝鑫[4]等使用改进后的卷积神经网络对肺部图像进行分割,提出来一种编/解码模式下的肺部分割法,将实验精度提升到了99.33%。同年,马书浩[5]等使用基于多分支膨胀卷积改进的YOLOv3算法,对肺部X射线进行检测,最终将检测精度提升了1.5%。在2021年,周浩军[6]等提出一种基于注意力机制的视频眼震图分类算法,有效缓解了数据集类别数量不平衡的问题,使分类的准确度达到了90.8%。

基于深度学习的大量工作在其它医学图像上得到了应用,同样,在黑色素瘤的检测识别上也有很多研究成果。在2018年,李航[7]等提出了一种支持深度残差网络的皮肤镜图像自动评估新框架,该框架的评估准确率达到了86.28%。在2021年,Alazzam M B[8]等提出了一种基于CNN模型的诊断黑色素瘤方法,通过简单的生成合成样本和减少造成样本过程中平衡数据库中的现有类,使分类器提高了性能。

使用目标检测算法YOLOv5s对黑色素瘤图像进行检测,在检测的速度和准确度上都有很好的表现,但在特征不太明显而且有毛发遮挡时,检测精度有明显的下降,针对该现象,在原有的YOLOv5模型上,对其进行优化,主要优化方法有以下三点:

1) 根据BiFPN[9]的原理设计了一种新型的双向特征提取网络BiFPN-L3,代替FPN[10]作为模型的特征提取网络。针对不同分辨率下的特征,使用多尺度融合的特征提取方法,能够有效的提升模型的特征提取能力。

2) 在YOLOv5骨干层中融合CBAM[11]注意力模块,从通道与空间两个层面加强模型对信息的捕获能力,更好地提升检测精度。

3) 使用DIOU_loss[12]作为模型的损失函数改为来解决检测过程中目标框回归不稳定的问题。


2、网络模型改进


2.1 特征提取网络改进

随着网络层数的逐渐加深,每增加一层网络都可能会造成一部分特征信息的丢失,因此融合各层次的特征能有效的丰富特征语义信息。浅层网络中的图像分辨率较大,含有更细节的信息,而在深层网络中具有更多高维度的特征语义信息。处理皮肤镜图像的难点之一是如何有效地利用各维度之间的复杂关系。在经过主干层后,每个特征图被传入到一个跨维度融合网络双向特征金字塔层,以结合来自所有维度的响应。

Tan M[9]等2020年提出了BiFPN特征提取网络,相比于传统的特征金字塔网络FPN,BiFPN的目的是为了更有效地融合不同分辨率的特征。由于不局限于单个输入节点,BiPFN节点允许来自多个输入的信息,从而允许融合较低级别和较高级别的语义特征。BiFPN进行特征融合时,采用自底向上和自顶向下两种方式融合特征,使模型能够有效地学习跨尺度特征,并且会同一尺度之间加上一个横向连接,缓解因为网络层次多而造成过多的信息丢失。BiFPN的结构图如图1所示:

图1 BiFPN结构图  

BiFPN的表达式如式(1)所示其中Conv是一个卷积层,负责特征处理的卷积操作,使用resize函数在上采样或下采样时匹配分辨率。

根据此原理,本文设计了一个新型的特征提取网络BiFPN-L3,改进的双向特征提取网络如图2所示,其输出公式如式(2)

图2 BiFPN-L3结构图  

其中Pmid和Pout分别为BiFPN的中间层和输出层,由图2可知,在进行特征融合时,BiC-YOLOv5将特征图P1、P2以及P3输入到BiFPN-L3中,进行自底向上和自顶向下的双向特征融合,并引入跳转连接来融合同一层次间的特征,以便得到更多的特征信息。BiC-YOLOv5在进行多尺度特征融合后,将三个融合后的特征图进行回归和分类,提升模型对不同大小目标的敏感度,以提升了模型对特征的提取能力。

2.2 CBAM注意力机制融合

由于在皮肤损伤处不可避免地存在毛发遮挡等因素的干扰,通过将YOLOv5s的骨干层中的第一个C3模块改进为C3CBAM模块,如图3所示。采用双通道注意力机制可以在不同的层面上加强模型对特征信息的提取能力,并且选择初对当前任务目标更关键的信息,优化模型对皮肤镜图片的检测精度。

图3 C3CBAM 结构  

通道注意力机制可以在通道上进行过滤和权重选择,有利于提高检测性能。空间注意力机制可以模拟空间关系上的选择,补充通道注意力地址无法完成的目的关系的数据。Woo S[11]11]等在2018年提出了CBAM注意力机制,从通道和空间两个维度加强模型对特征的提取能力。在本次工作中选择使用CBAM引入到YOLOv5的原因主要也是因为CBAM结合了通道和空间的注意机制,能快速地从众多选择中注意到必要的特征,摒弃无意义或不重要的选择,在皮肤镜图片中毛发遮挡较多的图片中能够提高有效特征提取的效率和准确性。

CBAM的结构图如图4所示。

图4 CBAM注意力机制结构   

由图4可以看出,整个CBAM[11]11]首先从通道注意力机制开始。从空间维度上汇聚通道信息,进行最大池化和平均池化,其次将平均池化结果与最大池化结果通过一个共享全连接层,得到两个池化输出,将这两个输出求和并采用Sigmoid 函数激活,得到最终的通道注意力图,其表达式如式(3)所示。

式中:Favg表示对特征图F进行平均池化操作、Fmax表示对特征图F进行最大池化操作,σ(·)是Sigmoid激活函数,MLP为各层之间的连接权重操作。通道注意力机制如图5所示

图5 通道注意力机制   

经过通道注意力后,产生通道注意力特征图,对其进行空间注意力操作,分别进行最大池化和平均池化,将产生的结果用一个7×7的卷积核进行卷积操作,并采用Sigmoid函数进行激活操作,得到空间注意力图,其表达式如式(4)所示

空间注意力机制如图6所示

图6 空间注意力机制  

2.3 损失函数的改进

在YOLOv5s原始模型中使用GIOU_loss[13]13]作为其模型的损失函数。与IOU不同的是,GIOU_loss 在目标错误框的选择上增加了一个惩罚机制,而且对于误差越大的错误框选的惩罚力度越大,因此对于不同比例的检测框,其检测效果更好。其公式为

然而GIOU_loss仍然存在如目标框回归不稳定、训练过程中容易发散等问题。当回归时出现目标框和检测框没有重叠的情况时,GIOU_loss可能会退化为IOU,为了解决回归结果不准确的问题,使用更加符合回归机制的DIOU_loss作为实验的损失函数。DIOU_loss可以直接求出检测框和目标框之间归一化距离的最小值,加快模型的收敛速度,达到更快速以及更准确地回归收敛。DIOU_loss[12]12]公式如下

相对而言,DIOU_loss比GIOU_loss更适合目标框的回归机制,因此BiC-YOLOv5使用DIOU_loss的损失函数。


3、实验及结果


3.1 数据集

本文在国际皮肤成像协作2018皮肤病变分类(ISIC-skin)2018[14]14]数据集上对YOLOv5s模型进行了评估,该数据集是全球公开可用的最大的皮肤镜图像数据集。本次实验从该数据集获取了1995张原始图片,包括了4种类别,分别为光线性角质病(Actinic keratosis)、黑色素瘤(melanoma)、痣(nevus)、脂溢性角化病(Seborrheic keratosis)。对原始数据集采用数据增强的方法得到8356张图片。根据1995张原图的标注文件,通过计算得到增强后的8356张图片的标注数据。随机挑选其中50%作为训练集,25%作为验证集,25%作为测试集。

3.2 实验平台及参数

实验平台参数配置如表1所示。实验的初始学习率为0.0005,训练轮次为300次,批处理大小设置为24。

表1 训练平台配置

3.3 消融实验及结果分析

针对BiC-YOLOv5在原始YOLOv5模型上进行的三处改进,为了验证各部分改进的作用,通过逐步增加改进的模块设计了消融对比实验。使用如表2第1列所展示的8种方式对数据集进行训练,实验采用精确度P、召回率R以及平均精度均值mAP 为评估指标,实验结果于表2所示。

表2 消融实验结果

由上表可以看出,原模型的精确度P为89.1%,召回率R为85.9%,mAP值为89.4%。通过在原模型上引用BiFPN-L3特征提取网络,增进了不同层级间的特征融合,将不同尺度特征信息按照一定权值进行累加,与原模型相比,精确度P提升了4.4%,召回率R提升了0.5%,mAP值提升了4.3%;通过在骨干网络上融合C3CBAM模块后,从空间和通道两个维度加强模型对特征的提取能力,提升了皮肤目标在有毛发遮挡时的特征表达能力,使整体的mAP值提升了2.2%;最后使用DIOU_loss作为模型的损失函数,让网络模型的收敛速度更快、性能更好。所有这8种模型当中,当仅引用BiFPN-L3和C3CBAM时,模型的精确度P最高,达到了94.6%,相较于YOLOv5s提升了5.5%;当引用C3CBAM模块和DIOU_loss时,模型的召回率R最高,达到了91.5%,较原模型提升了5.6%;而BiC-YOLOv5模型,在mAP上提升最高,达到了95.2%,提升了5.8%;与原YOLOv5模型相比,BiC-YOLOv5对4种类型皮肤病的检测效果均有提升,在每一类皮肤疾病的检测精确度上分别提升了4.4%、6.8%、5.1%、2.4%,总体精确度P提升了5.2%,召回率R提升了4.9%,mAP值提升了5.8%,从结果能证明,三处改动都能提高网络对于黑色素瘤的检测精度。

3.4 与不同目标检测算法比较

将BiC-YOLOv5与其它主流的目标检测算法进行比较,来对BiC-YOLOv5的性能进行分析,进一步验证了BiC-YOLOv5的优势与可行性。实验结果如表3所示。

表3 不同算法的性能对比

由表3可知,与现阶段主流的目标检测算法作对比,BiC-YOLOv5相较于二阶段检测算法Faster-RCNN。精确度P提升了15.6%,召回率R值提升了18.3%,mAP值提升了15.5%;相较于一阶段检测算法SSD[15]精确度P提升了12.7%,召回率R提升了24.6%,mAP值提升了13.9%;与YOLOv4[15]比,精确度P提升了11.7%,召回率R提升了13.5%,mAP值提升了13.1%;对比实验结果足以证明BiC-YOLOv5对黑色素瘤的检测效果是在这5种模型里是最好的,并且提升幅度较大。

3.5 仿真研究

为了更直观地感受BiC-YOLOv5模型和YOLOv5模型的区别,选取下文三张检测图进行对比,如图7、8、9所示。

图7 光线性角质病检测结果的对比   

图8 痣检测结果的对比   

图9 黑色素瘤检测结果的对比   

图7、8、9显示的是在两种模型下同一个类别的图片的不同检测结果,左边显示的原YOLOv5s模型训练后的检测精确值,右边显示的是BiC-YOLOv5模型训练后的检测精确值,可以直观地看出BiC-YOLOv5的检测精确值更高,有更好的检测效果。


4、结束语


为了提升临床上黑色素瘤疾病检测效果,本文在YOLOv5检测模型的基础上,提出了新的检测模型BiC-YOlOv5。首先使用自主设计的双向特征提取网络BiFPN-L3代替FPN,使用多尺度融合的特征提取方法,提升模型的特征提取能力;同时,在模型的骨干层中融合CBAM注意力机制,设计了一种C3CBAM模块,从通道和空间上加强对主要信息的关注,自动修改对通道的权重,以此凸显目标特征,提升模型的性能。同时采用DIOU_loss作为模型的损失函数,加快了收敛速度,提升了模型的回归精度。随后对模型进行多次消融实验和对比实验,验证了这三种改进都起到了提高模型对黑色素瘤检测的精度。最后与其它热门目标检测算法继续对比实验,实验结果表明,BiC-YOLOv5在精确度、召回率以及平均精度均值上相对于这些算法都有不错的提升,可以作为辅助手段对黑色素瘤检测提供较大的作用。


参考文献:

[4]钱宝鑫,肖志勇,宋威.改进的卷积神经网络在肺部图像上的分割应用[J].计算机科学与探索,2020,(8):1358-1367.

[5]马书浩,安居白.基于YOLOv3改进的肺炎检测算法[J].激光与光电子学进展,2020,(18):318-324.

[6]周浩军,赵晓丽,高永彬,李海波,程若然.基于注意力机制的视频眼震图分类算法研究[J/OL].激光与光电子学展,2022-05-23:1-19.

[7]李航,余镇,倪东,等.基于深度残差网络的皮肤镜图像黑色素瘤的识别[J].中国生物医学工程学报,2018,(3):274-282.


文章来源:刘勇志,万方,雷光波,等.基于YOLOv5的黑色素瘤图像检测仿真[J].计算机仿真,2024,41(04):214-218+516.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

临床皮肤科杂志

期刊名称:临床皮肤科杂志

期刊人气:3615

期刊详情

主管单位:江苏省卫生厅

主办单位:江苏省人民医院(南京医科大学第一附属医院)

出版地方:江苏

专业分类:医学

国际刊号:1000-4963

国内刊号:32-1202/R

邮发代号:28-7

创刊时间:1972年

发行周期:月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定