摘要:针对黑色素瘤疾病在临床上存在检测准确率低以及人为主观性太强等问题,提出一种改进的YOLOv5目标检测模型BiC-YOLOv5。首先设计了一种双向特征提取网络BiFPN-L3替换原模型中的特征提取网络FPN,针对不同分辨率下的特征,使用多尺度特征融合的方式提取特征;其次,在骨干网络中融合CBAM注意力模块,设计了一种C3CBAM模块从通道与空间两个层面捕获特征信息以提升检测精度;最后,使用DIOU_loss损失函数,进一步提高模型的检测精度。通过仿真对比实现,BiC-YOLOv5的mAP值达到95.2%,相较原YOLOv5模型,精确度提高了5.2%,召回率提高了4.9%,mAP值提高了5.8%,可以有效的协助临床医学对黑色素瘤进行诊断。
加入收藏
1、引言
皮肤癌作为几种常见的癌症之一,全世界每年大概有5百万病例[1],其中恶性黑色素瘤占皮肤癌死亡病变的75%。黑色素瘤早期患者的存活率可以达到 98.5%,而到了中期之后,存活率有明显的下降,降到了62.9%,进入晚期后,存活率更是只有19.9%[2],可知黑色素瘤对患者的生活带来了沉重的伤害,因此提升黑色素瘤在临床上的检测正确率能给患者带来更大的帮助。
为了提高黑色素瘤的检测正确率以及治疗概率,在临床医学上医生会选择使用皮肤镜检查来辅助诊断。据统计,相比于肉眼观察诊断,使用皮肤镜辅助诊断可以提升诊断准确性5%-30%不等[3]。目前临床医学上,基于医学图像的诊断方法已经成为当前诊断一些疾病的主要方法之一,但各类的医学图像本身也有自己的缺点,如何使用计算机视觉、图像检测技术对这些医学图像进行准确且高效的检测是当前的研究热点。
2020年,钱宝鑫[4]等使用改进后的卷积神经网络对肺部图像进行分割,提出来一种编/解码模式下的肺部分割法,将实验精度提升到了99.33%。同年,马书浩[5]等使用基于多分支膨胀卷积改进的YOLOv3算法,对肺部X射线进行检测,最终将检测精度提升了1.5%。在2021年,周浩军[6]等提出一种基于注意力机制的视频眼震图分类算法,有效缓解了数据集类别数量不平衡的问题,使分类的准确度达到了90.8%。
基于深度学习的大量工作在其它医学图像上得到了应用,同样,在黑色素瘤的检测识别上也有很多研究成果。在2018年,李航[7]等提出了一种支持深度残差网络的皮肤镜图像自动评估新框架,该框架的评估准确率达到了86.28%。在2021年,Alazzam M B[8]等提出了一种基于CNN模型的诊断黑色素瘤方法,通过简单的生成合成样本和减少造成样本过程中平衡数据库中的现有类,使分类器提高了性能。
使用目标检测算法YOLOv5s对黑色素瘤图像进行检测,在检测的速度和准确度上都有很好的表现,但在特征不太明显而且有毛发遮挡时,检测精度有明显的下降,针对该现象,在原有的YOLOv5模型上,对其进行优化,主要优化方法有以下三点:
1) 根据BiFPN[9]的原理设计了一种新型的双向特征提取网络BiFPN-L3,代替FPN[10]作为模型的特征提取网络。针对不同分辨率下的特征,使用多尺度融合的特征提取方法,能够有效的提升模型的特征提取能力。
2) 在YOLOv5骨干层中融合CBAM[11]注意力模块,从通道与空间两个层面加强模型对信息的捕获能力,更好地提升检测精度。
3) 使用DIOU_loss[12]作为模型的损失函数改为来解决检测过程中目标框回归不稳定的问题。
2、网络模型改进
2.1 特征提取网络改进
随着网络层数的逐渐加深,每增加一层网络都可能会造成一部分特征信息的丢失,因此融合各层次的特征能有效的丰富特征语义信息。浅层网络中的图像分辨率较大,含有更细节的信息,而在深层网络中具有更多高维度的特征语义信息。处理皮肤镜图像的难点之一是如何有效地利用各维度之间的复杂关系。在经过主干层后,每个特征图被传入到一个跨维度融合网络双向特征金字塔层,以结合来自所有维度的响应。
Tan M[9]等2020年提出了BiFPN特征提取网络,相比于传统的特征金字塔网络FPN,BiFPN的目的是为了更有效地融合不同分辨率的特征。由于不局限于单个输入节点,BiPFN节点允许来自多个输入的信息,从而允许融合较低级别和较高级别的语义特征。BiFPN进行特征融合时,采用自底向上和自顶向下两种方式融合特征,使模型能够有效地学习跨尺度特征,并且会同一尺度之间加上一个横向连接,缓解因为网络层次多而造成过多的信息丢失。BiFPN的结构图如图1所示:
图1 BiFPN结构图
BiFPN的表达式如式(1)所示其中Conv是一个卷积层,负责特征处理的卷积操作,使用resize函数在上采样或下采样时匹配分辨率。
根据此原理,本文设计了一个新型的特征提取网络BiFPN-L3,改进的双向特征提取网络如图2所示,其输出公式如式(2)
图2 BiFPN-L3结构图
其中Pmid和Pout分别为BiFPN的中间层和输出层,由图2可知,在进行特征融合时,BiC-YOLOv5将特征图P1、P2以及P3输入到BiFPN-L3中,进行自底向上和自顶向下的双向特征融合,并引入跳转连接来融合同一层次间的特征,以便得到更多的特征信息。BiC-YOLOv5在进行多尺度特征融合后,将三个融合后的特征图进行回归和分类,提升模型对不同大小目标的敏感度,以提升了模型对特征的提取能力。
2.2 CBAM注意力机制融合
由于在皮肤损伤处不可避免地存在毛发遮挡等因素的干扰,通过将YOLOv5s的骨干层中的第一个C3模块改进为C3CBAM模块,如图3所示。采用双通道注意力机制可以在不同的层面上加强模型对特征信息的提取能力,并且选择初对当前任务目标更关键的信息,优化模型对皮肤镜图片的检测精度。
图3 C3CBAM 结构
通道注意力机制可以在通道上进行过滤和权重选择,有利于提高检测性能。空间注意力机制可以模拟空间关系上的选择,补充通道注意力地址无法完成的目的关系的数据。Woo S[11]11]等在2018年提出了CBAM注意力机制,从通道和空间两个维度加强模型对特征的提取能力。在本次工作中选择使用CBAM引入到YOLOv5的原因主要也是因为CBAM结合了通道和空间的注意机制,能快速地从众多选择中注意到必要的特征,摒弃无意义或不重要的选择,在皮肤镜图片中毛发遮挡较多的图片中能够提高有效特征提取的效率和准确性。
CBAM的结构图如图4所示。
图4 CBAM注意力机制结构
由图4可以看出,整个CBAM[11]11]首先从通道注意力机制开始。从空间维度上汇聚通道信息,进行最大池化和平均池化,其次将平均池化结果与最大池化结果通过一个共享全连接层,得到两个池化输出,将这两个输出求和并采用Sigmoid 函数激活,得到最终的通道注意力图,其表达式如式(3)所示。
式中:Favg表示对特征图F进行平均池化操作、Fmax表示对特征图F进行最大池化操作,σ(·)是Sigmoid激活函数,MLP为各层之间的连接权重操作。通道注意力机制如图5所示
图5 通道注意力机制
经过通道注意力后,产生通道注意力特征图,对其进行空间注意力操作,分别进行最大池化和平均池化,将产生的结果用一个7×7的卷积核进行卷积操作,并采用Sigmoid函数进行激活操作,得到空间注意力图,其表达式如式(4)所示
空间注意力机制如图6所示
图6 空间注意力机制
2.3 损失函数的改进
在YOLOv5s原始模型中使用GIOU_loss[13]13]作为其模型的损失函数。与IOU不同的是,GIOU_loss 在目标错误框的选择上增加了一个惩罚机制,而且对于误差越大的错误框选的惩罚力度越大,因此对于不同比例的检测框,其检测效果更好。其公式为
然而GIOU_loss仍然存在如目标框回归不稳定、训练过程中容易发散等问题。当回归时出现目标框和检测框没有重叠的情况时,GIOU_loss可能会退化为IOU,为了解决回归结果不准确的问题,使用更加符合回归机制的DIOU_loss作为实验的损失函数。DIOU_loss可以直接求出检测框和目标框之间归一化距离的最小值,加快模型的收敛速度,达到更快速以及更准确地回归收敛。DIOU_loss[12]12]公式如下
相对而言,DIOU_loss比GIOU_loss更适合目标框的回归机制,因此BiC-YOLOv5使用DIOU_loss的损失函数。
3、实验及结果
3.1 数据集
本文在国际皮肤成像协作2018皮肤病变分类(ISIC-skin)2018[14]14]数据集上对YOLOv5s模型进行了评估,该数据集是全球公开可用的最大的皮肤镜图像数据集。本次实验从该数据集获取了1995张原始图片,包括了4种类别,分别为光线性角质病(Actinic keratosis)、黑色素瘤(melanoma)、痣(nevus)、脂溢性角化病(Seborrheic keratosis)。对原始数据集采用数据增强的方法得到8356张图片。根据1995张原图的标注文件,通过计算得到增强后的8356张图片的标注数据。随机挑选其中50%作为训练集,25%作为验证集,25%作为测试集。
3.2 实验平台及参数
实验平台参数配置如表1所示。实验的初始学习率为0.0005,训练轮次为300次,批处理大小设置为24。
表1 训练平台配置
3.3 消融实验及结果分析
针对BiC-YOLOv5在原始YOLOv5模型上进行的三处改进,为了验证各部分改进的作用,通过逐步增加改进的模块设计了消融对比实验。使用如表2第1列所展示的8种方式对数据集进行训练,实验采用精确度P、召回率R以及平均精度均值mAP 为评估指标,实验结果于表2所示。
表2 消融实验结果
由上表可以看出,原模型的精确度P为89.1%,召回率R为85.9%,mAP值为89.4%。通过在原模型上引用BiFPN-L3特征提取网络,增进了不同层级间的特征融合,将不同尺度特征信息按照一定权值进行累加,与原模型相比,精确度P提升了4.4%,召回率R提升了0.5%,mAP值提升了4.3%;通过在骨干网络上融合C3CBAM模块后,从空间和通道两个维度加强模型对特征的提取能力,提升了皮肤目标在有毛发遮挡时的特征表达能力,使整体的mAP值提升了2.2%;最后使用DIOU_loss作为模型的损失函数,让网络模型的收敛速度更快、性能更好。所有这8种模型当中,当仅引用BiFPN-L3和C3CBAM时,模型的精确度P最高,达到了94.6%,相较于YOLOv5s提升了5.5%;当引用C3CBAM模块和DIOU_loss时,模型的召回率R最高,达到了91.5%,较原模型提升了5.6%;而BiC-YOLOv5模型,在mAP上提升最高,达到了95.2%,提升了5.8%;与原YOLOv5模型相比,BiC-YOLOv5对4种类型皮肤病的检测效果均有提升,在每一类皮肤疾病的检测精确度上分别提升了4.4%、6.8%、5.1%、2.4%,总体精确度P提升了5.2%,召回率R提升了4.9%,mAP值提升了5.8%,从结果能证明,三处改动都能提高网络对于黑色素瘤的检测精度。
3.4 与不同目标检测算法比较
将BiC-YOLOv5与其它主流的目标检测算法进行比较,来对BiC-YOLOv5的性能进行分析,进一步验证了BiC-YOLOv5的优势与可行性。实验结果如表3所示。
表3 不同算法的性能对比
由表3可知,与现阶段主流的目标检测算法作对比,BiC-YOLOv5相较于二阶段检测算法Faster-RCNN。精确度P提升了15.6%,召回率R值提升了18.3%,mAP值提升了15.5%;相较于一阶段检测算法SSD[15]精确度P提升了12.7%,召回率R提升了24.6%,mAP值提升了13.9%;与YOLOv4[15]比,精确度P提升了11.7%,召回率R提升了13.5%,mAP值提升了13.1%;对比实验结果足以证明BiC-YOLOv5对黑色素瘤的检测效果是在这5种模型里是最好的,并且提升幅度较大。
3.5 仿真研究
为了更直观地感受BiC-YOLOv5模型和YOLOv5模型的区别,选取下文三张检测图进行对比,如图7、8、9所示。
图7 光线性角质病检测结果的对比
图8 痣检测结果的对比
图9 黑色素瘤检测结果的对比
图7、8、9显示的是在两种模型下同一个类别的图片的不同检测结果,左边显示的原YOLOv5s模型训练后的检测精确值,右边显示的是BiC-YOLOv5模型训练后的检测精确值,可以直观地看出BiC-YOLOv5的检测精确值更高,有更好的检测效果。
4、结束语
为了提升临床上黑色素瘤疾病检测效果,本文在YOLOv5检测模型的基础上,提出了新的检测模型BiC-YOlOv5。首先使用自主设计的双向特征提取网络BiFPN-L3代替FPN,使用多尺度融合的特征提取方法,提升模型的特征提取能力;同时,在模型的骨干层中融合CBAM注意力机制,设计了一种C3CBAM模块,从通道和空间上加强对主要信息的关注,自动修改对通道的权重,以此凸显目标特征,提升模型的性能。同时采用DIOU_loss作为模型的损失函数,加快了收敛速度,提升了模型的回归精度。随后对模型进行多次消融实验和对比实验,验证了这三种改进都起到了提高模型对黑色素瘤检测的精度。最后与其它热门目标检测算法继续对比实验,实验结果表明,BiC-YOLOv5在精确度、召回率以及平均精度均值上相对于这些算法都有不错的提升,可以作为辅助手段对黑色素瘤检测提供较大的作用。
参考文献:
[4]钱宝鑫,肖志勇,宋威.改进的卷积神经网络在肺部图像上的分割应用[J].计算机科学与探索,2020,(8):1358-1367.
[5]马书浩,安居白.基于YOLOv3改进的肺炎检测算法[J].激光与光电子学进展,2020,(18):318-324.
[6]周浩军,赵晓丽,高永彬,李海波,程若然.基于注意力机制的视频眼震图分类算法研究[J/OL].激光与光电子学展,2022-05-23:1-19.
[7]李航,余镇,倪东,等.基于深度残差网络的皮肤镜图像黑色素瘤的识别[J].中国生物医学工程学报,2018,(3):274-282.
文章来源:刘勇志,万方,雷光波,等.基于YOLOv5的黑色素瘤图像检测仿真[J].计算机仿真,2024,41(04):214-218+516.
分享:
皮肤恶性黑色素瘤(cutaneousmalignantmelanoma,CMM)是起源于皮肤黑色素细胞的恶性肿瘤,2020年全球约有32.5万新发病例,5.7万死亡病例。CMM侵袭和转移能力极强,患者预后较差。细胞周期蛋白依赖性激酶12(cyclindependentkinase12,CDK12)属于丝氨酸/苏氨酸激酶家族成员,调节细胞增殖、凋亡及血管生成过程。
2025-08-25本病肿瘤细胞的特点与乳腺的黏液腺癌相似,有明显的黏液池形成,肿瘤细胞漂浮在其间,肿瘤实体部分由小基底样细胞或腺样成分组成。2018年WHO《皮肤病理肿瘤组织学分类》将其分类为附属器肿瘤/伴大汗腺和小汗腺分化的恶性肿瘤/黏液癌,肿瘤编码为8480/3[2]。
2025-07-07紫外线照射会导致整个日光暴露部位的表皮角质形成细胞发生异形性改变,表现为单个或多个不同阶段的AK皮损,周围可能存在亚临床病灶,这些病灶可形成区域癌变(fieldcancerization,FC)。如果忽视对FC的诊断和治疗,AK病灶的新发和复发问题就会普遍和长期存在,并可能进展为SCC[2]。因此,AK的FC现象是一个非常重要的研究领域。
2025-07-07皮肤黑色素瘤是一种具有高度侵袭性的恶性肿瘤,严重威胁患者生命健康。早期发现和准确诊断对于提高黑色素瘤患者的生存率和生活质量具有至关重要的意义。通过早期诊断,医生能够更精确地评估病情,制定更为合理的治疗方案,从而有效提升治疗效果,降低治疗难度和成本。
2025-06-24近年来,面部皮肤肿物发病逐渐增多,部分肿物肉眼诊断易误诊,皮肤活检可明确诊断,但常规病理检查耗时较长[1-2]。浙江大学医学院附属金华医院在头面部皮肤肿瘤的手术诊治中,采用术前皮肤镜联合术中快速冰冻切片检查的方法,取得满意的治疗效果,现报道如下。
2025-05-27基底细胞癌(BCC)是临床上最常见的恶性皮肤肿瘤之一,多发于老年人,且发病率呈逐年升高趋势[1]。其好发于颜面等皮肤暴露部位,尤其在鼻部较为常见[2]。我科自2022年10月至2024年3月,使用双皮下蒂岛状皮瓣修复鼻翼基底细胞癌术后缺损患者50例,取得满意效果,报道如下。
2025-04-10NMSC临床多见,预后相对较好[1]。BCC发病率一般大于cSCC,二者发病率比例据多项研究估算大致为1∶1至4∶1[2-3];但BCC由于恶性程度较低,侵袭及转移能力较弱,所以死亡率显著低于cSCC[4]。黑色素瘤临床少见,但恶性度高,预后差,死亡率远高于其他皮肤恶性肿瘤[5]。
2025-03-24黑色素瘤通常来自皮肤和黏膜等部位,是一种源于黑色素细胞的恶性肿瘤,该病的发病率和死亡率在全球范围有很大差别,白人群体发病率较高,在我国发病率较低[1]。一旦黑色素瘤细胞获得侵袭性并开始扩散,将会极大程度上影响治疗和预后,转移性黑色素瘤患者的5年生存率仅15%~20%[2]。
2025-02-24巨噬细胞分化抗原(Mac)-1可参与机体免疫反应、防御作用,且可对白细胞浸润、迁移等造成影响,而白细胞对肿瘤生长、转移具有促进作用,其表达缺失可造成黑色素瘤细胞生长受到抑制[2]。缝隙连接及通讯在肿瘤的发生发展中具有重要作用[3]。
2025-01-09表皮最外层的角质层可以防止物理损伤、化学刺激和微生物入侵,然而,化学物质、紫外线辐射、烟雾和污染物等多种危险因素会导致皮肤损伤甚至皮肤河北医药皮肤鳞状细胞癌(CSCC)来源于角质形成细胞,是非黑色素瘤皮肤癌的第二大常见原因。CSCC是皮肤上皮的恶性增生,占所有皮肤癌的20%~50%。
2024-12-24人气:18228
人气:17632
人气:17209
人气:16643
人气:16275
我要评论
期刊名称:临床皮肤科杂志
期刊人气:3615
主管单位:江苏省卫生厅
主办单位:江苏省人民医院(南京医科大学第一附属医院)
出版地方:江苏
专业分类:医学
国际刊号:1000-4963
国内刊号:32-1202/R
邮发代号:28-7
创刊时间:1972年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.405
影响因子:0.493
影响因子:0.414
影响因子:0.644
影响因子:0.454
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!