91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

基于改进YOLOv8的药品名称检测算法

  2024-06-13    189  上传者:管理员

摘要:针对当前药品名称检测存在检测精度低、算法参数量大和现有公开数据集在小目标检测上存在限制等问题,并基于YOLOv8算法,提出了一种结合Slim-Neck替换特征融合层、GAM注意力机制的检测精度高、硬件要求低的新模型YOLOv8-SNG。使用Drug Name Detection Dataset数据集验证算法的有效性。实验结果表明,与YOLOv8相比,在Drug Name Detection Dataset数据集上FPS少量上涨的情况下,mAP@0.5提高了11.9%,mAP@0.5:0.95提高了6.43%;改进后的算法具有更强的泛化性能,能够更好的适用于药品名称检测任务。

  • 关键词:
  • YOLOv8
  • 注意力机制
  • 特征融合层
  • 目标检测
  • 药品名称
  • 加入收藏

药品名称检测在药物安全管理建设中扮演着重要角色,该技术已广泛应用于智能药品监控和药品管理等领域。药品名称检测利用计算机视觉技术对药物包装中的名称信息视频或图像进行分析,旨在准确识别出药品的名称,促进开发专门为药物标签分析量身定制的准确和健壮的目标检测模型。

药品名称检测注重处理单一目标类别的多尺度和遮挡问题,与目标检测相比,后者需要应对多个目标类别的多尺度、遮挡和复杂场景。早期的药品名称检测方法主要采用手工设计的特征和传统机器学习算法,如定向梯度直方图(HOG)和线性支持向量机(SVM)。然而,这些方法在复杂场景下的鲁棒性和准确性上存在限制[1]。

近年来,药品名称检测领域涌现了许多改进和优化的方法,包括基于注意力机制的方法、轻量化网络设计和多尺度特征融合等。这些方法不断推动药品名称检测性能和效果的进一步提升。YOLO (You Only Look Once)是由Joseph Redmon等人开发的一种端到端的目标检测方法,通过单个神经网络完成检测任务。其通过多次迭代不断改进以克服限制并提高性能,这种持续的改进使得YOLO在目标检测领域取得了显著突破[2]。但其在药品名称检测中存在参数量大、对硬件要求高、检测精度低等问题。

本文数据集来源为Kaggle[3]网站中的公开数据集Drug Name Detection Dataset,该数据集涵盖了来自各种制造商和包装风格的广泛药品。它包括药瓶、吸塑包装、小瓶和医疗保健行业中常见的其他包装格式的图像。

药物名称检测数据集由1 823张带有注释的药物名称标签的图像组成,是药物标签分析领域中训练和评估计算机视觉模型的宝贵资源。通过利用该数据集,研究人员和从业人员可以推进准确高效的药物名称检测系统的开发,有助于改善医疗保健行业的药物管理和患者安全。

本文旨在解决药品名称检测中YOLOv8检测精度较低的问题。首先,使用Drug Name Detection Dataset数据集,并在YOLOv8的基础上,利用Slim-Neck替换特征融合层,用于优化卷积神经网络中neck部分的结构,负责特征融合和处理,以便提高检测的准确性和效率;引入GAM注意力机制,以实现更灵活的计算分配和内容感知;通过上诉方法优化yolov8模型,提升模型对小目标的检测能力。


1、本文算法


1.1 网络整体结构

表1 YOLOv8-SNG网络结构

表1为YOLOv8-SNG网络结构。其中,from表示该层的输入层;-1表示上一层;参数量(Params)决定了模型的容量和表达能力,并且直接能够影响模型的性能[4]。

本文在YOLOV8的基础上进行改进,提出了一个适用于药品名称检测的网络模型YOLOv8-SNG。首先,通过引入注意力机制GAM来提高网络的回归精度和优化收敛速度;其次通过引入Slim-Neck替换特征融合层,负责特征融合和处理[5],以便提高检测的准确性和效率,改善对小目标的检测性能。其模型的网络结构如表1、图1所示。

1.2 Slim-Neck替换特征融合层

Slim-neck是一种设计用于优化卷积神经网络(CNN)中“neck”部分的结构。在目标检测器中,“neck”是连接CNN[6]的主干网络(backbone)和头部网络(head)的部分,负责特征融合和处理,以便提高检测的准确性和效率,我们可以将slim-neck的基本原理分为以下几点:

(1) GSConv的引入:GSConv是为了在卷积神经网络(CNN)中加快图像的预测计算,在传统的CNN中,空间信息逐渐转换成通道信息,而这一过程在每一次特征图空间压缩和通道扩张时都会导致语义信息的部分丢失。GSConv在保持较低时间复杂度的同时,尽可能地保留通道之间的隐藏连接[7]。

(2)灵活性:论文提出了需要灵活使用GSCnv、GS瓶颈和VV-GSCSP这四个模块,可以像搭乐高一样构建Slim-neck层。

GSConv的引入是为了解决在卷积神经网络(CNN)预测计算的速度问题。在CNN的骨干网络(backbone)中,输入图像几乎总是经历一个类似的转换过程:空间信息逐步向通道传递[8]。每一次特征图的空间(宽度和高度)压缩和通道扩张都会导致语义信息的部分丢失通道密集型的卷积计算(SC)最大限度地保留了每个通道之间的隐合连接,而通道稀疏的卷积(DSC)则完全切断了这些连接。GSConv尽可能地保持这些连接,并且具有更低的时间复杂度[9]。

图1 YOLOv8-SNG架构

图2展示了Gs Conv模块的结构[10]。

(1)卷积层(Conv):输入特征图首先通过一个卷积层,该层的输出通道数为C2/2。

(2)深度分离卷积层(DWConv):该标记为DWConv,表示深度可分离卷积DSC操作。它对输入特征图的每个通道独立进行卷积。

图2 Gs Conv模块

(3)拼接(Concat):将Conv层和DWConv层的输出进行拼接。

(4)随机排列(Shufle):拼接后的特征图经过一个shufle操作,以重新排列特征通道,提高特征间的信息流动。

1.3 引入GAM注意力机制

GAM保留信息以促进全局跨维度的交互作用,致力于解决在传统注意力机制中可能出现的问题。注意力机制在图像分类任务中的性能改进已经有很多研究。GAM注意力机制能够在减少信息弥散的情况下也能放大全局维交互特征。采用序贯的通道-空间注意力机制并重新设计了CBAM子模块。整个过程如图3所示。

图3 GAM注意力过程

通道注意力子模块使用三维排列来在三个维度上保留信息。然后,它用一个两层的MLP(多层感知器)放大跨维通道-空间依赖性。通道注意力子模块如图4所示。


2、实验结果及分析


本文使用公开数据集Drug Name Detection Dataset进行实验。其中训练集1 276,验证集365,测试集182,总计1 823。YOLOv8-SNG检测效果如图5所示。


3、结束语


本文使用了公开数据集Drug Name Detection Dataset数据集,并提出了一种改进的药品名称检测算法YOLOv8-SNG。该算法针对YOLOv8在药品名称检测方面精度不高、参数量较大等问题,采取了多项改进措施。采用Slim-Neck替换特征融合层,以优化卷积神经网络中neck部分的结构;引入了GAM注意力机制,以提升网络的检测精度;与YOLOv8n相比,经过改进的YOLOv8-SNGm AP@0.5提高了11.9%,m AP@0.5:0.95提高了6.43%。为了进一步提升模型的检测性能并降低复杂度,接下来的工作将继续对模型进行轻量化处理,以希望算法在药品名称检测中表现出更好的性能。

图5 药品名称检测


参考文献:

[1]贵向泉,刘世清,李立,等.基于改进YOLOv8的景区行人检测算法[J/OL].计算机工程,1-11[2024-01-09].

[2]付锦燚,张自嘉,孙伟,等.改进YOLOv8的航拍图像小目标检测算法[J/OL].计算机工程与应用,1-12[2024-01-09].

[3]韩强.面向小目标检测的改进YOLOv8算法研究[D].长春:吉林大学,2023.

[4]张晋瑞.融合时序特征的公路隧道火灾视频检测技术研究[D].西安:长安大学,2023.

[5]王红星,刘青,吴欢娣,等.一种基于Query Det-YOLO的小目标实时检测定位系统[J].南昌工程学院学报,2023,42(6):71-75.

[6]陈新宇,方金生.轻型多注意力融合网络实现图像超分辨率重建[J].闽南师范大学学报(自然科学版),2023,36(4):73-81.

[7]徐仕成,朱子奇.正交约束多头自注意力的场景文本识[J].中国图象图形学报,2023,28(12):3855-3869.


基金资助:张家口市2023年市级科技计划财政资助项目(项目编号:2311010A); 河北省教育厅科学研究项目资助(项目编号:QN2024148); 张家口市2022年基础研究和人才培养计划项目(项目编号:2221008A);


文章来源:郑志豪,赵建光,白瑞瑞.基于改进YOLOv8的药品名称检测算法[J].科学技术创新,2024(12):100-103.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

药学学报

期刊名称:药学学报

期刊人气:8595

期刊详情

主管单位:中国科学技术协会

主办单位:中国药学会,中国医学科学院药物研究所

出版地方:北京

专业分类:医学

国际刊号:0513-4870

国内刊号:11-2163/R

邮发代号:2-233

创刊时间:1953年

发行周期:月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定