摘要:针对当前药品名称检测存在检测精度低、算法参数量大和现有公开数据集在小目标检测上存在限制等问题,并基于YOLOv8算法,提出了一种结合Slim-Neck替换特征融合层、GAM注意力机制的检测精度高、硬件要求低的新模型YOLOv8-SNG。使用Drug Name Detection Dataset数据集验证算法的有效性。实验结果表明,与YOLOv8相比,在Drug Name Detection Dataset数据集上FPS少量上涨的情况下,mAP@0.5提高了11.9%,mAP@0.5:0.95提高了6.43%;改进后的算法具有更强的泛化性能,能够更好的适用于药品名称检测任务。
加入收藏
药品名称检测在药物安全管理建设中扮演着重要角色,该技术已广泛应用于智能药品监控和药品管理等领域。药品名称检测利用计算机视觉技术对药物包装中的名称信息视频或图像进行分析,旨在准确识别出药品的名称,促进开发专门为药物标签分析量身定制的准确和健壮的目标检测模型。
药品名称检测注重处理单一目标类别的多尺度和遮挡问题,与目标检测相比,后者需要应对多个目标类别的多尺度、遮挡和复杂场景。早期的药品名称检测方法主要采用手工设计的特征和传统机器学习算法,如定向梯度直方图(HOG)和线性支持向量机(SVM)。然而,这些方法在复杂场景下的鲁棒性和准确性上存在限制[1]。
近年来,药品名称检测领域涌现了许多改进和优化的方法,包括基于注意力机制的方法、轻量化网络设计和多尺度特征融合等。这些方法不断推动药品名称检测性能和效果的进一步提升。YOLO (You Only Look Once)是由Joseph Redmon等人开发的一种端到端的目标检测方法,通过单个神经网络完成检测任务。其通过多次迭代不断改进以克服限制并提高性能,这种持续的改进使得YOLO在目标检测领域取得了显著突破[2]。但其在药品名称检测中存在参数量大、对硬件要求高、检测精度低等问题。
本文数据集来源为Kaggle[3]网站中的公开数据集Drug Name Detection Dataset,该数据集涵盖了来自各种制造商和包装风格的广泛药品。它包括药瓶、吸塑包装、小瓶和医疗保健行业中常见的其他包装格式的图像。
药物名称检测数据集由1 823张带有注释的药物名称标签的图像组成,是药物标签分析领域中训练和评估计算机视觉模型的宝贵资源。通过利用该数据集,研究人员和从业人员可以推进准确高效的药物名称检测系统的开发,有助于改善医疗保健行业的药物管理和患者安全。
本文旨在解决药品名称检测中YOLOv8检测精度较低的问题。首先,使用Drug Name Detection Dataset数据集,并在YOLOv8的基础上,利用Slim-Neck替换特征融合层,用于优化卷积神经网络中neck部分的结构,负责特征融合和处理,以便提高检测的准确性和效率;引入GAM注意力机制,以实现更灵活的计算分配和内容感知;通过上诉方法优化yolov8模型,提升模型对小目标的检测能力。
1、本文算法
1.1 网络整体结构
表1 YOLOv8-SNG网络结构
表1为YOLOv8-SNG网络结构。其中,from表示该层的输入层;-1表示上一层;参数量(Params)决定了模型的容量和表达能力,并且直接能够影响模型的性能[4]。
本文在YOLOV8的基础上进行改进,提出了一个适用于药品名称检测的网络模型YOLOv8-SNG。首先,通过引入注意力机制GAM来提高网络的回归精度和优化收敛速度;其次通过引入Slim-Neck替换特征融合层,负责特征融合和处理[5],以便提高检测的准确性和效率,改善对小目标的检测性能。其模型的网络结构如表1、图1所示。
1.2 Slim-Neck替换特征融合层
Slim-neck是一种设计用于优化卷积神经网络(CNN)中“neck”部分的结构。在目标检测器中,“neck”是连接CNN[6]的主干网络(backbone)和头部网络(head)的部分,负责特征融合和处理,以便提高检测的准确性和效率,我们可以将slim-neck的基本原理分为以下几点:
(1) GSConv的引入:GSConv是为了在卷积神经网络(CNN)中加快图像的预测计算,在传统的CNN中,空间信息逐渐转换成通道信息,而这一过程在每一次特征图空间压缩和通道扩张时都会导致语义信息的部分丢失。GSConv在保持较低时间复杂度的同时,尽可能地保留通道之间的隐藏连接[7]。
(2)灵活性:论文提出了需要灵活使用GSCnv、GS瓶颈和VV-GSCSP这四个模块,可以像搭乐高一样构建Slim-neck层。
GSConv的引入是为了解决在卷积神经网络(CNN)预测计算的速度问题。在CNN的骨干网络(backbone)中,输入图像几乎总是经历一个类似的转换过程:空间信息逐步向通道传递[8]。每一次特征图的空间(宽度和高度)压缩和通道扩张都会导致语义信息的部分丢失通道密集型的卷积计算(SC)最大限度地保留了每个通道之间的隐合连接,而通道稀疏的卷积(DSC)则完全切断了这些连接。GSConv尽可能地保持这些连接,并且具有更低的时间复杂度[9]。
图1 YOLOv8-SNG架构
图2展示了Gs Conv模块的结构[10]。
(1)卷积层(Conv):输入特征图首先通过一个卷积层,该层的输出通道数为C2/2。
(2)深度分离卷积层(DWConv):该标记为DWConv,表示深度可分离卷积DSC操作。它对输入特征图的每个通道独立进行卷积。
图2 Gs Conv模块
(3)拼接(Concat):将Conv层和DWConv层的输出进行拼接。
(4)随机排列(Shufle):拼接后的特征图经过一个shufle操作,以重新排列特征通道,提高特征间的信息流动。
1.3 引入GAM注意力机制
GAM保留信息以促进全局跨维度的交互作用,致力于解决在传统注意力机制中可能出现的问题。注意力机制在图像分类任务中的性能改进已经有很多研究。GAM注意力机制能够在减少信息弥散的情况下也能放大全局维交互特征。采用序贯的通道-空间注意力机制并重新设计了CBAM子模块。整个过程如图3所示。
图3 GAM注意力过程
通道注意力子模块使用三维排列来在三个维度上保留信息。然后,它用一个两层的MLP(多层感知器)放大跨维通道-空间依赖性。通道注意力子模块如图4所示。
2、实验结果及分析
本文使用公开数据集Drug Name Detection Dataset进行实验。其中训练集1 276,验证集365,测试集182,总计1 823。YOLOv8-SNG检测效果如图5所示。
3、结束语
本文使用了公开数据集Drug Name Detection Dataset数据集,并提出了一种改进的药品名称检测算法YOLOv8-SNG。该算法针对YOLOv8在药品名称检测方面精度不高、参数量较大等问题,采取了多项改进措施。采用Slim-Neck替换特征融合层,以优化卷积神经网络中neck部分的结构;引入了GAM注意力机制,以提升网络的检测精度;与YOLOv8n相比,经过改进的YOLOv8-SNGm AP@0.5提高了11.9%,m AP@0.5:0.95提高了6.43%。为了进一步提升模型的检测性能并降低复杂度,接下来的工作将继续对模型进行轻量化处理,以希望算法在药品名称检测中表现出更好的性能。
图5 药品名称检测
参考文献:
[1]贵向泉,刘世清,李立,等.基于改进YOLOv8的景区行人检测算法[J/OL].计算机工程,1-11[2024-01-09].
[2]付锦燚,张自嘉,孙伟,等.改进YOLOv8的航拍图像小目标检测算法[J/OL].计算机工程与应用,1-12[2024-01-09].
[3]韩强.面向小目标检测的改进YOLOv8算法研究[D].长春:吉林大学,2023.
[4]张晋瑞.融合时序特征的公路隧道火灾视频检测技术研究[D].西安:长安大学,2023.
[5]王红星,刘青,吴欢娣,等.一种基于Query Det-YOLO的小目标实时检测定位系统[J].南昌工程学院学报,2023,42(6):71-75.
[6]陈新宇,方金生.轻型多注意力融合网络实现图像超分辨率重建[J].闽南师范大学学报(自然科学版),2023,36(4):73-81.
[7]徐仕成,朱子奇.正交约束多头自注意力的场景文本识[J].中国图象图形学报,2023,28(12):3855-3869.
基金资助:张家口市2023年市级科技计划财政资助项目(项目编号:2311010A); 河北省教育厅科学研究项目资助(项目编号:QN2024148); 张家口市2022年基础研究和人才培养计划项目(项目编号:2221008A);
文章来源:郑志豪,赵建光,白瑞瑞.基于改进YOLOv8的药品名称检测算法[J].科学技术创新,2024(12):100-103.
分享:
通过将聚甲基丙烯酸甲酯(polymethylmethacrylate,PMMA)骨水泥注入塌陷的椎体内,可恢复椎体的正常高度和刚度,防止椎体进一步塌陷和畸形,缓解患者疼痛。然而,骨水泥渗漏仍是PVP和PKP治疗椎体压缩性骨折,尤其是骨壁破损型椎体骨折的常见并发症之一[3],可能导致脊髓、神经根受压及热损伤等严重不良后果[4-5]。
2025-08-19肺动脉高压(pulmonaryhypertension,PH)是一种慢性进行性疾病,定义为静息状态下经右心导管测量发现平均肺动脉压(meanpulmonaryarterypressure,mPAP)>20mmHg,常以PAP增高和肺血管阻力(pulmonaryvascularresistance,PVR)进行性升高为特征,并会引起肺血管床减少、肺血管重塑、肺血管收缩和原位血栓形成,导致PAP持续升高。
2025-08-14AF的病理生理学机制十分复杂,涉及多种因素之间的动态相互作用,包括心房重构、炎症、自主神经功能失衡等[2]。心房纤维化常见于AF、心力衰竭、心脏瓣膜疾病、高血压等心血管疾病[3],其中与AF关系最为密切。心房纤维化是AF的重要病理基础,而AF是心房纤维化的临床表现之一[4]。
2025-07-16维立西呱是2021年1月获得美国食品药品监督管理局(FDA)批准上市的一种口服可溶性鸟苷酸环化酶(sGC)调节剂[1],该药是首个用于治疗心力衰竭的sGC直接刺激剂,通过恢复NO-sGC-cGMP信号通路实现多个靶器官保护,改善心肌和血管功能,预防甚至逆转左室肥厚和纤维化,减缓心室重构,通过舒张全身和肺血管减轻心室后负荷[2]。
2025-06-16有研究表明,头孢哌酮舒巴坦对流感嗜血杆菌、大肠埃希菌、不动杆菌的抗菌活性为单独使用头孢哌酮的4倍[1]。头孢哌酮舒巴坦的不良反应主要为凝血功能障碍及血小板计数(PLT)减少,主要机制为抑制肠道内维生素K依赖的凝血因子的形成,从而导致其缺乏,引起凝血功能指标的异常,严重可导致消化道出血、血尿及皮下、齿龈出血等。
2025-06-13本文基于中国药典无菌检查法[7],系统探讨了特殊剂型药品无菌检查方法学的技术瓶颈与解决策略。重点从关键参数优化、特殊剂型特异性方法学构建及快速微生物检测技术的应用三个维度展开论述,以期为特殊剂型药品无菌检查方法的建立及质量控制提供参考。
2025-05-23头孢菌素是临床上最为常用的抗菌药物,对绝大多数感染菌敏感,应用范围广泛。该药物属于有毒性药物,尽管毒性相对较低,但因应用人数较多,导致药品不良反应发生率较高。药品不良反应的发生显著影响了患者的临床治疗,且会增加治疗成本,还可能引发其他治疗风险或疾病,基于此,临床认为针对头孢菌素需应用合理方案降低不良反应发生率。
2025-05-15随着头孢菌素类药物的广泛应用,因其导致的不良反应越来越明显,这类药物深受医学界的重视。该类药物常见不良反应有神经系统反应、过敏反应、血液系统反应和胃肠道反应等,甚至对患者生命造成严重威胁[2]。诸多不良反应类型中,过敏反应较为常见,具有荨麻疹、皮疹及瘙痒等症状,严重时可能导致过敏性休克。
2025-04-28谵妄是重症监护病房(ICU)机械通气老年患者常见的并发症,发病率较高,且对患者预后产生严重影响[1]。有研究发现,谵妄延长了患者ICU停留时间和住院时间,与患者病死率的增加密切相关[2]。因此,及时诊断和治疗对于降低并发症发生率、改善患者预后具有重要意义。
2025-04-11小儿豉翘清热颗粒对儿童风热感冒治疗作用明显,其中富含许多中药成分,包括清热解毒、消痈散疖的连翘,解表、解毒、宣郁的淡豆豉,清利头目、疏肝解郁的薄荷,发表散风、透疹消疮的荆芥,泻火除烦、清热利湿的炒栀子等,不仅可疏风解表,还可清热导滞。
2025-03-21人气:13842
人气:9759
人气:8957
人气:8209
人气:8065
我要评论
期刊名称:药学学报
期刊人气:8595
主管单位:中国科学技术协会
主办单位:中国药学会,中国医学科学院药物研究所
出版地方:北京
专业分类:医学
国际刊号:0513-4870
国内刊号:11-2163/R
邮发代号:2-233
创刊时间:1953年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.392
影响因子:0.709
影响因子:1.360
影响因子:0.840
影响因子:1.980
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!