摘要:新型冠状病毒(COVID—19)可以通过呼吸道飞沫等方式传播,自然场景中的遮挡、密集、小尺度等复杂因素会对口罩检测任务产生影响。针对以上问题,采用MobileNetV2网络作为全文的主干网络提取面部特征,构造特征金字塔,并结合视觉注意力机制,提出了一种口罩检测新算法,以实现在复杂场景下检测口罩佩戴情况的目标。算法利用空间注意力机制处理浅层特征,强化面部区域,利用通道注意力机制学习高层语义特征分布并强化语义信息,从而提高面部区域检测精度。实验结果表明:该算法在有遮挡、密集和小尺度的场景下取得了较高的精度,而且能够实时对视频进行口罩检测,鲁棒性较好。
加入收藏
引言
自2019年12月以来,新型冠状病毒(COVID—19)[1,2,3]以极快的速度蔓延到全球众多国家。在公共场合佩戴口罩可以有效降低被病毒感染的风险。检测人脸佩戴口罩算法实际上是人脸检测算法[4]和口罩佩戴分类算法的结合体。随着深度学习的发展,基于神经网络的目标检测算法[5]和目标分类算法已经比较成熟。Girshick R等人[6]提出目标检测算法区域卷积神经网络(R-CNN),将候选区域和卷积神经网络(CNN)结合。He K等人[7]提出了空间金字塔池化网络(SPP-Net),该算法避免了R-CNN反复使用CNN计算特征的缺点,无需对图像进行剪切,减少了图像底层信息的丢失。但其将回归和分类分为多个阶段,使得网络占据了非常多的硬件资源。针对SPP-Net存在的问题,Girshick R等人[8]提出快速R-CNN(Fast R-CNN),采用感兴趣区域池化(ROI pooling)将特征变为感兴趣区域(ROI)特征,输入到全连接层进行目标分类。该网络减少了硬件缓存,使检测速度大幅度提高,但其无法将特征图(feature map)与原像素精准对齐,且无法满足实时检测的需求。R-CNN系列网络虽然在检测精度上有一定的优势,但这些网络检测效率低,速度慢。针对这些问题,Redmon J等人[9]提出YOLO检测模型,采用回归的方式替代候选区域,检测速度得到了大幅提升。该模型使用置信度最高的边界框作为最终的输出,在检测相邻群体或小目标群体时效果不理想,检测精度较低。为了提高检测精度,解决训练过程中出现的类不平衡问题,Lin T Y等人[10]提出RetinaNet检测模型,该模型主要通过重塑标准交叉熵损失来解决类不平衡问题,提高检测精度,但其检测速度较慢。为了进一步提高检测精度,Deng J等人[11]基于RetinaNet网络设计了一种鲁棒的单级人脸检测算法RetinaFace,利用联合监督和自我监督的多任务学习,在各种人脸尺度上执行像素方面的人脸定位,采用特征金字塔技术,实现多尺度信息融合,提高检测精度。牛作东等人[12]将RetinaFace应用在人脸口罩检测领域,提出改进RetinaFace自然场景口罩佩戴检测算法,但该算法在复杂场景下检测效果不佳,而且在自然场景视频中检测精度也不理想。王艺皓等人[13]提出基于改进的YOLOv3[14]的口罩佩戴检测算法,对骨干网络模型进行改进,降低了计算损耗,但在人脸密集和小尺度的场景下,效果也不理想。
针对现有口罩检测遇到的在复杂场景不能实时检测,以及在人脸密集和小尺度的场景下,不能有效提取面部口罩特征的问题,本文利用MobileNetV2[15]算法轻量级网络的优点,以其作为骨干网络,使用MobileNetV2中的瓶颈(bottleneck)构造金字塔结构,利用空间注意力机制处理浅层特征,强化面部区域,利用通道注意力机制学习高层语义特征分布并强化有用语义信息,从而达到提高面部口罩区域检测精度的目的。
1、总体框架
1.1 MobileNetV2算法
MobileNetV2是在MobileNetV1[16]基础上提出的CNN架构,该算法保留了MobileNetV1的深度可分离的操纵方式,并在此基础上加入了宽度乘法器α以及分辨率乘法器ρ,将需要的特征信息集中起来,保持在一个相对较窄的纬度当中。而且该算法借鉴了残差网络(ResNet)[17]中的残差块(residual block),设计了一种反向残差块(inverted resi-dual block)方式(如图1所示)。在结构上,二者皆使用大小为1×1→3×3→1×1的卷积核进行卷积操作。在Inverted Residual block中的第二个1×1卷积后,用Linear激活函数代替ReLU6[18]减小特征的损失,保证模型的表达能力。该结构极大缓解了CNN随着网络层数加深导致的梯度消失或爆炸问题,实现了深层次CNN的训练,提高了准确率。
图1 MobileNetV2在不同步长下的卷积过程
MobileNetV2对于不同步长的卷积有不同的操作(如图1所示),当步长为1时,在卷积过程中使用跳跃连接(skip connection);当步长为2时,卷积过程中不使用skip connection。
1.2注意力模型
注意力机制(attention mechanism)[19]被广泛应用于机器翻译、自然语言处理、图像和视频等领域[20,21]。图2为SE-Net(squeeze-and-excitation networks)[22]提出的模块示意。对于给定的输入特征图X,其特征通道数为C′,特征图尺寸为H×W,通过深度CNN变换后得到特征图U,其特征通道数为C。与传统的CNN不同,SE-Net还需通过下述3步来重新标定特征U。1)Squeeze操作,通过全局平均池化(global average pooling)对每个通道进行空间维度上的特征压缩,将二维特征(H×W)压缩为一个实数,该实数由完整的二维特征计算得到,所以在某种程度上具有全局的感受野;在此期间,其通道数保持不变。特征图U通过Squeeze操作后变为一个向量(1×1×C)。2)Excitation操作,通过简单门控机制为每个特征通道生成权重值。其中,参数组W通过全连接层和非线性激活函数学习得到,可以明显地表示特征通道间的相关性。3)Scale操作,将Excitation操作得到的归一化权重加权到每个特征通道上。这一步充分体现了通道注意力机制的思想,将归一化权重看作是通过特征选择后的每个通道的重要程度,最后通过乘法将权重与特征图U相乘,完成特征重标定。
图2 SE-Net结构
1.3基于注意力的MobileNetV2口罩识别算法
本文在MobileNetV2的Bottleneck模块构造金字塔结构,网络结构如3所示。
图3改进后的MobileNetV2网络结构
在人脸密集和小尺度场景下,口罩区域在像素空间向特征空间映射时,缺少特征点之间的互相联系,而浅层特征中含有丰富的细节信息,为了加强每个浅层特征点之间的互相联系,强化口罩区域的特征并且抑制其余面部特征,在浅层特征提取网络中引入空间注意力机制。特征映射过程中,网络高层特征含有非常明确的语义信息,每个特征通道都具有特定的表征能力,为了加强口罩区域通道特征,抑制其余通道特征,引入通道注意力机制。在网络不同位置使用空间和通道注意力机制,使网络可以学习高级语义分布,并强化所需要的口罩区域语义特征,去除冗余的特征。对于得到的最终特征利用训练好的面部检测器提取人脸框并分割出来,然后对分割区域进行二分类,以判断面部是否带有口罩并标注。
2、实验
本文实验在Ubuntu系统上进行,使用TensorFlow框架训练模型。训练使用内存32 GB,配备GTX2080Ti显卡的工作站。为了使损失降到最低,使用Adam优化器,学习率、批量大小分别设置为1×10-3,12。
2.1数据集和评价指标
本文使用MobileNetV2网络融合注意力机制构建网络模型框架,使用武大研究所和网上搜集的口罩数据作为训练数据进行模型训练。具体步骤如下:1)数据集清洗:搜集到的数据往往是来自互联网,且通常是一些含有大量噪声的数据,如非同一人脸、模糊人脸、多人脸以及角度过大人脸图像等。2)数据集扩充:如图4所示的高质量人脸图像是经过清洗过后的数据集。本文在训练之前会对数据集进行随机裁剪、旋转以及镜像等操作来扩充数据集,目的是增强样本的多元化与多样性,使模型的泛化能力有所提高,以防止在训练中出现过拟合现象。3)划分数据集:随机打乱以文件夹为基本单位的数据集,之后将训练集、验证集和测试集按照85 %,5 %以及10 %的比例进行划分。4)模型构建与训练:使用MobileNetV2网络融合注意力机制构建网络模型,并使用TensorFlow框架进行训练。
图4清洗过后的高清图像
为了评估本文所提检测算法的性能,引入以下指标,正确预测正样本(true positive, TP)、错误预测正样本(false positive, FP)、正确预测负样本(true negative, TN)、错误预测负样本(false negative, FN)、精度(precision, P)、召回率(recall, R)、平均精度(average precision, AP)、平均精度均值(mean average precision, mAP),计算公式如下
2.2实验结果与分析
由图5数据可知,模型对于单人口罩检测精度较高。
图5单人口罩检测结果
本文进行了多人的测试,由图6的数据可知,提出的模型依然保持着很高的精度。
图6多人及密集人群口罩检测结果
对于特殊情况,如:捂口、遮嘴等,都会被误认为戴口罩,因此本文也进行了特殊情况下的口罩检测实验,如图7所示,检测结果也较为准确。
图7特殊情况的口罩检测结果
在视频中进行了测试,如图8中所示,本文算法可以有效地对视频中人脸口罩佩戴情况进行检测。此外,自然场景中实时监控口罩检测效果,本文利用一个外接摄像头进行实时检测,最终检测效果良好,如图9所示。
图8自然场景下的视频口罩检测结果
图9自然场景下的实时口罩检测结果
表1为本文方法与现有人脸口罩检测算法的比较,其中,Face为人脸识别精度,Mask为口罩识别精度,mAP为平均精度均值。
表1实验对比数据%
从表1中可以发现,本文算法对于人脸佩戴口罩检测相较于其他方法更具优势。与RetinaFace算法以及Attention-RetinaFace算法相比,本文算法AP值分别提升了21.3 %和13.1 %,mAP值分别提升了12.3 %和16.5 %;与YOLOv3算法以及Improve YOLOv3算法相比,本文算法AP值分别提升了17.3 %和2.4 %,mAP值分别提升了15.1 %和4 %。
3、结论
本文以MobileNetV2算法为基础,解决了复杂场景下人脸口罩佩戴检测任务中存在的遮挡、密集人群等问题,提出了一种MobileNetV2与注意力机制相融合的算法。从以上数据可以看出,本文提出的模型可以较为准确地检测人脸口罩佩戴情况。此外,本文提出的模型对于不同场景下的人脸口罩佩戴检测都有较为理想的效果,具有较强的泛化能力,所以本文方法具有一定的研究意义与应用价值。
参考文献:
[1]赵文明,宋述慧,陈梅丽,等.2019新型冠状病毒信息库[J].遗传,2020,42(2):212-221.
[2]牛作东,覃涛,李捍东,等.改进RetinaFace的自然场景口罩佩戴检测算法[UJ.计算机工程与应用,2020,56(12):1-7.
[3]王艺皓,丁洪伟,李波,等.复杂场景下基于改进YOLOv3的口置佩戴检测算法[J.计算机工程,2020,46(11):12-22.
基金资助:国家自然科学基金青年科学基金资助项目(61801286);
文章来源:郭松,尹明臣.基于MobileNetV2的自然场景口罩检测算法[J].传感器与微系统,2023,42(09):137-140.
分享:
水生生态系统的生物多样性极其丰富,但传统调查手段在面对微小、稀有或生长阶段差异明显的物种时,往往捉襟见肘,难以有效获取科学数据。尤其是在湖泊资源调查中,这些问题尤为突出。针对浮游生物,现有方法通常采用特制网具进行捕捞和浓缩,然后再进行识别。然而,这种方法不仅操作烦琐,而且容易造成样品损伤,影响鉴定精度。
2024-11-14全媒体以其独特的优势,如信息传播的高效性、互动性以及形式的多样性,深刻影响着社会的各个方面。在这个时代背景下,公众生态环境素养的重要性日益凸显。生态环境素养不仅关乎个人的生活方式和态度,更是生态文明建设不可或缺的组成部分,对实现可持续发展具有深远影响。
2024-11-14微生物作为土壤较活跃的组成部分之一,在维持土壤生态系统功能方面发挥重要的作用。金属矿产开采、化石燃料燃烧以及工农业生产排放等,可能会导致部分土壤、水体等环境受到重金属污染的威胁。据调查,部分地区土壤污染以毒性大、残留周期长的镉、砷和铜等重金属污染为主。
2024-11-13伊春地处小兴安岭腹地,是我国重点国有林区、国家主体生态功能区、东北的天然生态屏障和全球生态系统的重要组成部分,黑龙江、松花江、嫩江三大水系及其主要支流的重要源头和水源涵养区,同时也是我国极为重要的碳储库和碳纳库,生态区位极为重要。森林生态系统和湿地生态系统,是陆地上非常重要的两大生态系统。
2024-08-07废水中氮的去除主要采用传统的硝化-反硝化生物脱氮工艺,但是该工艺在处理高氨氮、低碳氮比的废水时往往存在需补加碳源、曝气量大以及微生物活性受抑制等问题,大幅提升了废水的处理成本以及处理难度。在垃圾处理行业中,垃圾填埋场渗滤液、餐厨沼液属于典型的高氨氮、低碳氮比废水,难以直接进行生化处理。
2024-08-0120世纪中后期,西方学者提出的“生态环境保护”与“荒野生态伦理思想”是对“社会发展”与“自然”对立情况的反思。2007年英国谢非尔德大学主办了一次“城市中的荒野”主题学术研讨会,会议中首次提出“城市荒野景观”这一概念。其中安娜•乔根森对其进行初步的解释与定义:“城市荒野景观”是指城市中以自然而非人为主导的土地。
2024-07-25衡水湖是由古黄河、漳河、滹沱河、滏阳河等多条河流冲刷积水而成,目前水域面积75 km2,由人工堤将其分为东湖和西湖两部分,总库容1.88亿m3,水源主要靠引黄河水补给,目前蓄水量7000万m3。衡水湖主要有四个特点:一是生态的稀缺性。衡水湖是华北平原单体面积最大的淡水湖。
2024-07-22新时代人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾成为我国社会的主要矛盾,对此,习近平总书记指出,“人民美好生活需要日益广泛,不仅对物质文化生活提出更高要求,而且在民主、法治、公平、正义、安全、环境等方面的要求日益增长”。由此可见,追求生态公平是实现人民美好生活的应有之义。
2024-07-22高速公路建设过程中,不可避免进行自然山体开挖,干扰破坏路域生态环境。边坡生态防护技术在设计、施工时大量采用植被修复边坡生态,植被根系对边坡坡面土壤层提供了良好的“固结”作用,具有抗降雨冲刷性强、土壤营养成分流失率低等优点,是一种绿色、环保、经济的实用防护措施。
2024-07-05延庆区地处北京西北部,是首都生态涵养区。平均海拔500米以上,气候独特,冬冷夏凉,素有北京“夏都”之称。近年来,延庆区始终以习近平生态文明思想为指引,牢记习近平总书记“延庆是属于未来的”重要嘱托,用实际行动推动党的二十大精神在妫川大地落地生根、开花结果,形成生动实践,以“绿色”推动“最美冬奥城”高质量发展,书写人与自然和谐共生的美丽答卷。
2023-10-31人气:4337
人气:3702
人气:2629
人气:2568
人气:2314
我要评论
期刊名称:生物学杂志
期刊人气:5015
主管单位:安徽省科学技术协会
主办单位:合肥市科学技术协会
出版地方:安徽
专业分类:生物
国际刊号:2095-1736
国内刊号:34-1081/Q
邮发代号:26-50
创刊时间:1983年
发行周期:双月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.343
影响因子:1.227
影响因子:1.286
影响因子:0.000
影响因子:1.349
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!