2020-06-29
937
上传者:管理员
摘要:目标检测是计算机视觉领域中的重要问题,是人脸识别、车辆检测、路网提取等领域的理论基础。随着深度学习的快速发展,与基于滑窗以手工提取特征做分类的传统目标检测算法相比,基于深度学习的目标检测算法无论在检测精度上还是在时间复杂度上都大大超过了传统算法,本文将简单介绍目标检测算法的发展历程。
加入收藏
目标检测的目的可分为检测图像中感兴趣目标的位置和对感兴趣目标进行分类。目标检测比低阶的分类任务复杂,同时也是高阶图像分割任的重要基础;目标检测也是人脸识别、车辆检测、路网检测等应用领域的理论基础。
传统的目标检测算法是基于滑窗遍历进行区域选择,然后使用HOG、SIFT等特征对滑窗内的图像块进行特征提取,最后使用SVM、AdaBoost等分类器对已提取特征进行分类。手工构建特征较为复杂,检测精度提升有限,基于滑窗的算法计算复杂度较高,此类方法的发展停滞,本文不再展开。近年来,基于深度学习的目标检测算法成为主流,分为两阶段和单阶段两类:两阶段算法先在图像中选取候选区域,然后对候选区域进行目标分类与位置精修;单阶段算法是基于全局做回归分类,直接产生目标物体的位置及类别。单阶段算法更具实时性,但检测精度有损失,下面介绍这两类目标检测算法。
1、基于候选区域的两阶段目标检测方法
率先将深度学习引入目标检测的是Girshick[1]于2014年提出的区域卷积神经网络目标检测模型(R-CNN)。首先使用区域选择性搜索算法在图像上提取约2000个候选区域,然后使用卷积神经网络对各候选区域进行特征提取,接着使用SVM对候选区域进行分类并利用NMS回归目标位置。与传统算法相比,R-CNN的检测精度有很大提升,但缺点是:由于全连接层的限制,输入CNN的图像为固定尺寸,且每个图像块输入CNN单独处理,无特征提取共享,重复计算;选择性搜索算法仍有冗余,耗费时间等。
基于R-CNN只能接受固定尺寸图像输入和无卷积特征共享,He[2]于2014年参考金字塔匹配理论在CNN中加入SPP-Net结构。该结构复用第五卷积层的特征响应图,将任意尺寸的候选区域转为固定长度的特征向量,最后一个卷积层后接入的为SPP层。该方法只对原图做一次卷积,共享卷积层的计算过程,极大提高了速度。SPP-Net的优点:不同尺度候选区域输入能够提高检测精度,共享不同候选区域SPP层前序的计算,提升检测效率。
Girshick[3]于2015年在R-CNN的基础上提出了FastR-CNN,使用ROI(感兴趣区域)池化层代替SPP。原图经过卷积后产生特征响应图,然后从每个ROI池化层中提取定长特征向量,每个特征向量输入到全连接层,分支两个输出层,一个是softmax分类器用来预测类别,另一个用作物体位置定位框回归预测。除候选区域提取外该框架是一种端到端的基于多任务损失函数的一阶段训练过程,节省了存储空间,减少了训练及预测时间且提升了检测精度。但候选区域提取仍沿用老算法,耗费时间,成为瓶颈。
基于FastR-CNN中前序候选区域提取时仍使用区域选择性搜索算法成这点,Ren[4]提出FasterR-CNN模型,使用区域选择网络(RPN)来产生候选区域框,与检测网络共享卷积特征响应,大大减少了计算量,提高检测速度,这也使得FasterR-CNN成为第一个基于深度学习的端到端目标检测算法,在GPU上运行达到5fps的检测速率,具有一定的实时性。但该模型也存在一些缺点,如RPN网络的训练较为耗时;RPN不擅于处理一些极端尺度及形状的目标物体检测。
此外还有R-FCN、FPN、MaskR-CNN等由以上算法衍生的更为优秀的两阶段目标检测算法,本文不再展开。
2、基于全局回归分类的单阶段目标检测方法
两阶段的目标检测算法,虽然检测精度指标较好,但即使实现端到端的FasterR-CNN,也无法满足实时性要求,因此单阶段目标检测算法旨在提升检测实时性。2016年Redmon[5]提出了YOLO,图像经过一个神经网络即可完成目标位置及其所属类别的预测,检测速度达到45fps,但检测精度不高。后续Redmon[6]提出了YOLOv2,与YOLO相比卷积层后加入了批归一化、去掉全连接层进行多尺度训练、加入先验框等,使得能够检测种类更多、精度更高且时间更快。2018年,Redmon[7]提出了YOLOv3,该框架使用新的网络结构Darknet-53,利用多尺度进行目标检测,使用逻辑回归代替softmax分类器,使检测精度较之前版本提高,且对小目标的检测效果比前述版本好。最近,Bochkovskiy[8]提出了YOLOv4,加入SPPblock来改善感受域大小,使用PANet代替FPN进行多通道特征融合,选用CSPDarknet53作为主干网络,使得检测精度与速度进一步提升。
此外还有SSD、FPN、RefineDet、RetinaNet、CornerNet等优秀的单阶段目标检测算法,本文不再展开。
3、结语
本文作为一篇目标检测方法的简要综述,首先介绍了该研究的背景与意义,后分为两阶段和单阶段的基于深度学习的目标检测方法进行介绍。现阶段后者的实时性明显优于前者,检测精度也在不断提升,但前者在检测精度上仍有优势,检测效率也在不断优化,不同应用场景可分别尝试这两类算法进行对比和应用。
栗佩康,袁芳芳,李航涛.目标检测方法简要综述[J].科技风,2020(18):157.
分享:
目前,我国采取的粮食储备方案主要包括中央储备、地方储备、农户储备和粮食流通企业储备4种。其中,农户储备的数量占比超过了一半,但农户在粮食储存过程中的损失率也高达约8%,导致每年粮食损耗达到2 000万吨。另外,粮库的储备损失率在5%左右。如果将损失率降低到2%左右,那么每年至少可以多获取几百亿斤粮食。
2025-01-07互联网技术的深入发展,促进了无线通信网络在各个领域的广泛应用,在不同的环境下,改变无线通信网络中的节点分布,搭建符合通信逻辑的层级链路结构,确保指定信息的有效交换。随着人们开始依靠无线通信进行信息交换,通信的安全性和可靠性越来越受到重视。
2024-09-19随着社会的发展,垃圾数量逐年增加。2016—2019年,全国大、中城市生活垃圾产生量年均增长率超过7.7%。随着垃圾产生量的增多,垃圾分类处理变得尤为重要,合理的分类处理方法将直接影响垃圾回收的价值和垃圾处理的效率。当前,我国垃圾分类制度不够完善,人们的垃圾分类意识也较淡薄,缺乏分类的主动性。
2024-07-22随着我国经济的快速发展,人民的生活水平日渐提高,越来越多的人喜欢在家饲养宠物,但因工作需要,可能长期不在家,无法做到及时投喂,从而影响宠物的健康。现有的宠物饲养大多采用一次性投喂足量的食物和水等方式,使食物长期暴露在室外,容易造成细菌感染,也极易造成宠物暴饮暴食,影响宠物健康。
2023-12-19在我国电网企业中,人力资源的合理管理对于高效培养专业领域人才、提高整体资源利用率以及更好地发挥其最高能效均具有重要意义。但由于存在海量的复杂数据,传统的人力资源管理系统无法对相关数据进行准确地分析与判断,因而也无法充分利用各种信息系统所收集的大量数据。
2023-11-02随着计算机网络技术的持续发展,对计算机网络人性化和智能化的需求也更高。但是,因为计算机网络信息安全问题时有发生,网络技术发展还在不断完善,合理使用人工智能技术能够对网络信息进行智能化的绑定和跟踪,使计算机网络信息安全管理工作得以顺利开展进。因此,将人工智能应用到计算机网络技术中尤为重要。
2023-09-15随着网络与信息的交互发展,可穿戴电子设备凭借其诸多便捷实用的功能逐渐应用到人类生活的各个领域。为满足可穿戴电子设备功能的需要,设备对供电装置的性能提出了更高的要求,而传统电池供电方式会带来电池体积增大、质量增重等问题。因此,需要一种新的供电方式来更好地解决设备供电装置的持续供能问题。
2023-09-12基于物联网的智能热网系统应采用B/S架构建设,其中包括数据感知层、数据管理层、数据访问层、业务逻辑层、表示层与终端访问层。数据感知层包括数据集中器、智能仪表等物联网设备,用于收集数据,远程监控。数据管理层包括热力站上位机,用于采集数据,发送控制信号,并对数据进行集中处理。
2023-08-29常见的空气质量检测设备功能单一,各个传感器都是独立、分立的,只能检测一种到两种的空气质量数据,无法多样化检测空气质量浓度数据,没有和云网络平台进行连接,无法远程传输数据。近几年,国内外的研究者对空气质量检测展开了深度研究,其中,文献通过融合多种室内空气质量数据,输出室内火灾发生概率,提出了一种室内火灾预警算法。
2023-08-25随着产业技术复杂度的日益提升,越来越多的创新主体开始突破组织边界,通过开展合作来获取互补性创新资源、降低创新的风险和复杂性,合作创新已经成为组织开展创新活动的重要形式[1]。新能源汽车产业是我国战略性新兴产业之一,由于该产业具有技术更新速度快、创新难度大以及技术溢出效应等特征,合作研发成为该产业技术创新的重要形式。
2023-08-23人气:5468
人气:5205
人气:4385
人气:3389
人气:3117
我要评论
期刊名称:计算机应用与软件
期刊人气:3650
主管单位:上海市科学院
主办单位:上海市计算技术研究所,上海计算机软件技术开心中心
出版地方:上海
专业分类:计算机
国际刊号:1000-386X
国内刊号:31-1260/TP
邮发代号:4-379
创刊时间:1984年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.079
影响因子:0.408
影响因子:0.260
影响因子:0.727
影响因子:0.489
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!