摘要:基于深度学习的快速发展,以及高性能嵌入式设备的应用,对基于深度卷积神经网络的目标检测算法在无人驾驶领域的融合应用进行了说明。通过对两类分别基于候选区域和回归的目标检测算法的研究,提出了YOLO实时目标检测系列算法在交通道路上对于目标检测的应用过程示例,认为采用基于回归算法模型的车辆能具备更好的道路标识识别能力,提供了车辆无人驾驶行为决策的基础。
加入收藏
环境感知、行为决策以及动力控制三大模块大体组成无人驾驶车辆系统的总体架构。其中无人车“智能”的核心模块是行为决策。动力控制模块对无人车进行运动控制的基准来自于行为决策模块对周围环境及自车信息的综合[1],因此可以说行为决策模块是无人车的大脑。组成行为决策模块的方法主要有两大类,一类是基于规则的行为决策方法,例如有限状态机法,此方法的优点有逻辑清楚、实用性强等;另一类是基于深度学习的决策方法[2]以及基于决策树[3],支持向量机(SVM)[4]等机器学习的决策方法。由于不同道路的环境差异较大,而基于规则的行为决策模型泛化能力差,因此难以满足车辆在随机道路上行驶时所产生的复杂决策,基于深度学习的决策方法,在经过海量道路数据训练后的网络模型能达到较高的泛化能力以及极强的灵活性,因而现在多在实际落地场景中被采用。但是无论采用哪种决策方法,其决策质量的好坏极大程度取决于车辆感知层输入数据的好坏。
一般来说,感知层的数据来源有三大部分:(1)基于雷达、摄像头等车载传感器所获得的局部环境信息。(2)基于GPS、SLAM [5]等方法获取的自车定位信息。(3)地理地图信息和任务信息[6]。其中实时反映无人车运行状况的信息为基于雷达、摄像头等获取的局部环境信息。而车载激光雷达有对远距离小目标的探测效果不佳、信息处理量体积大等缺陷,又因为深度学习方法对图像处理有着独特的优越性,因此现阶段无人车对于上述任务的完成多使用单/双摄像头来实现。通过从摄像头得到原始图像数据直接传递给深度卷积神经网络算法模型,网络模型将对图像信息进行处理,提取出其中丰富的图像特征以及语义信息后输出。本文通过对比两类应用于目标检测算法的卷积神经网络模型,提出YOLO实时目标检测系列算法在交通道路上对于目标检测的应用过程示例,为下层决策系统提供准确的数据基础。
1、目标检测算法模型
目标检测是计算机视觉领域一个热点任务,其目的是在图像数据中找出目标物体的位置边框以及对目标物体的所属类别进行分类[7]。如今目标检测相关算法已经被应用于各行各业之中。例如在车辆无人驾驶领域被应用于道路检测[8]、行人检测[9]、交通异常事件检测[10]等;在医药领域被用于医药空瓶表面气泡检测[11]、对牙龈炎早期迹象的预防检测[12]、对病人进行医学诊断[13]等,事实上目标检测神经网络模型还在安检安防领域[14,15,16,17],光学遥感领域[18,19,20]有着较为广泛的应用。
大体来说,目标检测算法根据是否提前生成候选框而分为两大类。一类是传统的目标检测算法,一类是基于深度学习的目标检测算法。传统目标检测算法往往通过人工设计的特征来选择生成候选框,这导致了在网络的训练过程中会产生很多冗余的窗口,整体计算步骤繁多,造成网络的检测速度慢,实时性差[21]。基于深度学习的目标检测算法省去了提前生成候选框这一步骤,而将对图像数据的特征提取、对目标物体的类别分类和位置预测都结合到了一个过程进行,使得目标检测这一过程简化为一种端到端的问题[22]。这对网络模型的检测速度提升有着较为乐观的提升,但是精度有着些许的降低。基于工业实际场景中对实时性的高要求,如今多采用基于深度学习的目标检测算法模型。
1.1 R-CNN系列算法
在2012年,Hinton等人提出AlexNet网络并取得当年的ILSVRC图像分类比赛冠军以后,基于卷积神经网络的图像算法就开始在图像处理问题上大放异彩。2014年,经过两年的融合改进,Grishick等人提出R-CNN[23]网络模型。该网络模型结构示意图如图1所示。
R-CNN工作的大概流程为,首先对输入图像进行候选区域的提取,然后利用CNN对每个区域进行定长特征向量的抽取,最后利用SVM进行目标分类。对于图像分类任务来说,R-CNN首次应用卷积神经网络并借鉴了滑框的思想对区域图像信息进行识别。
2015年,Ren等人在对前两类R-CNN网络进行优化设计以后提出了FasterR-CNN[24]。在FasterR-CNN中,作者真正意义上实现了将图像候选框的生成,图像特征的提取,对目标物体的位置回归与所属类别的分类都整合到一个网络模型中去。这些步骤极大程度地提高了网络模型的检测速度,让FasterR-CNN成为当时第一个准实时目标检测网络模型。
1.2 YOLO系列算法
自基于深度学习的目标检测算法被提出以来,使用该方法构建的网络模型不断地被应用于计算机视觉领域,并且在该领域取得了很多不错的成绩[25]。YOLO目标检测系列算法因为其高时效性,高准确性,轻量性脱颖而出,在工业中现已被用于施工场景的安全帽实时检测,高压开关设备异常发热点目标检测,卫星图像船只实时检测等领域[26,27,28,29,30]。
YOLO系列算法的初衷就在于解决传统目标检测算法速度慢、时效性差等问题。YOLO目标检测算法系列的发展从2016年开始,其正式版到现在已经迭代到了YOLOv4。YOLOv1算法模型由Redmon提出[31],相对于传统目标检测算法,YOLOv1算法模型的检测速度已有极大地提升,达到了45f/s。YOLOv1算法的工作流程如图2所示。
从图中可以看出,YOLOv1算法模型省略了传统目标检测算法模型中提前生成候选框的步骤,这是提升其检测速度的一大措施。在2017年,Redmon又提出了YOLOv2[32]。在YOLOv2算法模型中,Redmon主要对v1阶段模型进行了一系列的改进,使得算法模型的输出在原有高速的基础上提升了对目标物体的定位准确性,经过改进后的算法模型MAP具有显著提高。
2018年,Redmon继续在YOLOv2算法模型的基础上提出了YOLOv3实时目标检测算法[33]。在YOLOv3算法中,Redmon更换了前两代模型的骨干网络模型,改为采用DarkNet-53。这个做法使模型在保留原有高检测速度的同时,进一步提升了检测精度。YOLO系列目标检测网络的最后一次迭代发生在2020年,Bochkovskiy等人提出了YOLOv4[34]。YOLOv4网络模型相对于前三代网络模型最大的改变在于其开始考虑网络模型在现实场景下的部署问题。YOLOv4中提出了一种让用户自己训练高效目标检测网络模型的方法,只需要使用一张1080Ti或者2080Ti的GPU。Redmon还对YOLOv4网络模型做了一系列的微调,例如更换新的骨干网络,使用正则化、数据增强等,这些步骤使得YOLOv4在前四代模型中的性能达到了最优。
1.3 目标检测模型适用场景对照表
根据对上述几类目标检测算法模型的说明及对照,得出几类目标检测算法模型的适用场景对照表如表1所示。
2、YOLOv4网络在无人车驾驶场景的应用示例
对于无人车在道路上实时运行的场景,无人车需要不断注意周边的车辆以及行人,另外无人车还需要对其行驶路面的车道线、路口边的交通标志、道路前方发生的事故进行检测[35],之后感知模块将车载传感器收集到的数据向决策模块传递,决策模块接收后采用内置的决策算法向动力控制模块输出信号,车辆自主实现避障,转变车道线等功能,保障车内乘员的生命安全。如今基于算力更强大的嵌入式设备,深度学习计算卡,GPU,以及Autoencoder预训练和并行计算等技术的发展,使得在移动端设备上训练并使用深度神经网络成为现实[36]。本文提出一种基于YOLOv4神经网络无人驾驶平台的解决方案如图3所示。
借鉴于NVIDIA构建的Driven-er平台[37]。该方法首先在线上平台利用高质量的数据集对网络模型进行训练,然后将训练好的网络模型部署到车载嵌入式计算平台。与此同时,利用无人驾驶平台提供算法库支持,实现无人车无线更新功能。无人车在道路上行驶时,车载摄像头获取前方道路图像数据,之后向后传递给预先部署在车载式嵌入计算平台的计算卡中,YOLOv4神经网络模型对传递过来的图像数据进行卷积、池化等操作提取图像特征,之后输出前方车辆的位置信息。当手动进行转向时,方向盘角度传感器得到一个旋转角,之后利用网络预测的旋转角与之形成LossFunction。最后网络反向传播,并调整权重,形成一个闭环控制系统,其工作流程如图4所示。
由于深度学习算法对图像处理的高效性,使得无人车可以利用单/双目摄像头实现对自动控制的需求,减轻了传统方法对昂贵的雷达、激光扫描仪等车载传感器的依赖性。值得一提的是,2020年华为诺亚方舟实验室的一篇论文中提出了一种新型的端侧神经网络架构,称之为GhostNet[38]。该网络包含一种全新的神经网络基本单元Ghost模块,被用来处理神经网络训练时所产生的冗余特征图。其基本思想就是利用一种更加廉价的方法来生成那些极其相似的特征图,而这些特征图在原神经网络中是以卷积等操作生成的,因此Ghost模块减少了神经网络的计算成本,同时保持可比的性能。在效率和准确性方面,使用提出的新模块构建的GhostNet均优于最新的轻量神经网络。
3、结束语
本文对无人车如何实现“智能”进行了解释,并对几种主流的目标检测算法进行了概述。对目标检测算法进行了详细地描述。从实现无人车自主决策的角度来说,机器视觉以及深度学习等方法将会扮演重要的角色。如今已不乏寻求纯视觉作为自动驾驶解决方案的大厂,例如Tesla、百度的ApolloLite、华为、蔚来等。虽然神经网络作为图像处理有独特的优势,但是其仍然存在一些问题和技术瓶颈。比如如何处理神经网络的黑盒性、如何在训练集很小的情况下对网络进行训练以及如何更好的利用目标检测算法对无人车决策模块进行优化等,对于这些现存问题的解决将会是未来深度学习领域和无人驾驶视觉领域融合研究的重点。
参考文献:
[1]陈佳佳.城市环境下无人驾驶车辆决策系统研究[D].合肥:中国科学技术大学,2014.
[3]黑凯先,曲大义,周警春,等.基于随机森林决策树的行驶车辆换道行为识别[J].青岛理工大学学报,2020,41(1):115-120.
[4]张元侠.基于SVM学习模型的换挡决策研究[D].长春:吉林大学,2019.
[6]熊璐,康宇宸,张培志,等.无人驾驶车辆行为决策系统研究[J].汽车技术,2018(8):1-9.
[7]胡伏原,李林燕,尚欣茹,等.基于卷积神经网络的目标检测算法综述[U].苏州科技大学学报(自然科学版),2020,37(2):1-10.
[9]黄同愿,杨雪姣,向国徽,等.基于单目视觉的小目标行人检测与测距研究[J].计算机科学,2020,47(11);205-211.
[10]浦伦.基于图像处理的城市轨道交通异物检测系统研究[J].城市轨道交通研究,2020,23(11):189-193.
[11]吴华运,任德均,吕义钊,等.基于改进的RetinaNet医药空瓶表面气泡检测[J].四川大学学报(自然科学版),2020(6)1090-1095.
[14]张友康,苏志刚,张海刚,等.X光安检图像多尺度违禁品检测[J].信号处理,2020,36(7):1096-1106.
[15]郭敬东,李晓林.面向电力智能安监的极低分辨率目标检测算法[J].计算机工程与设计,2020,41(11):3188-3192.
[18]张财广,熊博莅,匡纲要.光学卫星遥感图像舰船目标检测综述[J].电波科学学报,2020,35(5):637-647.
[19]姬晓飞,石宇辰,王昱,等.D-S理论多分类器融合的光学遥感图像多目标识别[J].电子测量与仪器学报,2020,34(5):127-132.
[20]张瑞琰,姜秀杰,安军社,等.面向光学遥感目标的全局上下文检测模型设计[J].中国光学,2020,13(6):1302-1313.
[21]谢娟英,刘然.基于深度学习的目标检测算法研究进展[J].陕西师范大学学报(自然科学版),2019,45(5):1-9.
[22]黄健,张钢.深度卷积神经网络的目标检测算法综述[J].计算机工程与应用,2020,56(17):12-23.
[25]白冰,钟必能,欧阳谷.融合分层卷积特征和尺度自适应核相关滤波器的目标跟踪[J].小型微型计算机系统,2017,38(9):2062-2066.
[26]王沣.改进yolov5的口置和安全帽佩戴人工智能检测识别算法[J].建筑与预算,2020(11):67-69.
[27]陈科峻,张叶.基于YOLO-v3模型压缩的卫星图像船只实时检测[J].液晶与显示,2020,35(11):1168-1176.
[28]王永平,张红民,彭闯,等.基于YOLOv3的高压开关设备异常发热点目标检测方法[J].红外技术,2020,42(10):983-987.
[29]陈鸿龙,刘东永,倪志琛,等.基于YOLO的四旋翼无人机人脸识别实验平台[J].实验技术与管理,2020,37(10):107-111.
[30]席孝倩,刘威.基于目标检测算法的肺结节辅助诊断系统[J].计算机与现代化,2020(11):1-7.
文章来源:马飞,刘祯.目标检测算法在无人驾驶领域应用的研究[J].科技创新与应用,2021,11(34):40-43+47.
分享:
人工智能文学是指以人工智能程序作为文学创作主体,通过模拟人类文学创作的思维模式,实现文学作品的自动或半自动化的生成过程。它设置了“人工文学数据库搭建——机器智能数据分析——文学作品自动半自动生成”的基本创作模式,借助“自动写作”和“辅助写作”两种形式使得数字时代文学发生了全新的变革。
2025-05-05火灾是一种常见而严重的灾害,给人们的生命安全带来了巨大的威胁,造成了巨大的财产损失。在高楼建筑中发生的火灾,由于建筑高度、人员密集度以及安全疏散难度的增加,往往会导致更为严重的后果。近几年来,我国平均每年发生火灾约30万起,如何有效地监测和预防高楼火灾成为了当今社会亟待解决的问题。
2025-01-20湖泊水位是衡量一个地区水资源状况的重 要指标,对于保障区域供水安全、防洪减灾以及 生态环境保护等方面具有重要意义。 准确预测 湖泊水位的变化趋势,可为相关部门制定合理的 决策提供科学依据。 然而,由于湖泊水位的变化 受到复杂多变的自然和人为因素的影响,传统的 定量预测模型在精度和适应性方面面临诸多 挑战[1-3] 。
2024-12-27人工智能(Artificial Intelligence,AI)技术是公认最有可能改变未来世界的颠覆性技术。AI在军事领域有广阔的应用前景,国内外已将AI不断应用到情报分析处理、目标识别监视、作战辅助决策、网络安全防护以及无人作战系统等智能装备中,在能力和可用性方面取得了巨大的飞跃[1]。
2024-12-03数据安全风险的存在,不仅威胁到个人隐私权益,影响企业发展,甚至关系到国家安全和社会稳定。在这一背景下,强化数据安全措施,构建全面的数据安全防护体系,已经成为迫切需要。这需要政府、企业和个人共同努力,通过立法、技术创新及提高公众的数据安全意识等手段,共同构建一个更加安全、健康的信息社会。
2024-12-03随着遥感卫星和高空平台的快速发展,高空间分辨率遥感图像的应用也变得越来越普遍[1]。遥感影像的语义分割在地貌特征的像素级分类方面具有重要意义,该技术已经在许多工业级图像中得到广泛应用[2-4]。例如,环境灾害监测[5]、土地利用与土地覆盖制图[6-7]、农业资源管理[8]、滑坡识别[9]和交通管理[10-12]等。
2024-12-035G技术以其高速率、低时延、大连接的特点,为各行各业带来了前所未有的发展机遇,但同时也面临着基站选址与优化的巨大挑战[3–4]。因此,深入研究5G基站选址决策与优化问题,对于提升5G网络覆盖质量、优化资源配置、提高通信效率具有重要意义。
2024-12-03随着科学技术的进步,各种协作机械臂和工业机械臂越来越受欢迎.为提高机械臂的智能性和自主性,机械臂自主抓取一直是机器人领域的研究热点之一[1-2].传统的协作机械臂需要操作者具备相关知识,通过编程或拖拽指令实现机械臂的抓取操作[3-4].
2024-12-03在气象观测、工农业、航空航天、食品和药品储存等制造领域,对湿度和温度有着严格要求,因此,对这两个参数的检测变得尤为重要。温湿度传感器近年来得到了大力发展和应用。传统的电子式温湿度传感器易受电磁干扰,灵敏度低,响应时间长,限制了其性能和应用范围。
2024-12-03基于机器学习的网络入侵检测系统(NIDS可以提高检测的准确性和效率,并增加系统对新型威胁的适应能力,鉴于这一优势,本文将深入分析机器学习在NIDS中的应用及其效能,探讨如何利用这一先进技术来增强网络安全防御。
2024-12-03我要评论
期刊名称:工业控制计算机
期刊人气:2132
主管单位:江苏省科学技术厅
主办单位:中国计算机学会工业控制计算机专业委员会,江苏省计算技术研究所
出版地方:江苏
专业分类:计算机
国际刊号:1001-182X
国内刊号:32-1764/TP
邮发代号:28-60
创刊时间:1988年
发行周期:月刊
期刊开本:大16开
见刊时间:4-6个月
影响因子:3.316
影响因子:0.281
影响因子:0.629
影响因子:0.000
影响因子:0.000
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!