摘要:示教学习在移动机器人的路径规划中展现出潜力,但将其直接应用于三维空间时,常面临效率低下、障碍物碰撞等挑战。提出了一种基于概率运动基元建模的移动机器人三维路径规划方法。通过简化速度信息,对示教路径点的时域坐标建模,实现了高效在线规划,并借助条件高斯计算提升路径准确性。设计了避障算法,利用障碍物信息赋予路径偏置值,结合一阶系统吸引点模型,确保路径平滑避障。实验验证表明,该模型在三维空间中规划效果良好,时间成本低,且避障算法有效,为移动机器人在复杂环境中的自主导航提供了新思路。
加入收藏
近年来,示教学习在移动机器人路径规划领域得到了广泛应用[1],使移动机器人能够通过学习示教路径中的运动特征[2],自动生成规划轨迹。自1999年沙阿尔首次提出机器人示教学习概念以来[3],该领域便吸引了众多研究者的关注,并取得了显著进展。示教学习通常采用运动基元模型进行建模,其中运动基元作为运动控制与学习领域的基本单元,能够构建并执行复杂运动。例如:奥克[4]提出的动态运动基元模型,通过结合二阶弹簧阻尼模型与附加项,确保了生成轨迹能够精确通过目标点;黄艳龙等[5]提出的核化运动基元,不依赖于先验概率,而是利用示教轨迹中的KL散度构建模型;帕拉绍斯等[6]进一步提出了基于高斯分布作为基函数的概率运动基元(Probabilistic Motion Primitive, ProMP),与动态运动基元的控制系统模型不同,它侧重于表达路径轨迹的分布概率。
ProMP在学习运动轨迹后,能够通过一次矩阵乘法迅速生成规划轨迹,这一特性极为适合移动机器人的在线规划需求。然而,当尝试将其应用扩展到高维空间时,会面临矩阵运算维数急剧增加,计算效率显著降低的挑战。此外,传统的ProMP在生成泛化轨迹时,往往未充分考虑空间中的障碍物信息,这可能导致生成的轨迹与障碍物发生碰撞。本文聚焦于三维空间中的示教轨迹,采用一种改进型的ProMP模型进行建模。通过运用条件高斯计算,确保生成的轨迹能够准确无误地到达新的目标点。同时,针对泛化路径在三维空间中的避障问题,本文利用环境信息对路径进行自适应修正,从而确保新生成的轨迹既平滑又无碰撞,以满足移动机器人在复杂环境中安全导航的严格要求[7]。
1、概率运动基元
1.1 概率运动基元模型
概率运动基元(ProMP)通常使用列向量qt和
t来分别表示时域下一维的位置和速度,可以用
来描述位置和速度的集合,即机器人在一维空间下的运动状态。高斯函数(也被称为高斯分布或正态分布)通常用来描述运动轨迹的不确定性或误差。在运动估计和轨迹跟踪领域,高斯函数被广泛用于建模和描述运动物体的位置和速度的不确定性。在ProMP模型中,若干个高斯函数被用作基函数,它们的线性组合被用来拟合机器人的运动轨迹。其对应的表达式如式(1)所示[8]。
式中:
是ProMP模型的基函数,通常在不要求准确反映路径中微分关系时,令Φt=I2o⨂ϕ,⨂为矩阵的Kronecker乘积;ω为对于各个基函数的权值,加入随机高斯噪声εy,噪声的协方差矩阵为∑y,可以使模拟数据更接近于真实世界的数据。
若定义一条示教轨迹τ,则此时在ω下的条件概率按式(2)计算。
假设ω是满足参数为θ的高斯分布,则得到式(3)和式(4)。
对式(4)进行积分求解,得到式(5)。
p(yt;θ)=N(yt|Φtμω,ΦTt∑ωΦt+∑y) (5)
通过多条示教轨迹学习,可以得到运动基元模型中的参数θ={μω,∑ω}。通过最大似然估计法,可以求得不同轨迹下ω的概率分布,具体按式(6)计算。
式中:M为示教轨迹的条数。
把计算得到的μω作为ω值代入式(1),即可得到多条示教轨迹在不同时间点的平均数学期望和方差。
1.2 条件高斯计算
在学习到了示教轨迹中的θ参数信息后,就可以用条件高斯计算改变θ参数,使路径可以在设定时刻,以设定的速度经过设定点。假设欲使泛化轨迹在指定的时刻t*,以指定的速度
经过指定位置q*t,此时的期望点参数可以描述为,协方差矩阵为∑*t。若此时期望事件为A事件,根据条件高斯与贝叶斯估计算法,则更新后的轨迹参数θ*={μ*ω,∑*ω}可用式(7)计算获得[9]。
完成参数更新后,将最新的μ*ω作为ω值代入式(1),得到泛化轨迹。此泛化轨迹可以在指定的时刻t*和指定的方差范围∑*t内过期望点。
2、高维空间下的改进型ProMP
移动机器人的运动通常发生在三维空间中,因此需要将一维的ProMP模型拓展至高维空间。在一维空间的情况下,若选取N个高斯函数的进行线性组合,则此组合公式中基函数的维数为2T×2N,其中T为路径的时间,N为高斯函数的个数。若将它拓展至三维空间,仍选取N个高斯函数,则基函数通常可以表示为Φt=I6o⨂ϕ,其中基函数的维度为6T×6N,这会大大降低运算速度,进而难以将原生的ProMP用于三维空间的在线路径规划。
在移动机器人的路径规划中,由于初期阶段主要聚焦于运动的位置信息,在采用三维空间的概率基元模型时,可以考虑仅保留位置信息而舍弃速度信息,以此显著减少运算量,提高规划效率。
若用路径St=[xt,yt,zt]T来描述三维空间中时域下位置的集合,则可以有:
此时只对三维空间位置的路径轨迹进行建模,无需准确地反映微分关系,因而可以令Φt=I3o⨂ϕ,其中ϕ仍由N个高斯分布的向量组成。此时的基函数维度为3T×3N,显著减少了运算量,并且可用式(6)计算获取模型参数。此时协方差∑ω为3N×3N维度的矩阵。
若要求在指定时刻能够准确经过设定点,则仍然可以使用式(7)来更新轨迹参数。需要注意的是,此时式(7)中的∑*t为3×3协方差矩阵,在此方差内,轨迹在三维空间经过指定点。
3、泛化轨迹避障算法研究
在实际使用中,移动机器人在复杂环境中常常会遇到各种障碍物的阻挡[10]。即便可以采用多条无碰撞的避障轨迹作为示教路径进行训练,也并不能完全确保由此生成的泛化轨迹同样是无碰撞的。为此,本文充分利用环境中的障碍物信息,提出了一种融合ProMP的避障策略,旨在提升ProMP模型的鲁棒性和实用性。
如图1所示,中心矩形代表实际障碍物,而其周围环绕的矩形框则是为障碍物外扩两个单位的“安全缓冲区”或“危险区域”。为确保更高的安全裕量,系统有必要在规划过程中读取环境中的障碍物信息,并据此调整泛化后的轨迹,确保移动路径能够避开这些障碍物及其周围的危险区域,从而避免发生碰撞。
图1 障碍物与路径图
当ProMP生成的轨迹穿越障碍危险区域时,可以考虑在穿越区域施加一个横向偏移,以模拟人为避障轨迹中的“转弯”动作。为确保调整后的避障轨迹保持良好的连续性和平滑性,该横向偏移值应从零开始并保持连续变化。同时,为了优化避障性能,还应根据轨迹与障碍物之间的实际距离调整偏移值。为此,本文借鉴了控制理论中的一阶系统单位阶跃响应的时域输出特性。具体公式如式(9)所示。
yt=1-e-t/T(9)
假设图1中轨迹是自上而下运行的,那么设定在A点处的横向偏移值为0(即无偏移),而在B点处的横向偏移值达到最大。为了确定这一偏移量的具体数值,取整个轨迹离障碍物之间的最小距离smin,并设定时间常数T为0.33,通过调整阶跃输入的大小smin/0.632,可以得到式(10)所示的横向偏移值(bs)的计算公式。
根据一阶系统的阶跃响应特性,可以观察到,在从A点到B点的移动过程中,当系统到达AB段的三分之一位置时,偏移值会达到一个特定水平,即轨迹与障碍物之间的最小距离。随后,偏移值将呈现缓慢增加的趋势,直至系统到达B点,此时偏移值约为轨迹与障碍物之间的最小距离的1.5倍。为了修正轨迹,避免与障碍物过近,轨迹将按照图2所示的曲线AD进行调整。
图2 障碍物与修正路径图
在此情况下,若直接将D点与后续轨迹相连,可能会导致轨迹显得不够平滑。为了改善这一情况,可以引入一个吸引点模型,如图2所示的C点。将D点和C点的横坐标或纵坐标视为离散系统的时域,并在此基础上引入一个离散系统的增量式比例-积分(PD)控制器。此时,坐标的变化可以被视为控制系统中的积分环节。
对于D到C段,为确保路径的平滑性,可以对纵坐标进行单位采样时间内的均分处理。随后,在单位采样时间内的每个一维点位置追踪上,运用用增量式PD控制器进行输出控制。具体如式(11)所示。
此时输出的路径点的横坐标会逐渐逼近吸引点C,最终路径的修正结果如图3所示。从中可以看到,经修正的路径模拟了趋利避害的行为逻辑,整体路径可以平滑地绕过障碍物。
图3 障碍物与修正路径图
4、移动机器人路径泛化与避障仿真
为了评估移动机器人在三维空间中的路径泛化效率、时间成本及面对障碍物时的自主避障能力,笔者设计了两组仿真实验,以验证改进型ProMP的性能。
4.1 三维空间ProMP泛化实验
设定三维空间地图大小为20×20×2,移动机器人有3条示教路径,其示教起点为(6.0,7.5,0.0),示教终点为(5.0,-1.0,-1.4)。实验用计算机的操作系统为Windows10专业版64位,CPU配置为Inter(R) Xeon(R) E5-2666 v3。在此环境下,运行Matlab R2015b软件。实验中将3条示教路径中每条路径采样100个点,分别使用原生的ProMP和本文改进的ProMP,设置基函数中用100个高斯函数拟合,泛化路径终点为(5.0,-1.0,-1.8),使用原生ProMP和改进型ProMP,得到从起点到终点的泛化路径。
实验结果显示,移动机器人在采用两种动态基元模型进行路径规划时,其泛化路径均能精确地通过预定的目标点。同时,这些新的泛化路径与原始的3条示教路径保持较高的相似度。由表1可知,采用改进型ProMP模型所需时间显著少于使用原生ProMP模型。
表1 三维空间ProMP泛化实验用时
4.2 三维空间ProMP避障实验
在上述实验中,当利用ProMP生成移动机器人的泛化路径时,可能存在路径穿越障碍物的风险。为此,在上述泛化实验的基础上,进一步进行避障功能的测试。利用上述所阐明的泛化轨迹避障算法,在三维实验环境中生成新的修正路径。实验结果表明,采用三维空间ProMP避障算法生成的路径,能够成功避开三维空间中的障碍物,达到了利用障碍物信息对泛化路径进行有效修正的效果。
5、结语
本文针对基于概率运动基元(ProMP)的三维空间路径规划中时间成本较高及易与障碍物碰撞的问题,主要进行了以下设计改进:一是通过部分信息舍弃策略,对示教路径点的时域坐标进行建模,从而有效减少了运算时间,便于在线规划;二是引入了针对泛化后路径的避障算法,该算法充分利用了空间中的障碍物信息,显著提升了泛化路径的适应性。三维仿真实验的结果表明,使用改进后的ProMP进行建模与泛化生成的路径,不仅成功学习了示教路径的特征,能够较为精确地经过各个路径点,而且相较于原生的ProMP,其时间成本更低。同时,避障算法的加入,实现了对泛化路径的有效修正,确保了路径的安全性。
参考文献:
[2]陈煜,刘曙.基于多传感器融合的复杂地形建图[J].仪表技术,2022(6):58-61.
[7]郑轶民.基于MMAS的垃圾车路径规划系统研究[J].仪表技术,2018(8):33-35.
[9]孙峰.基于双编码器设计的机器人关节定位精度分析[J].仪表技术,2020(3):33-35.
文章来源:罗济雨,孙丙宇.基于概率运动基元的移动机器人轨迹学习与避障算法研究[J].仪表技术,2024,(05):53-56.
分享:
人工智能文学是指以人工智能程序作为文学创作主体,通过模拟人类文学创作的思维模式,实现文学作品的自动或半自动化的生成过程。它设置了“人工文学数据库搭建——机器智能数据分析——文学作品自动半自动生成”的基本创作模式,借助“自动写作”和“辅助写作”两种形式使得数字时代文学发生了全新的变革。
2025-05-05火灾是一种常见而严重的灾害,给人们的生命安全带来了巨大的威胁,造成了巨大的财产损失。在高楼建筑中发生的火灾,由于建筑高度、人员密集度以及安全疏散难度的增加,往往会导致更为严重的后果。近几年来,我国平均每年发生火灾约30万起,如何有效地监测和预防高楼火灾成为了当今社会亟待解决的问题。
2025-01-20湖泊水位是衡量一个地区水资源状况的重 要指标,对于保障区域供水安全、防洪减灾以及 生态环境保护等方面具有重要意义。 准确预测 湖泊水位的变化趋势,可为相关部门制定合理的 决策提供科学依据。 然而,由于湖泊水位的变化 受到复杂多变的自然和人为因素的影响,传统的 定量预测模型在精度和适应性方面面临诸多 挑战[1-3] 。
2024-12-27人工智能(Artificial Intelligence,AI)技术是公认最有可能改变未来世界的颠覆性技术。AI在军事领域有广阔的应用前景,国内外已将AI不断应用到情报分析处理、目标识别监视、作战辅助决策、网络安全防护以及无人作战系统等智能装备中,在能力和可用性方面取得了巨大的飞跃[1]。
2024-12-03数据安全风险的存在,不仅威胁到个人隐私权益,影响企业发展,甚至关系到国家安全和社会稳定。在这一背景下,强化数据安全措施,构建全面的数据安全防护体系,已经成为迫切需要。这需要政府、企业和个人共同努力,通过立法、技术创新及提高公众的数据安全意识等手段,共同构建一个更加安全、健康的信息社会。
2024-12-03随着遥感卫星和高空平台的快速发展,高空间分辨率遥感图像的应用也变得越来越普遍[1]。遥感影像的语义分割在地貌特征的像素级分类方面具有重要意义,该技术已经在许多工业级图像中得到广泛应用[2-4]。例如,环境灾害监测[5]、土地利用与土地覆盖制图[6-7]、农业资源管理[8]、滑坡识别[9]和交通管理[10-12]等。
2024-12-035G技术以其高速率、低时延、大连接的特点,为各行各业带来了前所未有的发展机遇,但同时也面临着基站选址与优化的巨大挑战[3–4]。因此,深入研究5G基站选址决策与优化问题,对于提升5G网络覆盖质量、优化资源配置、提高通信效率具有重要意义。
2024-12-03随着科学技术的进步,各种协作机械臂和工业机械臂越来越受欢迎.为提高机械臂的智能性和自主性,机械臂自主抓取一直是机器人领域的研究热点之一[1-2].传统的协作机械臂需要操作者具备相关知识,通过编程或拖拽指令实现机械臂的抓取操作[3-4].
2024-12-03在气象观测、工农业、航空航天、食品和药品储存等制造领域,对湿度和温度有着严格要求,因此,对这两个参数的检测变得尤为重要。温湿度传感器近年来得到了大力发展和应用。传统的电子式温湿度传感器易受电磁干扰,灵敏度低,响应时间长,限制了其性能和应用范围。
2024-12-03基于机器学习的网络入侵检测系统(NIDS可以提高检测的准确性和效率,并增加系统对新型威胁的适应能力,鉴于这一优势,本文将深入分析机器学习在NIDS中的应用及其效能,探讨如何利用这一先进技术来增强网络安全防御。
2024-12-03人气:7273
人气:6327
人气:6224
人气:5919
人气:5461
我要评论
期刊名称:仪表技术
期刊人气:941
主管单位:上海科学院
主办单位:上海仪器仪表研究所,上海市仪器仪表学会,中国仪器仪表学会汉字信息处理系统研究会
出版地方:上海
专业分类:科技
国际刊号:1006-2394
国内刊号:31-1266/TH
邮发代号:4-351
创刊时间:1972年
发行周期:月刊
期刊开本:大16开
影响因子:0.121
影响因子:0.090
影响因子:0.320
影响因子:0.150
影响因子:0.200
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!