手机知网 App
24小时专家级知识服务
打 开
自动化技术
基于改进DDPG算法的机器人路径规划算法研究
为解决深度强化学习训练时间长、收敛慢的问题,该文针对未知环境下的机器人路径规划,基于深度确定性策略梯度(DDPG)算法,结合人工势场法设计了回报函数。为了符合机器人运动学模型,设计连续的状态和动作空间。采用Python语言,在不同地图下分别使用人工势场法、原始DDPG和该文改进的DDPG算法进行仿真对比实验。改进的DDPG算法通过结合人工势场法,在训练中能够给予模型一定的指引,减少训练的盲目性和随机性,从而大大缩短训练时间,更早得到优化模型。训练1000回合后,原始DDPG算法的成功率为70%,改进DDPG算法的成功率为92%。
1 612
手机阅读本文
下载APP 手机查看本文
南京理工大学学报
2021年03期
相似文献
图书推荐
相关工具书

搜 索