基于深度强化学习的护理机器人路径规划分析

2025.12.02点击:

摘要:阐述深度Q网络(deep Q-network,DQN)算法通过融合深度神经网络和强化学习方法被广泛应用于路径规划中,但DQN算法的网络收敛速度较慢并且具有奖励稀疏的问题。为此,提出一种改进的DQN算法,首先采用基于SumTree的优先回放机制,加快算法的收敛速度;其次根据护理机器人模型改变状态空间和动作空间,从而更准确地区分护理机器人的不同状态以及执行的动作;最后根据机器人的航向角以及与障碍物的距离,设计一种改进的奖励函数,从而提高路径搜索效率。仿真实验证明,改进的DQN算法收敛速度提升了37.5%,在单目标点任务中路径长度和运动时间分别减少了17.6%和29.6%;多目标点任务中路径长度和运动时间分别减少了20.8%和46.0%。物理实验证明,护理机器人能够在未知环境下完成路径规划任务,进一步证明了改进DQN算法的可行性。

关键词: 深度强化学习;DQN算法;路径规划;护理机器人;

基金资助: 宁波市科学技术协会资助项目(K2023-1-6);

DOI: 10.19339/j.issn.1674-2583.2025.06.042

专辑: 信息科技

专题: 自动化技术

分类号: TP242;TP18