【摘要】针对单个月球车难以高效鲁棒地探测月面极端区域的问题,提出一种基于多智能体强化学习的月球车协同探测方法。首先将探测区域进行离散化处理并使用栅格地图表达探测信息以及各月球车的位置信息,然后使用深度神经网络对视觉图像信息、激光雷达信息以及栅格地图信息进行特征提取;之后在多智能体强化学习的架构下学习月球车的协同探测策略,通过设计考虑探测时间、安全约束以及通信约束的奖励函数,使得月球车可以快速安全地对月面极端区域进行协同探测;最后,在Gazebo中搭建了月面仿真环境并进行了仿真验证。结果表明,所提出的方法具备较高的探测效率与较好的安全保障。
【关键词】月球车;月面极端区域;协同探测;多智能体强化学习
【作者】张杨,颜鹏,谢旭东,白成超