基于深度强化学习算法的多无人水面航行器编队构造

doi:10.16411/j.cnki.issn1006-7736.2025.01.002

PDF(20258 KB)

大连海事大学学报 ›› 2025, Vol. 51 ›› Issue (01) : 11-20+42. DOI: 10.16411/j.cnki.issn1006-7736.2025.01.002

基于深度强化学习算法的多无人水面航行器编队构造

关巍, 张诚, 崔哲闻, 韩虎生

作者信息 +

History +

摘要

针对传统多智能体深度确定性策略梯度算法（MADDPG）收敛速度较慢的问题，本文通过在值函数阶段引入注意力机制来提升多无人水面航行器系统编队决策模型的收敛速度，并通过编队模型与编队避碰和编队构造奖励函数的配合，提升了多无人水面航行器完成编队构造任务的效率。仿真结果验证了本文方法可有效完成多种环境下的多无人水面航行器编队构造任务，为未来多无人船编队构造应用提供了理论研究基础。