基于深度强化学习算法的多无人水面航行器编队构造

关巍, 张诚, 崔哲闻, 韩虎生

PDF(20258 KB)
PDF(20258 KB)
大连海事大学学报 ›› 2025, Vol. 51 ›› Issue (01) : 11-20+42. DOI: 10.16411/j.cnki.issn1006-7736.2025.01.002

基于深度强化学习算法的多无人水面航行器编队构造

  • 关巍, 张诚, 崔哲闻, 韩虎生
作者信息 +
History +

摘要

针对传统多智能体深度确定性策略梯度算法(MADDPG)收敛速度较慢的问题,本文通过在值函数阶段引入注意力机制来提升多无人水面航行器系统编队决策模型的收敛速度,并通过编队模型与编队避碰和编队构造奖励函数的配合,提升了多无人水面航行器完成编队构造任务的效率。仿真结果验证了本文方法可有效完成多种环境下的多无人水面航行器编队构造任务,为未来多无人船编队构造应用提供了理论研究基础。

关键词

多无人水面航行器 / 编队构造 / MADDPG算法 / 深度强化学习 / 注意力机制

中图分类号

U664.82

引用本文

导出引用
关巍, 张诚, 崔哲闻, 韩虎生. 基于深度强化学习算法的多无人水面航行器编队构造. 大连海事大学学报. 2025, 51(01): 11-20+42 https://doi.org/10.16411/j.cnki.issn1006-7736.2025.01.002

基金

国家自然科学基金资助项目(52171342)

评论

PDF(20258 KB)

Accesses

Citation

Detail

段落导航
相关文章

/