基于Q-Learning的航空器滑行路径规划研究

王兴隆, 王睿峰

中国民航大学学报 ›› 2024, Vol. 42 ›› Issue (03) : 28-33.

基于Q-Learning的航空器滑行路径规划研究

  • 王兴隆, 王睿峰
作者信息 +
History +

摘要

针对传统算法规划航空器滑行路径准确度低、不能根据整体场面运行情况进行路径规划的问题,提出一种基于Q-Learning的路径规划方法。通过对机场飞行区网络结构模型和强化学习的仿真环境分析,设置了状态空间和动作空间,并根据路径的合规性和合理性设定了奖励函数,将路径合理性评价值设置为滑行路径长度与飞行区平均滑行时间乘积的倒数。最后,分析了动作选择策略参数对路径规划模型的影响。结果表明,与A*算法和Floyd算法相比,基于Q-Learning的路径规划在滑行距离最短的同时,避开了相对繁忙的区域,路径合理性评价值高。

关键词

滑行路径规划 / 机场飞行区 / 强化学习 / Q-Learning

中图分类号

V355

引用本文

导出引用
王兴隆, 王睿峰. 基于Q-Learning的航空器滑行路径规划研究. 中国民航大学学报. 2024, 42(03): 28-33

基金

国家重点基础研究发展计划项目(2020YFB1600101); 天津市教委科研项目(2020ZD01)

评论

Accesses

Citation

Detail

段落导航
相关文章

/