连续生产流水线深度强化学习优化调度算法

朱广贺, 朱智强, 袁逸萍

吉林大学学报(工学版) ›› 2024, Vol. 54 ›› Issue (07) : 2086-2092. DOI: 10.13229/j.cnki.jdxbgxb.20230129

连续生产流水线深度强化学习优化调度算法

  • 朱广贺, 朱智强, 袁逸萍
作者信息 +
History +

摘要

为了提高连续生产流水线的调度效果,提升生产线的加工效率,提出连续生产流水线深度强化学习优化调度算法。首先,结合蒙特卡罗算法和贝叶斯评估方法降低连续生产线流水线问题的数据复杂度;其次,采用深度神经网络模型优化流水线调度参数,对其进行评估及编码;最后,将迭代贪婪算法与深度强化学习方法结合,对调度数据问题实施模型求解,实现连续生产流水线调度。试验结果表明:本文算法的调度结果最优,综合评价结果均高于0.9531,工序延时优化至5 min以下,收敛速度较快,提升了生产线的加工效率。

关键词

深度强化学习 / 流水线生产 / 调度优化 / 迭代贪婪算法 / 数据降维

中图分类号

TP18 / TH186

引用本文

导出引用
朱广贺, 朱智强, 袁逸萍. 连续生产流水线深度强化学习优化调度算法. 吉林大学学报(工学版). 2024, 54(07): 2086-2092 https://doi.org/10.13229/j.cnki.jdxbgxb.20230129

基金

国家自然科学基金项目(71961029)

评论

Accesses

Citation

Detail

段落导航
相关文章

/