基于改进MADDPG算法的人群疏散仿真研究

杨玉, 王翔, 蒋效伟, 宋强, 陈若彤, 戴红伟

PDF(5643 KB)
PDF(5643 KB)
山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (01) : 130-143. DOI: 10.13451/j.sxu.ns.2024147

基于改进MADDPG算法的人群疏散仿真研究

  • 杨玉, 王翔, 蒋效伟, 宋强, 陈若彤, 戴红伟
作者信息 +
History +

摘要

随着社会和经济的快速发展,城市和公共区域的人口密度也逐渐增加,一定程度上增加了紧急情况下人群疏散的难度。针对高密度人群疏散问题提出了一种基于改进多智能体深度确定性策略梯度算法(Improved MultiAgent Deep Deterministic Policy Gradient, IMADDPG)的人群疏散方法。该方法将注意力机制引入到深度强化学习框架和改进的社会力模型(Social Force Model, SFM)中,通过双层控制策略,宏观层面采用改进的多智能体深度确定性策略梯度算法确定领导者的疏散路径,微观层面采用改进SFM制定避障策略。在多障碍区域与高密度环境中的实验表明,与传统方法相比,该方法的疏散效率平均提高了约16%,疏散时间缩短了约17%。本研究将改进深度确定性策略梯度和改进SFM相结合,为大型空间的人员疏散提供了可靠的解决方案。

关键词

人群疏散 / 注意力机制 / 深度强化学习 / 社会力模型 / 双层控制

中图分类号

X91 / TP18

引用本文

导出引用
杨玉, 王翔, 蒋效伟, 宋强, 陈若彤, 戴红伟. 基于改进MADDPG算法的人群疏散仿真研究. 山西大学学报(自然科学版). 2025, 48(01): 130-143 https://doi.org/10.13451/j.sxu.ns.2024147

基金

全国高等院校计算机基础教育研究会教学研究项目(2023-AFCEC-307); 江苏省计算机学会教学类项目(JSCS2022028); 江苏省大学生创新创业项目(202311641003Z)

评论

PDF(5643 KB)

Accesses

Citation

Detail

段落导航
相关文章

/