基于改进MADDPG算法的人群疏散仿真研究

doi:10.13451/j.sxu.ns.2024147

PDF(5643 KB)

山西大学学报(自然科学版) ›› 2025, Vol. 48 ›› Issue (01) : 130-143. DOI: 10.13451/j.sxu.ns.2024147

基于改进MADDPG算法的人群疏散仿真研究

杨玉, 王翔, 蒋效伟, 宋强, 陈若彤, 戴红伟

作者信息 +

History +

摘要

随着社会和经济的快速发展，城市和公共区域的人口密度也逐渐增加，一定程度上增加了紧急情况下人群疏散的难度。针对高密度人群疏散问题提出了一种基于改进多智能体深度确定性策略梯度算法（Improved MultiAgent Deep Deterministic Policy Gradient, IMADDPG）的人群疏散方法。该方法将注意力机制引入到深度强化学习框架和改进的社会力模型（Social Force Model, SFM）中，通过双层控制策略，宏观层面采用改进的多智能体深度确定性策略梯度算法确定领导者的疏散路径，微观层面采用改进SFM制定避障策略。在多障碍区域与高密度环境中的实验表明，与传统方法相比，该方法的疏散效率平均提高了约16%，疏散时间缩短了约17%。本研究将改进深度确定性策略梯度和改进SFM相结合，为大型空间的人员疏散提供了可靠的解决方案。