PDF(3320 KB)
本体指导下的安全强化学习最优化策略
郝嘉宁, 姚永伟, 叶育鑫
PDF(3320 KB)
PDF(3320 KB)
本体指导下的安全强化学习最优化策略
安全强化学习 / 屏蔽机制 / 本体 / 深度神经网络 / 联合查询
TP18
/
| 〈 |
|
〉 |