Files
easy-rl/projects/codes/HierarchicalDQN/README.md
2022-07-31 23:42:12 +08:00

603 B
Raw Blame History

Hierarchical DQN

原理简介

Hierarchical DQN是一种分层强化学习方法与DQN相比增加了一个meta controller

image-20210331153115575

即学习时meta controller每次会生成一个goal然后controller或者说下面的actor就会达到这个goal直到done为止。这就相当于给agent增加了一个队长队长擅长制定局部目标指导agent前行这样应对一些每回合步数较长或者稀疏奖励的问题会有所帮助。

伪代码

image-20210331153542314