Files
easy-rl/codes/HierarchicalDQN/README.md
JohnJim0816 b6f63a91bf update
2021-03-31 15:37:09 +08:00

603 B
Raw Blame History

Hierarchical DQN

原理简介

Hierarchical DQN是一种分层强化学习方法与DQN相比增加了一个meta controller

image-20210331153115575

即学习时meta controller每次会生成一个goal然后controller或者说下面的actor就会达到这个goal直到done为止。这就相当于给agent增加了一个队长队长擅长制定局部目标指导agent前行这样应对一些每回合步数较长或者稀疏奖励的问题会有所帮助。

伪代码

image-20210331153542314