Files
easy-rl/codes/HierarchicalDQN
2022-05-31 01:20:58 +08:00
..
2021-11-18 15:41:27 +08:00
2022-05-31 01:20:58 +08:00
2021-11-18 15:41:27 +08:00
2022-05-31 01:20:58 +08:00
2021-12-21 20:14:13 +08:00

Hierarchical DQN

原理简介

Hierarchical DQN是一种分层强化学习方法与DQN相比增加了一个meta controller

image-20210331153115575

即学习时meta controller每次会生成一个goal然后controller或者说下面的actor就会达到这个goal直到done为止。这就相当于给agent增加了一个队长队长擅长制定局部目标指导agent前行这样应对一些每回合步数较长或者稀疏奖励的问题会有所帮助。

伪代码

image-20210331153542314