easy-rl/codes/README.md at 42974bc271a55168fb9ca278e86263cae2fad350

bacow/easy-rl

Files

JohnJim0816 2df8d965d2 add DQN_cnn

2021-03-23 21:23:43 +08:00

写在前面

本项目用于学习RL基础算法，尽量做到: 注释详细，结构清晰。

代码结构主要分为以下几个脚本：

其中model.py,memory.py,plot.py 由于不同算法都会用到，所以放入common文件夹中。

python 3.7、pytorch 1.6.0-1.7.1、gym 0.17.0-0.18.0

对应算法文件夹下运行main.py即可

算法名称	相关论文材料	环境	备注
On-Policy First-Visit MC		Racetrack
Q-Learning		CliffWalking-v0
Sarsa		Racetrack
DQN	DQN-paper	CartPole-v0
DQN-cnn	DQN-paper	CartPole-v0	与DQN相比使用了CNN而不是全链接网络
DoubleDQN		CartPole-v0	效果不好，待改进
Hierarchical DQN	Hierarchical DQN
PolicyGradient		CartPole-v0
A2C		CartPole-v0
A3C
SAC
PPO	PPO paper	CartPole-v0
DDPG	DDPG Paper	Pendulum-v0
TD3	Twin Dueling DDPG Paper
GAIL