easy-rl/codes/README.md at b6f63a91bf06404d1a2200f8b0cf592da7fd8f6e

bacow/easy-rl

Files

JohnJim0816 b6f63a91bf update

2021-03-31 15:37:09 +08:00

写在前面

本项目用于学习RL基础算法，尽量做到: 注释详细，结构清晰。

代码结构主要分为以下几个脚本：

其中model.py,memory.py,plot.py 由于不同算法都会用到，所以放入common文件夹中。

python 3.7、pytorch 1.6.0-1.7.1、gym 0.17.0-0.18.0

运行main.py或者main.ipynb

算法名称	相关论文材料	环境	备注
On-Policy First-Visit MC		Racetrack
Q-Learning		CliffWalking-v0
Sarsa		Racetrack
DQN	DQN Paper	CartPole-v0
DQN-cnn	DQN Paper	CartPole-v0	与DQN相比使用了CNN而不是全链接网络
DoubleDQN		CartPole-v0	效果不好，待改进
Hierarchical DQN	H-DQN Paper
PolicyGradient		CartPole-v0
A2C		CartPole-v0
A3C
SAC
PPO	PPO paper	CartPole-v0
DDPG	DDPG Paper	Pendulum-v0
TD3	TD3 Paper
GAIL