d977b758416e2e589e36ed9ee732ac2f2957f79e
Easy-RL
李宏毅老师的《深度强化学习》是强化学习领域经典的中文视频之一。李老师幽默风趣的上课风格让晦涩难懂的强化学习理论变得轻松易懂,他会通过很多有趣的例子来讲解强化学习理论。比如老师经常会用玩 Atari 游戏的例子来讲解强化学习算法。此外,为了教程的完整性,我们整理了周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习》以及多个强化学习的经典资料作为补充。对于想入门强化学习又想看中文讲解的人来说绝对是非常推荐的。
使用说明
- 第 4 章到第 11 章为李宏毅《深度强化学习》的部分;
- 第 1 章和第 2 章根据《强化学习纲要》整理而来;
- 第 3 章和第 12 章根据《百度强化学习》 整理而来。
在线阅读(内容实时更新)
地址:https://datawhalechina.github.io/easy-rl/
内容导航
算法实战
| 算法名称 | 相关论文材料 | 备注 | 环境 |
|---|---|---|---|
| On-Policy First-Visit MC | 蒙特卡洛算法 | Racetrack | |
| Q-Learning | CliffWalking-v0 | ||
| Sarsa | Racetrack | ||
| DQN | DQN-paper | DQN算法实战 | CartPole-v0 |
| DQN-cnn | DQN-paper | 与DQN相比使用了CNN而不是全链接网络 | CartPole-v0 |
| DoubleDQN | CartPole-v0 | ||
| Hierarchical DQN | Hierarchical DQN | ||
| PolicyGradient | CartPole-v0 | ||
| A2C | CartPole-v0 | ||
| A3C | |||
| SAC | |||
| PPO | PPO paper | PPO算法实战 | CartPole-v0 |
| DDPG | DDPG Paper | Pendulum-v0 | |
| TD3 | Twin Dueling DDPG Paper | ||
| GAIL |
贡献者
![]() Qi Wang 教程设计(第1~12章) |
![]() David Young 习题设计&第13章 |
![]() John Jim 算法实战 |
致谢
特别感谢 @Sm1les、@LSGOMYP 对本项目的帮助与支持。
关注我们
LICENSE
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
Description
Languages
Jupyter Notebook
99.3%
Python
0.7%



