fix ch1
This commit is contained in:
@@ -405,7 +405,7 @@ Learning 和 Planning 是序列决策的两个基本问题。
|
|||||||
|
|
||||||
### Gym
|
### Gym
|
||||||
|
|
||||||

|

|
||||||
|
|
||||||
[OpenAI Gym](https://gym.openai.com/) 是一个环境仿真库,里面包含了很多现有的环境。针对不同的场景,我们可以选择不同的环境,
|
[OpenAI Gym](https://gym.openai.com/) 是一个环境仿真库,里面包含了很多现有的环境。针对不同的场景,我们可以选择不同的环境,
|
||||||
|
|
||||||
@@ -449,7 +449,7 @@ for step in range(100):
|
|||||||
|
|
||||||
几行代码就实现了强化学习的框架。
|
几行代码就实现了强化学习的框架。
|
||||||
|
|
||||||

|

|
||||||
在 OpenAI Gym 里面有很经典的控制类游戏。
|
在 OpenAI Gym 里面有很经典的控制类游戏。
|
||||||
|
|
||||||
* 比如说 Acrobot 就是把两节铁杖甩了立起来。
|
* 比如说 Acrobot 就是把两节铁杖甩了立起来。
|
||||||
|
|||||||
Reference in New Issue
Block a user