This commit is contained in:
JohnJim0816
2020-11-23 12:10:09 +08:00
parent 8ac41fb16b
commit efba031508
2 changed files with 5 additions and 2 deletions

3
.gitignore vendored
View File

@@ -1,2 +1,3 @@
.DS_STORE
__pycache__
__pycache__
.vscode

View File

@@ -4,7 +4,9 @@
## CartPole-v0
CartPole-v0是OpenAI gym中的一个经典环境通过向左(action=0)或向右(action=1)推车能够实现平衡所以动作空间由两个动作组成。每进行一个step就会给一个reward如果无法保持平衡那么done等于true本次episode失败。理想状态下每个episode至少能进行200个step也就是说每个episode的reward总和至少为200step数目至少为200。
CartPole-v0是OpenAI gym中的一个经典环境通过向左(action=0)或向右(action=1)推车能够实现平衡所以动作空间由两个动作组成。每进行一个step就会给一个+1的reward如果无法保持平衡那么done等于true本次episode失败。
**理想状态下每个episode至少能进行200个step也就是说每个episode的reward总和至少为200step数目至少为200**
![p1](img/p1.png)