From efba03150881ff1407c00e064885185470b91a29 Mon Sep 17 00:00:00 2001 From: JohnJim0816 Date: Mon, 23 Nov 2020 12:10:09 +0800 Subject: [PATCH] update --- .gitignore | 3 ++- docs/chapter7/project2.md | 4 +++- 2 files changed, 5 insertions(+), 2 deletions(-) diff --git a/.gitignore b/.gitignore index b9007d8..cb8735f 100644 --- a/.gitignore +++ b/.gitignore @@ -1,2 +1,3 @@ .DS_STORE -__pycache__ \ No newline at end of file +__pycache__ +.vscode \ No newline at end of file diff --git a/docs/chapter7/project2.md b/docs/chapter7/project2.md index 21baf63..4fadcd4 100644 --- a/docs/chapter7/project2.md +++ b/docs/chapter7/project2.md @@ -4,7 +4,9 @@ ## CartPole-v0 -CartPole-v0是OpenAI gym中的一个经典环境,通过向左(action=0)或向右(action=1)推车能够实现平衡,所以动作空间由两个动作组成。每进行一个step就会给一个reward,如果无法保持平衡那么done等于true,本次episode失败。理想状态下,每个episode至少能进行200个step,也就是说每个episode的reward总和至少为200,step数目至少为200。 +CartPole-v0是OpenAI gym中的一个经典环境,通过向左(action=0)或向右(action=1)推车能够实现平衡,所以动作空间由两个动作组成。每进行一个step就会给一个+1的reward,如果无法保持平衡那么done等于true,本次episode失败。 + +**理想状态下,每个episode至少能进行200个step,也就是说每个episode的reward总和至少为200,step数目至少为200**。 ![p1](img/p1.png)