From 297153d376ad2cc7fc31d4655d00f4bda5e85c0a Mon Sep 17 00:00:00 2001
From: qiwang067 <qiwang067@163.com>
Date: Sat, 22 Jul 2023 00:57:05 +0800
Subject: [PATCH] update errata

---
 docs/errata.md | 4 +++-
 1 file changed, 3 insertions(+), 1 deletion(-)

diff --git a/docs/errata.md b/docs/errata.md
index a47aab1..264fed7 100644
--- a/docs/errata.md
+++ b/docs/errata.md
@@ -13,8 +13,10 @@
 ```bash
 pip install pygame
 ```
+* 27页，第二段改为：Gym 库已注册的环境可以通过以下代码查看。
+* 27页，第三段和第四段改为：Gym 库中的每个环境都定义了观测空间和动作空间。观测空间和动作空间可以是离散的（取值为有限个离散的值），也可以是连续的（取值为连续的值）。
 * 28页，第一个代码框的第1行：观测空间 = Box(2,) → 观测空间 = Box([-1.2  -0.07], [0.6  0.07], (2,), float32)
-* 28页，第二段改为：观测是长度为 2 的数组，动作是整数，其取值范围为{0,1,2}。
+* 28页，第二段改为：在 Gym 库中，环境的观测空间用 env.observation\_space 表示，动作空间用 env.action\_space 表示。离散空间用 gym.spaces.Discrete 类表示，连续空间用 gym.spaces.Box 类表示。对于离散空间，Discrete (n) 表示可能取值的数量为 n；对于连续空间，Box类实例成员中的 low 和 high 表示每个浮点数的取值范围。MountainCar-v0 中的观测是长度为 2 的 numpy 数组，数组中值的类型为 float。MountainCar-v0 中的动作是整数，取值范围为 {0,1,2}。
 * 28页，第三段改为：接下来实现智能体来控制小车移动，对应代码如下。
 * 28页，第二个代码框第1行和倒数第1行：BespokeAgent → SimpleAgent
 * 28页，倒数第一段改为：SimpleAgent 类的 decide()方法用于决策，learn() 方法用于学习，该智能体不是强化学习智能体，不能学习，只能根据给定的数学表达式进行决策。