update errata

This commit is contained in:
qiwang067
2023-07-21 23:36:50 +08:00
parent 385d504eb2
commit e1462e7b2b

View File

@@ -14,9 +14,17 @@
pip install pygame
```
* 28页第一个代码框的第1行观测空间 = Box(2,) → 观测空间 = Box([-1.2 -0.07], [0.6 0.07], (2,), float32)
* 28页第二段第1行观测空间是形状为 → 观测是形状为
* 28页第二段改为:观测是长度为 2 的数组,动作是整数,其取值范围为{0,1,2}。
* 28页第三段改为接下来实现智能体来控制小车移动对应代码如下。
* 28页第二个代码框第1行和倒数第1行BespokeAgent → SimpleAgent
* 28页倒数第一段改为SimpleAgent 类的 decide()方法用于决策learn() 方法用于学习,该智能体不是强化学习智能体,不能学习,只能根据给定的数学表达式进行决策。
* 29页第一个代码框第1行play_montecarlo → play
* 29页第二段第1行play_montecarlo → play
* 29页倒数第一个代码框的第1行env.seed(0) → env.seed(3)
* 29页倒数第一个代码框第2行play_montecarlo → play
* 30页第二个代码框第1行play_montecarlo → play
* 30页第三个代码框-102.61 → -106.63
* 30页第三段第2行BespokeAgent → SimpleAgent
* 137页第一段第1行虽然式 (5.19) 看起来有点儿复杂,但实现起来是比较简单的 → 式 (5.19) 看起来复杂,但其实现比较简单
* 156页第二段第1行第一个好处是→ 第一个好处是提高采样效率。
* 156页第二段第6行第二个好处是→ 第二个好处是增加样本多样性。