update errata
This commit is contained in:
@@ -14,9 +14,17 @@
|
||||
pip install pygame
|
||||
```
|
||||
* 28页,第一个代码框的第1行:观测空间 = Box(2,) → 观测空间 = Box([-1.2 -0.07], [0.6 0.07], (2,), float32)
|
||||
* 28页,第二段第1行:观测空间是形状为 → 观测是形状为
|
||||
* 28页,第二段改为:观测是长度为 2 的数组,动作是整数,其取值范围为{0,1,2}。
|
||||
* 28页,第三段改为:接下来实现智能体来控制小车移动,对应代码如下。
|
||||
* 28页,第二个代码框第1行和倒数第1行:BespokeAgent → SimpleAgent
|
||||
* 28页,倒数第一段改为:SimpleAgent 类的 decide()方法用于决策,learn() 方法用于学习,该智能体不是强化学习智能体,不能学习,只能根据给定的数学表达式进行决策。
|
||||
* 29页,第一个代码框第1行:play_montecarlo → play
|
||||
* 29页,第二段第1行:play_montecarlo → play
|
||||
* 29页,倒数第一个代码框的第1行:env.seed(0) → env.seed(3)
|
||||
* 29页,倒数第一个代码框第2行:play_montecarlo → play
|
||||
* 30页,第二个代码框第1行:play_montecarlo → play
|
||||
* 30页,第三个代码框:-102.61 → -106.63
|
||||
* 30页,第三段第2行:BespokeAgent → SimpleAgent
|
||||
* 137页,第一段第1行:虽然式 (5.19) 看起来有点儿复杂,但实现起来是比较简单的 → 式 (5.19) 看起来复杂,但其实现比较简单
|
||||
* 156页,第二段第1行:第一个好处是,→ 第一个好处是提高采样效率。
|
||||
* 156页,第二段第6行:第二个好处是,→ 第二个好处是增加样本多样性。
|
||||
|
||||
Reference in New Issue
Block a user