From e1462e7b2b7aa067a334d468830ff2c7c3ff7cf1 Mon Sep 17 00:00:00 2001 From: qiwang067 Date: Fri, 21 Jul 2023 23:36:50 +0800 Subject: [PATCH] update errata --- docs/errata.md | 10 +++++++++- 1 file changed, 9 insertions(+), 1 deletion(-) diff --git a/docs/errata.md b/docs/errata.md index be07f96..511f0aa 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -14,9 +14,17 @@ pip install pygame ``` * 28页,第一个代码框的第1行:观测空间 = Box(2,) → 观测空间 = Box([-1.2 -0.07], [0.6 0.07], (2,), float32) -* 28页,第二段第1行:观测空间是形状为 → 观测是形状为 +* 28页,第二段改为:观测是长度为 2 的数组,动作是整数,其取值范围为{0,1,2}。 +* 28页,第三段改为:接下来实现智能体来控制小车移动,对应代码如下。 +* 28页,第二个代码框第1行和倒数第1行:BespokeAgent → SimpleAgent +* 28页,倒数第一段改为:SimpleAgent 类的 decide()方法用于决策,learn() 方法用于学习,该智能体不是强化学习智能体,不能学习,只能根据给定的数学表达式进行决策。 +* 29页,第一个代码框第1行:play_montecarlo → play +* 29页,第二段第1行:play_montecarlo → play * 29页,倒数第一个代码框的第1行:env.seed(0) → env.seed(3) +* 29页,倒数第一个代码框第2行:play_montecarlo → play +* 30页,第二个代码框第1行:play_montecarlo → play * 30页,第三个代码框:-102.61 → -106.63 +* 30页,第三段第2行:BespokeAgent → SimpleAgent * 137页,第一段第1行:虽然式 (5.19) 看起来有点儿复杂,但实现起来是比较简单的 → 式 (5.19) 看起来复杂,但其实现比较简单 * 156页,第二段第1行:第一个好处是,→ 第一个好处是提高采样效率。 * 156页,第二段第6行:第二个好处是,→ 第二个好处是增加样本多样性。