From b7e9d7d880f14384ee25be73bf404ed6cb60f3eb Mon Sep 17 00:00:00 2001 From: qiwang067 Date: Sat, 14 Oct 2023 20:56:43 +0800 Subject: [PATCH] update errata --- docs/errata.md | 9 ++++++++- 1 file changed, 8 insertions(+), 1 deletion(-) diff --git a/docs/errata.md b/docs/errata.md index 827e018..f318db9 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -2,7 +2,14 @@ **如何使用勘误?首先找到你的书的印次,接下来对着下表索引印次,该印次之后所有的勘误都是你的书中所要注意的勘误,印次前的所有勘误在当印次和之后印次均已印刷修正。为方便读者,所有修订内容都列举在此。其中部分修订是为了更便于读者理解,并非原文有误。** +## 第1版第7次印刷(2023.10) + +* 147页,图6.7左下角:动作值 → 动作价值,图6.7替换成下图: + +![](res/6-7.png ':size=350') + ## 第1版第6次印刷(2023.06) + * 前勒口作者简介: * 王琦: * 上海交通大学计算机系人工智能教育部重点实验室博士生 → 上海交通大学人工智能教育部重点实验室博士生 @@ -23,7 +30,7 @@ pip install pygame * 29页,第一个代码框第1行:play_montecarlo → play * 29页,第一个代码框第2行:初始化 → 初始值 * 29页,第一个代码框第6行:显示图形界面,图形界面可以用 env.close() 语句关闭 → 显示图形界面 -* 29页,第二段改为:上面代码中的 play 函数可以让智能体和环境交互一个回合,该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量,其用于判断是否需要图形化显示。如果 render 为 True,则在交互过程中会调用 env.render() 以显示图形界面,通过调用 env.close() 可关闭图形界面。train 是 bool 型变量,其用于判断是否训练智能体,在训练过程中设置为 True,让智能体学习;在测试过程中设置为 False,让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值,其表示智能体与环境交互一个回合的回合总奖励。 +* 29页,第二段改为:上面代码中的 play() 函数可以让智能体和环境交互一个回合,该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量,其用于判断是否需要图形化显示。如果 render 为 True,则在交互过程中会调用 env.render() 以显示图形界面,通过调用 env.close() 可关闭图形界面。train 是 bool 型变量,其用于判断是否训练智能体,在训练过程中设置为 True,让智能体学习;在测试过程中设置为 False,让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值,其表示智能体与环境交互一个回合的回合总奖励。 * 29页,第三段:并在交互过程中进行图形化显示,可用 env.close()语句关闭图形界面 → 并显示图形界面 * 29页,倒数第一个代码框的第1行改为:env.seed(3) # 设置随机种子,让结果可复现 * 29页,倒数第一个代码框第2行:play_montecarlo → play