update errata

2023-10-14 20:56:43 +08:00
parent 293526d5b1
commit b7e9d7d880
1 changed files with 8 additions and 1 deletions
@@ -2,7 +2,14 @@

 **如何使用勘误？首先找到你的书的印次，接下来对着下表索引印次，该印次之后所有的勘误都是你的书中所要注意的勘误，印次前的所有勘误在当印次和之后印次均已印刷修正。为方便读者，所有修订内容都列举在此。其中部分修订是为了更便于读者理解，并非原文有误。**

+## 第1版第7次印刷（2023.10）
+
+* 147页，图6.7左下角：动作值 → 动作价值，图6.7替换成下图：
+
+![](res/6-7.png ':size=350')
+
 ## 第1版第6次印刷（2023.06）
+
 * 前勒口作者简介：
  * 王琦：
    * 上海交通大学计算机系人工智能教育部重点实验室博士生 → 上海交通大学人工智能教育部重点实验室博士生
@@ -23,7 +30,7 @@ pip install pygame
 * 29页，第一个代码框第1行：play_montecarlo → play
 * 29页，第一个代码框第2行：初始化 → 初始值
 * 29页，第一个代码框第6行：显示图形界面，图形界面可以用 env.close() 语句关闭 → 显示图形界面
-* 29页，第二段改为：上面代码中的 play 函数可以让智能体和环境交互一个回合，该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量，其用于判断是否需要图形化显示。如果 render 为 True，则在交互过程中会调用 env.render() 以显示图形界面，通过调用 env.close() 可关闭图形界面。train 是 bool 型变量，其用于判断是否训练智能体，在训练过程中设置为 True，让智能体学习；在测试过程中设置为 False，让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值，其表示智能体与环境交互一个回合的回合总奖励。
+* 29页，第二段改为：上面代码中的 play() 函数可以让智能体和环境交互一个回合，该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量，其用于判断是否需要图形化显示。如果 render 为 True，则在交互过程中会调用 env.render() 以显示图形界面，通过调用 env.close() 可关闭图形界面。train 是 bool 型变量，其用于判断是否训练智能体，在训练过程中设置为 True，让智能体学习；在测试过程中设置为 False，让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值，其表示智能体与环境交互一个回合的回合总奖励。
 * 29页，第三段：并在交互过程中进行图形化显示，可用 env.close()语句关闭图形界面 → 并显示图形界面
 * 29页，倒数第一个代码框的第1行改为：env.seed(3) # 设置随机种子，让结果可复现
 * 29页，倒数第一个代码框第2行：play_montecarlo → play