update errata

2022-06-08 18:10:08 +08:00
parent 70d1e5695e
commit 514d327831
1 changed files with 4 additions and 0 deletions
@@ -6,6 +6,10 @@

 * 2页，2.1.2节的标题：马尔可夫过程/马尔可夫链 → 马尔可夫链
 * 17页，第一段的倒数第4行：策略梯度 → 策略梯度（policy gradient，PG）
+* 24页，第一段下面的代码下面加入注解：
+
+> 上面这段代码只是示例，其目的是让读者了解强化学习算法代码实现的框架，并非完整代码，`load_agent` 函数并未定义，所以运行这段代码会报错。
+
 * 34页，2.1.2节的标题：马尔可夫过程/马尔可夫链 → 马尔可夫链
 * 34页，2.1.2节的第2段的第1行：也称为**马尔可夫链（Markov chain）**。 → 也称为**马尔可夫链（Markov chain）**。马尔可夫链是最简单的马尔可夫过程，其状态是有限的。
 * 35页的图2.2 和 41页的图2.5（a）替换成下图：