diff --git a/docs/errata.md b/docs/errata.md index 8d38454..be5cbbb 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -6,6 +6,10 @@ * 2页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链 * 17页,第一段的倒数第4行:策略梯度 → 策略梯度(policy gradient,PG) +* 24页,第一段下面的代码下面加入注解: + +> 上面这段代码只是示例,其目的是让读者了解强化学习算法代码实现的框架,并非完整代码,`load_agent` 函数并未定义,所以运行这段代码会报错。 + * 34页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链 * 34页,2.1.2节的第2段的第1行:也称为**马尔可夫链(Markov chain)**。 → 也称为**马尔可夫链(Markov chain)**。马尔可夫链是最简单的马尔可夫过程,其状态是有限的。 * 35页的图2.2 和 41页的图2.5(a)替换成下图: