diff --git a/docs/errata.md b/docs/errata.md index e0f4b0a..5f0ac9a 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -5,6 +5,7 @@ ## 第1版第1次印刷(2022.03) * 2页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链 +* 17页,第一段的倒数第4行:策略梯度 → 策略梯度(policy gradient,PG) * 34页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链 * 34页,2.1.2节的第2段的第1行:也称为**马尔可夫链(Markov chain)**。 → 也称为**马尔可夫链(Markov chain)**。马尔可夫链是最简单的马尔可夫过程,其状态是有限的。 * 35页的图2.2 和 41页的图2.5(a)替换成下图: