update errata

This commit is contained in:
qiwang067
2022-06-08 18:10:08 +08:00
parent 70d1e5695e
commit 514d327831

View File

@@ -6,6 +6,10 @@
* 2页2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链
* 17页第一段的倒数第4行策略梯度 → 策略梯度policy gradientPG
* 24页第一段下面的代码下面加入注解
> 上面这段代码只是示例,其目的是让读者了解强化学习算法代码实现的框架,并非完整代码,`load_agent` 函数并未定义,所以运行这段代码会报错。
* 34页2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链
* 34页2.1.2节的第2段的第1行也称为**马尔可夫链Markov chain**。 → 也称为**马尔可夫链Markov chain**。马尔可夫链是最简单的马尔可夫过程,其状态是有限的。
* 35页的图2.2 和 41页的图2.5a替换成下图