update errata
This commit is contained in:
@@ -6,6 +6,10 @@
|
||||
|
||||
* 2页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链
|
||||
* 17页,第一段的倒数第4行:策略梯度 → 策略梯度(policy gradient,PG)
|
||||
* 24页,第一段下面的代码下面加入注解:
|
||||
|
||||
> 上面这段代码只是示例,其目的是让读者了解强化学习算法代码实现的框架,并非完整代码,`load_agent` 函数并未定义,所以运行这段代码会报错。
|
||||
|
||||
* 34页,2.1.2节的标题:马尔可夫过程/马尔可夫链 → 马尔可夫链
|
||||
* 34页,2.1.2节的第2段的第1行:也称为**马尔可夫链(Markov chain)**。 → 也称为**马尔可夫链(Markov chain)**。马尔可夫链是最简单的马尔可夫过程,其状态是有限的。
|
||||
* 35页的图2.2 和 41页的图2.5(a)替换成下图:
|
||||
|
||||
Reference in New Issue
Block a user