update errata

This commit is contained in:
qiwang067
2022-04-18 23:58:21 +08:00
parent 6c6a3c5348
commit ea6cfc71e1

View File

@@ -9,6 +9,12 @@
![](res/Markov_chain.png ':size=350')
* 47页2.3.5节的第3行称为备份图backup diagram → 称为备份图backup diagram或回溯图
* 62页式(2.55) 前第2行$H$ 是迭代次数 → $H$ 是让 $V(s)$ 收敛所需的迭代次数
* 62页式(2.57) 改为
$$
\pi(s)=\underset{a}{\arg \max } \left[R(s, a)+\gamma \sum_{s^{\prime} \in S} p\left(s^{\prime} \mid s, a\right) V_{H+1}\left(s^{\prime}\right)\right]
$$
* 76页式(3.1) 中 $G$ 和 $r$ 后面的数字改为下标,即
$$