update errata
This commit is contained in:
@@ -38,6 +38,8 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
* 200页,第6行:它的目标是要让每一场表演都获得观众尽可能多的欢呼声与掌声,也就是要最大化未来的总奖励 → 评论员的最终目标是让演员的表演获得观众尽可能多的欢呼声和掌声,从而最大化未来的总收益
|
||||
|
||||
* 229页,第2行:很强的序列 → 很长的序列
|
||||
|
||||
|
||||
Reference in New Issue
Block a user