update errata

This commit is contained in:
qiwang067
2022-04-16 23:11:13 +08:00
parent ef85f6316b
commit e822754c88

View File

@@ -45,6 +45,8 @@ $$
![](res/A3C.png ':size=450')
* 191页图9.6加参考文献Arthur Juliani的文章“Simple Reinforcement Learning with Tensorflow Part 8: Asynchronous Actor-Critic Agents (A3C)”
* 200页第6行它的目标是要让每一场表演都获得观众尽可能多的欢呼声与掌声也就是要最大化未来的总奖励 → 评论员的最终目标是让演员的表演获得观众尽可能多的欢呼声和掌声,从而最大化未来的总收益
* 201页图10.7的上面一段的倒数第1行均方差 → 均方误差mean squared errorMSE