update errate

This commit is contained in:
qiwang067
2022-05-06 20:31:14 +08:00
parent 8cc5885beb
commit 420defb22c

View File

@@ -109,6 +109,8 @@ $$
* 191页图9.6加参考文献Arthur Juliani的文章“Simple Reinforcement Learning with Tensorflow Part 8: Asynchronous Actor-Critic Agents (A3C)”
* 195页9.7节的第1段的第1行生产对抗网络 → 生成对抗网络
* 200页第6行它的目标是要让每一场表演都获得观众尽可能多的欢呼声与掌声也就是要最大化未来的总奖励 → 评论员的最终目标是让演员的表演获得观众尽可能多的欢呼声和掌声,从而最大化未来的总收益
* 201页图10.7的上面一段的倒数第1行均方差 → 均方误差mean squared errorMSE