update errata

This commit is contained in:
qiwang067
2022-05-08 10:37:10 +08:00
parent d068c03061
commit e2d3fb6c31

View File

@@ -96,7 +96,8 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\
\end{aligned}
$$
* 159页,式(6.22) 下面一段的第1行:$a$ 是让 $\hat{Q}$ 值最大的动作 → $a$ 是让 Q 值最大的动作
* 156页,6.6节第1段的第2行:一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$
* 156页式(6.22) 下面一段的第1行在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$
* 176页第1行全连接网络 → 全连接神经网络
* 176页第1行下面的代码块初始化 Q 网络,为全连接网络 → 初始化 Q 网络为全连接神经网络
* 187页图9.2的标题:深度 Q 网络 → 深度 Q 网络的两种评论员