update errata
This commit is contained in:
@@ -96,7 +96,8 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
* 159页,式(6.22) 下面一段的第1行:$a$ 是让 $\hat{Q}$ 值最大的动作 → $a$ 是让 Q 值最大的动作
|
||||
* 156页,6.6节第1段的第2行:一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$
|
||||
* 156页,式(6.22) 下面一段的第1行:在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$
|
||||
* 176页,第1行:全连接网络 → 全连接神经网络
|
||||
* 176页,第1行下面的代码块:初始化 Q 网络,为全连接网络 → 初始化 Q 网络为全连接神经网络
|
||||
* 187页,图9.2的标题:深度 Q 网络 → 深度 Q 网络的两种评论员
|
||||
|
||||
Reference in New Issue
Block a user