update erratea
This commit is contained in:
@@ -97,6 +97,7 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\
|
||||
\end{aligned}
|
||||
$$
|
||||
|
||||
* 154页,6.5节第1段的第5行:每一笔数据就是记得说,我们之前 → 每一笔数据是一个四元组(状态、动作、奖励、下一状态),即我们之前
|
||||
* 156页,6.6节第1段的第2行:一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$
|
||||
* 156页,式(6.22) 下面一段的第1行:在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$
|
||||
* 176页,第1行:全连接网络 → 全连接神经网络
|
||||
|
||||
Reference in New Issue
Block a user