update erratea

This commit is contained in:
qiwang067
2022-05-21 21:13:56 +08:00
parent b584b327da
commit 04ca16ef86

View File

@@ -97,6 +97,7 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\
\end{aligned}
$$
* 154页6.5节第1段的第5行每一笔数据就是记得说我们之前 → 每一笔数据是一个四元组(状态、动作、奖励、下一状态),即我们之前
* 156页6.6节第1段的第2行一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$
* 156页式(6.22) 下面一段的第1行在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$
* 176页第1行全连接网络 → 全连接神经网络