From 04ca16ef868f78c09f9e9550c5a9fb6a025b17ce Mon Sep 17 00:00:00 2001 From: qiwang067 Date: Sat, 21 May 2022 21:13:56 +0800 Subject: [PATCH] update erratea --- docs/errata.md | 1 + 1 file changed, 1 insertion(+) diff --git a/docs/errata.md b/docs/errata.md index 5f0ac9a..8d38454 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -97,6 +97,7 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\ \end{aligned} $$ +* 154页,6.5节第1段的第5行:每一笔数据就是记得说,我们之前 → 每一笔数据是一个四元组(状态、动作、奖励、下一状态),即我们之前 * 156页,6.6节第1段的第2行:一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$ * 156页,式(6.22) 下面一段的第1行:在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$ * 176页,第1行:全连接网络 → 全连接神经网络