From e2d3fb6c317717b0090433b1a396894b4a50592d Mon Sep 17 00:00:00 2001 From: qiwang067 Date: Sun, 8 May 2022 10:37:10 +0800 Subject: [PATCH] update errata --- docs/errata.md | 3 ++- 1 file changed, 2 insertions(+), 1 deletion(-) diff --git a/docs/errata.md b/docs/errata.md index b48b31c..e0f4b0a 100644 --- a/docs/errata.md +++ b/docs/errata.md @@ -96,7 +96,8 @@ V^{\pi}(s) &\le Q^{\pi}(s,\pi'(s)) \\ \end{aligned} $$ -* 159页,式(6.22) 下面一段的第1行:$a$ 是让 $\hat{Q}$ 值最大的动作 → $a$ 是让 Q 值最大的动作 +* 156页,6.6节第1段的第2行:一开始目标 Q 网络 → 一开始目标网络 $\hat{Q}$ +* 156页,式(6.22) 下面一段的第1行:在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 Q → 在状态 $s_{i+1}$ 会采取的动作 $a$ 就是可以让 $\hat{Q}$ * 176页,第1行:全连接网络 → 全连接神经网络 * 176页,第1行下面的代码块:初始化 Q 网络,为全连接网络 → 初始化 Q 网络为全连接神经网络 * 187页,图9.2的标题:深度 Q 网络 → 深度 Q 网络的两种评论员