From 730a689b1d78ed60839ce8a776bac2f9abc57957 Mon Sep 17 00:00:00 2001 From: qiwang067 Date: Thu, 18 Aug 2022 16:57:21 +0800 Subject: [PATCH] udpate chapter4.md --- docs/chapter4/chapter4.md | 2 -- 1 file changed, 2 deletions(-) diff --git a/docs/chapter4/chapter4.md b/docs/chapter4/chapter4.md index 4fd6d60..4c68267 100644 --- a/docs/chapter4/chapter4.md +++ b/docs/chapter4/chapter4.md @@ -181,13 +181,11 @@ $$ 我们要把每一笔训练数据,都使用 $R(\tau)$ 进行加权。如图 4.9 所示,我们使用 PyTorch 或 TensorFlow 之类的深度学习框架计算梯度就结束了,与一般分类问题差不多。 -
图 4.9 自动求梯度
- ## 4.2 策略梯度实现技巧 下面我们介绍一些在实现策略梯度时可以使用的技巧。 ### 4.2.1 技巧 1:添加基线