From 9aee8da2285674f44366da89f591e8a86500d259 Mon Sep 17 00:00:00 2001
From: JohnJim0816 <johnjim0816@gmail.com>
Date: Tue, 24 Nov 2020 20:38:49 +0800
Subject: [PATCH] update project1

---
 docs/chapter3/project1.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/chapter3/project1.md b/docs/chapter3/project1.md
index 4317216..f9203df 100644
--- a/docs/chapter3/project1.md
+++ b/docs/chapter3/project1.md
@@ -93,7 +93,7 @@
 
 ## 备注
 
-* 注意 e-greedy 策略的使用，以及相应的参数epsilon如何衰减
+* 注意 $\varepsilon -greedy$ 策略的使用，以及相应的参数$\varepsilon$如何衰减
 * 训练模型和测试模型的时候选择动作有一些不同，训练时采取e-greedy策略，而测试时直接选取Q值最大对应的动作，所以算法在动作选择的时候会包括sample(训练时的动作采样)和predict(测试时的动作选择)
 
 * Q值最大对应的动作可能不止一个，此时可以随机选择一个输出结果
\ No newline at end of file