update ch1.md

2023-07-25 16:50:47 +08:00
parent 5d248d68b7
commit e164cf27a6
1 changed files with 1 additions and 1 deletions
@@ -610,7 +610,7 @@ def play(env, agent, render=False, train=False):

 上面代码中的 play 函数可以让智能体和环境交互一个回合，该函数有 4 个参数。env 是环境类。agent 是智能体类。render 是 bool 型变量，其用于判断是否需要图形化显示。如果 render 为 True，则在交互过程中会调用 env.render() 以显示图形界面，通过调用 env.close() 可关闭图形界面。train 是 bool 型变量，其用于判断是否训练智能体，在训练过程中设置为 True，让智能体学习；在测试过程中设置为 False，让智能体保持不变。该函数的返回值 episode\_reward 是 float 型的数值，其表示智能体与环境交互一个回合的回合总奖励。

-接下来，我们使用下面的代码让智能体和环境交互一个回合，并且显示图像界面。
+接下来，我们使用下面的代码让智能体和环境交互一个回合，并显示图形界面。

 ```python
 env.seed(3) # 设置随机种子，让结果可复现