resize image size

This commit is contained in:
qiwang067
2020-11-11 23:08:16 +08:00
parent c7ebeb56c0
commit 9bebd201db

View File

@@ -792,7 +792,7 @@ $$
* 首先来看 policy iteration。之前的例子在每个状态都是采取固定的随机策略就每个状态都是 0.25 的概率往上往下往左往右,没有策略的改变。
* 但是我们现在想做 policy iteration就是每个状态的策略都进行改变。Policy iteration 的过程是一个迭代过程。
![](img/2.55.png ':size=450')
![](img/2.55.png)
我们先在这个状态里面 run 一遍 policy evaluation就得到了一个 value function每个状态都有一个 value function。