update ch2 typo
This commit is contained in:
@@ -765,7 +765,7 @@ $$
|
||||
|
||||
价值迭代算法的过程如下。
|
||||
|
||||
(1)初始化:令 $k=1$,对于所有状态 $s$,$V_0(s)=0$。
|
||||
(1)初始化:令 $k=0$,对于所有状态 $s$,$V_0(s)=0$。
|
||||
|
||||
(2)对于 $k=1:H$($H$是让$V(s)$收敛所需的迭代次数)
|
||||
|
||||
|
||||
Reference in New Issue
Block a user