fix ch1
This commit is contained in:
@@ -19,7 +19,7 @@
|
||||
|
||||
> 通常假设样本空间中全体样本服从一个未知分布,我们获得的每个样本都是独立地从这个分布上采样获得的,即独立同分布(independent and identically distributed,简称 i.i.d.)。
|
||||
|
||||

|
||||

|
||||
|
||||
在强化学习里面,这两点其实都不满足。举一个 Atari Breakout 游戏的例子,这是一个打砖块的游戏,控制木板左右移动把球反弹到上面来消除砖块。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user