This commit is contained in:
qiwang067
2021-05-15 13:58:04 +08:00
parent 9fde158e87
commit 162f2158c9

View File

@@ -19,7 +19,7 @@
> 通常假设样本空间中全体样本服从一个未知分布,我们获得的每个样本都是独立地从这个分布上采样获得的,即独立同分布(independent and identically distributed简称 i.i.d.)。 > 通常假设样本空间中全体样本服从一个未知分布,我们获得的每个样本都是独立地从这个分布上采样获得的,即独立同分布(independent and identically distributed简称 i.i.d.)。
![](img/1.3.png ':size=350') ![](img/1.3.png ':size=300')
在强化学习里面,这两点其实都不满足。举一个 Atari Breakout 游戏的例子,这是一个打砖块的游戏,控制木板左右移动把球反弹到上面来消除砖块。 在强化学习里面,这两点其实都不满足。举一个 Atari Breakout 游戏的例子,这是一个打砖块的游戏,控制木板左右移动把球反弹到上面来消除砖块。