Update chapter3_questions&keywords.md

This commit is contained in:
David Young
2021-02-04 16:35:50 +08:00
committed by GitHub
parent d50b346364
commit e4aa7ec1b1

View File

@@ -94,5 +94,5 @@
- 高冷的面试官请问蒙特卡洛方法Monte Carlo AlgorithmMC和时序差分(Temporal DifferenceTD)算法是无偏估计吗?另外谁的方法更大呢?为什么呢?
蒙特卡洛方法MC是无偏估计时序差分TD是有偏估计MC的方差较大TD的方差较小原因在于TD中使用了自举bootstrapping的方法实现了基于平滑的效果导致估计的值函数的方差更小。
蒙特卡洛方法MC是无偏估计时序差分TD是有偏估计MC的方差较大TD的方差较小原因在于TD中使用了自举bootstrapping的方法实现了基于平滑的效果导致估计的值函数的方差更小。