Merge branch 'master' of github.com:datawhalechina/easy-rl

This commit is contained in:
qiwang
2024-06-24 13:12:50 +08:00

View File

@@ -120,4 +120,4 @@
**1-5** 友善的面试官: 你了解有模型和免模型吗?两者具体有什么区别呢?
我认为两者的区别主要在于是否需要对真实的环境进行建模,免模型方法不需要对环境进行建模,直接与真实环境进行交互即可,所以其通常需要较多的数据或者采样工作来优化策略,这也使其对于真实环境具有更好的泛化性能;而有模型方法需要对环境进行建模,同时在真实环境与虚拟环境中进行学习,如果建模的环境与真实环境的差异较大,那么会限制其泛化性能。现在通常使用模型方法进行模型的构建工作
我认为两者的区别主要在于是否需要对真实的环境进行建模,免模型方法不需要对环境进行建模,直接与真实环境进行交互即可,所以其通常需要较多的数据或者采样工作来优化策略,这也使其对于真实环境具有更好的泛化性能;而有模型方法需要对环境进行建模,同时在真实环境与虚拟环境中进行学习,如果建模的环境与真实环境的差异较大,那么会限制其泛化性能。随着技术的发展和数据的积累,现在通常使用模型方法。