update
This commit is contained in:
@@ -1,5 +1,5 @@
|
||||
# DQN
|
||||
|
||||
#TODO
|
||||
## 原理简介
|
||||
DQN是Q-leanning算法的优化和延伸,Q-leaning中使用有限的Q表存储值的信息,而DQN中则用神经网络替代Q表存储信息,这样更适用于高维的情况,相关知识基础可参考[datawhale李宏毅笔记-Q学习](https://datawhalechina.github.io/easy-rl/#/chapter6/chapter6)。
|
||||
|
||||
|
||||
Reference in New Issue
Block a user