639 B
639 B
Policy Gradient
实现的是Policy Gradient最基本的REINFORCE方法
使用说明
直接运行main.py即可
原理讲解
参考我的博客Policy Gradient算法实战
环境
python 3.7.9、pytorch 1.6.0
实现的是Policy Gradient最基本的REINFORCE方法
直接运行main.py即可
参考我的博客Policy Gradient算法实战
python 3.7.9、pytorch 1.6.0