脚本描述
-
task0.py:离散动作任务 -
task1.py:离散动作任务,与task0.py唯一的区别就是Actor的激活函数是tanh而不是relu,在CartPole-v1上效果更好 -
task2.py:连续动作任务,#TODO待调试
task0.py:离散动作任务
task1.py:离散动作任务,与task0.py唯一的区别就是Actor的激活函数是tanh而不是relu,在CartPole-v1上效果更好
task2.py:连续动作任务,#TODO待调试