更新PPO，增加PER DQN

2022-11-14 21:35:28 +08:00
parent dc78698262
commit b8aec4c188
34 changed files with 1993 additions and 476 deletions
--- a/projects/codes/common/launcher.py
+++ b/projects/codes/common/launcher.py
@@ -36,11 +36,11 @@ class Launcher:
        ep_reward = 0
        ep_step = 0
        return agent,ep_reward,ep_step
-    def test_one_episode(self,env, agent, cfg):
+    def test_one_episode(self, env, agent, cfg):
        ep_reward = 0
        ep_step = 0
        return agent,ep_reward,ep_step
-    def evaluate(self,env, agent, cfg):
+    def evaluate(self, env, agent, cfg):
        sum_eval_reward = 0
        for _ in range(cfg.eval_eps):
            _,eval_ep_reward,_ = self.test_one_episode(env, agent, cfg)