Update Soft Actor-Critic_Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor.md

This commit is contained in:
Yiyuan Yang
2022-11-20 23:36:41 +08:00
committed by GitHub
parent cfd43ea78d
commit e7b7972acf

View File

@@ -157,7 +157,11 @@ soft actor-critic算法用伪代码可表示为
虽然SAC算法采用了energy-based模型但是实际上策略分布仍为高斯分布存在一定的局限性。
====================================
作者:杨骏铭
研究单位:南京邮电大学
研究方向:强化学习、对抗学习
联系邮箱jmingyang@outlook.com