Merge branch 'master' of github.com:datawhalechina/easy-rl

This commit is contained in:
qiwang
2024-06-18 19:51:28 +08:00
2 changed files with 20 additions and 20 deletions

View File

@@ -164,7 +164,7 @@ url = {https://github.com/datawhalechina/easy-rl}
[![Forkers repo roster for @datawhalechina/easy-rl](https://reporoster.com/forks/datawhalechina/easy-rl)](https://github.com/datawhalechina/easy-rl/network/members) [![Forkers repo roster for @datawhalechina/easy-rl](https://reporoster.com/forks/datawhalechina/easy-rl)](https://github.com/datawhalechina/easy-rl/network/members)
## 关注我们 ## 关注我们
扫描下方二维码关注公众号Datawhale回复关键词“强化学习即可加入“Easy-RL读者交流群” 扫描下方二维码关注公众号Datawhale回复关键词“Easy-RL读者交流群即可加入“Easy-RL读者交流群”
<div align=center><img src="https://raw.githubusercontent.com/datawhalechina/easy-rl/master/docs/res/qrcode.jpeg" width = "250" height = "270" alt="Datawhale是一个专注AI领域的开源组织以“for the learner和学习者一起成长”为愿景构建对学习者最有价值的开源学习社区。关注我们一起学习成长。"></div> <div align=center><img src="https://raw.githubusercontent.com/datawhalechina/easy-rl/master/docs/res/qrcode.jpeg" width = "250" height = "270" alt="Datawhale是一个专注AI领域的开源组织以“for the learner和学习者一起成长”为愿景构建对学习者最有价值的开源学习社区。关注我们一起学习成长。"></div>
## LICENSE ## LICENSE

View File

@@ -470,7 +470,7 @@ for step in range(100):
大家可以点[这个链接](https://www.gymlibrary.dev/environments/classic_control/)看一看这些环境。在刚开始测试强化学习的时候,可以选择这些简单环境,因为这些环境可以在一两分钟之内见到一个效果。 大家可以点[这个链接](https://www.gymlibrary.dev/environments/classic_control/)看一看这些环境。在刚开始测试强化学习的时候,可以选择这些简单环境,因为这些环境可以在一两分钟之内见到一个效果。
如图 1.26 所示CartPole-v0 环境有两个动作:将小车向左移动和将小车向右移动。我们还可以得到观测:小车当前的位置,小车当前往左、往右移的速度,杆的角度以及杆的最高点(顶端)的速度。 如图 1.26 所示CartPole-v0 环境有两个动作:将小车向左移动和将小车向右移动。我们还可以得到观测:小车当前的位置,小车当前往左、往右移的速度,杆的角度以及杆的最高点(顶端)的速度。
观测越详细我们就可以更好地描述当前所有的状态。这里有奖励的定义如果能多走一步我们就会得到一个奖励奖励值为1所以我们需要存活尽可能多的时间来得到更多的奖励。当杆的角度大于某一个角度没能保持平衡或者小车的中心到达图形界面窗口的边缘或者累积步数大于200游戏就结束了,我们就输了。所以智能体的目的是控制杆,让它尽可能地保持平衡以及尽可能保持在环境的中央。 观测越详细我们就可以更好地描述当前所有的状态。这里有奖励的定义如果能多走一步我们就会得到一个奖励奖励值为1所以我们需要存活尽可能多的时间来得到更多的奖励。当杆的角度大于某一个角度没能保持平衡或者小车的中心到达图形界面窗口的边缘或者累积步数大于200游戏就结束了。所以智能体的目的是控制杆让它尽可能地保持平衡以及尽可能保持在环境的中央。
<div align=center> <div align=center>