update
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
# 使用 Q-learning 实现贪吃蛇
|
||||
# 贪吃蛇
|
||||
|
||||
贪吃蛇是一个起源于1976年的街机游戏 Blockade,玩家控制蛇上下左右吃到食物并将身体增长,吃到食物后移动速度逐渐加快,直到碰到墙体或者蛇的身体算游戏结束。
|
||||
|
||||

|
||||

|
||||
|
||||
如图,本次任务整个游戏版面大小为560X560,绿色部分就是我们的智能体贪吃蛇,红色方块就是食物,墙位于四周,一旦食物被吃掉,会在下一个随机位置刷出新的食物。蛇的每一节以及食物的大小为40X40,除开墙体(厚度也为40),蛇可以活动的范围为480X480,也就是12X12的栅格。环境的状态等信息如下:
|
||||
|
||||
@@ -34,8 +34,5 @@
|
||||
|
||||
* reward:如果吃到食物给一个+1的reward,如果蛇没了就-1,其他情况给-0.1的reward
|
||||
|
||||
## 任务要求
|
||||
|
||||
设计一个Q-learning agent用于学习snake游戏,并绘制reward以及滑动平均后的reward随episode的变化曲线图并记录超参数写成报告。
|
||||
|
||||
[参考代码](https://github.com/datawhalechina/leedeeprl-notes/tree/master/codes/snake)
|
||||
Reference in New Issue
Block a user