hot update A2C

This commit is contained in:
johnjim0816
2022-08-29 15:12:33 +08:00
parent 99a3c1afec
commit 0b0f7e857d
109 changed files with 8213 additions and 1658 deletions

View File

@@ -5,7 +5,7 @@ Author: John
Email: johnjim0816@gmail.com
Date: 2020-09-11 23:03:00
LastEditor: John
LastEditTime: 2022-08-25 14:59:15
LastEditTime: 2022-08-26 22:46:21
Discription:
Environment:
'''
@@ -57,7 +57,10 @@ class Main(Launcher):
env = CliffWalkingWapper(env)
if cfg['seed'] !=0: # set random seed
all_seed(env,seed=cfg["seed"])
n_states = env.observation_space.n # state dimension
try: # state dimension
n_states = env.observation_space.n # print(hasattr(env.observation_space, 'n'))
except AttributeError:
n_states = env.observation_space.shape[0] # print(hasattr(env.observation_space, 'shape'))
n_actions = env.action_space.n # action dimension
print(f"n_states: {n_states}, n_actions: {n_actions}")
cfg.update({"n_states":n_states,"n_actions":n_actions}) # update to cfg paramters

View File

@@ -1,19 +0,0 @@
{
"algo_name": "Q-learning",
"env_name": "CliffWalking-v0",
"train_eps": 400,
"test_eps": 20,
"gamma": 0.9,
"epsilon_start": 0.95,
"epsilon_end": 0.01,
"epsilon_decay": 300,
"lr": 0.1,
"device": "cpu",
"seed": 10,
"show_fig": false,
"save_fig": true,
"result_path": "/Users/jj/Desktop/rl-tutorials/codes/QLearning/outputs/CliffWalking-v0/20220824-103255/results/",
"model_path": "/Users/jj/Desktop/rl-tutorials/codes/QLearning/outputs/CliffWalking-v0/20220824-103255/models/",
"n_states": 48,
"n_actions": 4
}

View File

@@ -1,21 +0,0 @@
episodes,rewards
0,-13
1,-13
2,-13
3,-13
4,-13
5,-13
6,-13
7,-13
8,-13
9,-13
10,-13
11,-13
12,-13
13,-13
14,-13
15,-13
16,-13
17,-13
18,-13
19,-13
1 episodes rewards
2 0 -13
3 1 -13
4 2 -13
5 3 -13
6 4 -13
7 5 -13
8 6 -13
9 7 -13
10 8 -13
11 9 -13
12 10 -13
13 11 -13
14 12 -13
15 13 -13
16 14 -13
17 15 -13
18 16 -13
19 17 -13
20 18 -13
21 19 -13

View File

@@ -1,401 +0,0 @@
episodes,rewards
0,-2131
1,-1086
2,-586
3,-220
4,-154
5,-122
6,-150
7,-159
8,-164
9,-88
10,-195
11,-114
12,-60
13,-179
14,-101
15,-304
16,-96
17,-119
18,-113
19,-98
20,-106
21,-105
22,-77
23,-51
24,-105
25,-136
26,-100
27,-29
28,-79
29,-114
30,-82
31,-70
32,-75
33,-51
34,-94
35,-52
36,-93
37,-71
38,-73
39,-48
40,-52
41,-96
42,-46
43,-65
44,-57
45,-41
46,-104
47,-51
48,-181
49,-229
50,-39
51,-69
52,-53
53,-59
54,-26
55,-75
56,-31
57,-60
58,-63
59,-40
60,-35
61,-79
62,-42
63,-22
64,-73
65,-71
66,-18
67,-55
68,-29
69,-43
70,-70
71,-49
72,-42
73,-29
74,-81
75,-36
76,-38
77,-36
78,-52
79,-28
80,-42
81,-52
82,-66
83,-31
84,-27
85,-49
86,-28
87,-54
88,-34
89,-35
90,-50
91,-36
92,-36
93,-46
94,-34
95,-135
96,-39
97,-36
98,-26
99,-56
100,-40
101,-40
102,-26
103,-28
104,-31
105,-35
106,-26
107,-57
108,-44
109,-41
110,-31
111,-26
112,-25
113,-41
114,-32
115,-44
116,-30
117,-32
118,-30
119,-25
120,-23
121,-47
122,-24
123,-45
124,-39
125,-21
126,-43
127,-143
128,-26
129,-20
130,-32
131,-16
132,-24
133,-42
134,-25
135,-36
136,-19
137,-29
138,-43
139,-17
140,-150
141,-32
142,-34
143,-19
144,-26
145,-30
146,-31
147,-49
148,-33
149,-21
150,-17
151,-48
152,-34
153,-20
154,-20
155,-26
156,-21
157,-13
158,-40
159,-22
160,-26
161,-30
162,-29
163,-25
164,-26
165,-27
166,-21
167,-29
168,-24
169,-17
170,-22
171,-35
172,-35
173,-18
174,-135
175,-15
176,-23
177,-28
178,-25
179,-24
180,-29
181,-31
182,-24
183,-129
184,-45
185,-24
186,-17
187,-20
188,-21
189,-23
190,-15
191,-32
192,-22
193,-19
194,-17
195,-45
196,-15
197,-14
198,-14
199,-37
200,-23
201,-17
202,-19
203,-21
204,-23
205,-27
206,-14
207,-18
208,-23
209,-34
210,-23
211,-13
212,-25
213,-17
214,-13
215,-21
216,-29
217,-18
218,-24
219,-15
220,-27
221,-25
222,-21
223,-19
224,-17
225,-18
226,-13
227,-22
228,-14
229,-13
230,-29
231,-23
232,-15
233,-15
234,-14
235,-28
236,-25
237,-17
238,-23
239,-29
240,-15
241,-14
242,-15
243,-23
244,-15
245,-16
246,-19
247,-13
248,-16
249,-17
250,-25
251,-30
252,-13
253,-14
254,-15
255,-22
256,-14
257,-17
258,-126
259,-15
260,-21
261,-16
262,-23
263,-14
264,-13
265,-13
266,-19
267,-13
268,-19
269,-17
270,-17
271,-13
272,-19
273,-13
274,-13
275,-16
276,-22
277,-14
278,-15
279,-19
280,-34
281,-13
282,-15
283,-32
284,-13
285,-13
286,-13
287,-14
288,-16
289,-13
290,-13
291,-17
292,-13
293,-13
294,-22
295,-14
296,-15
297,-13
298,-13
299,-13
300,-16
301,-13
302,-14
303,-13
304,-13
305,-13
306,-24
307,-13
308,-13
309,-15
310,-13
311,-13
312,-13
313,-15
314,-13
315,-19
316,-15
317,-17
318,-13
319,-13
320,-13
321,-13
322,-13
323,-15
324,-13
325,-13
326,-13
327,-123
328,-13
329,-13
330,-13
331,-13
332,-13
333,-13
334,-13
335,-13
336,-16
337,-13
338,-23
339,-13
340,-13
341,-13
342,-13
343,-13
344,-13
345,-13
346,-13
347,-13
348,-13
349,-13
350,-134
351,-13
352,-13
353,-13
354,-13
355,-13
356,-13
357,-13
358,-13
359,-13
360,-15
361,-13
362,-13
363,-13
364,-13
365,-13
366,-13
367,-13
368,-13
369,-14
370,-13
371,-13
372,-13
373,-13
374,-13
375,-13
376,-13
377,-124
378,-13
379,-13
380,-13
381,-13
382,-13
383,-13
384,-13
385,-13
386,-13
387,-13
388,-13
389,-121
390,-13
391,-13
392,-13
393,-13
394,-13
395,-13
396,-13
397,-13
398,-17
399,-13
1 episodes rewards
2 0 -2131
3 1 -1086
4 2 -586
5 3 -220
6 4 -154
7 5 -122
8 6 -150
9 7 -159
10 8 -164
11 9 -88
12 10 -195
13 11 -114
14 12 -60
15 13 -179
16 14 -101
17 15 -304
18 16 -96
19 17 -119
20 18 -113
21 19 -98
22 20 -106
23 21 -105
24 22 -77
25 23 -51
26 24 -105
27 25 -136
28 26 -100
29 27 -29
30 28 -79
31 29 -114
32 30 -82
33 31 -70
34 32 -75
35 33 -51
36 34 -94
37 35 -52
38 36 -93
39 37 -71
40 38 -73
41 39 -48
42 40 -52
43 41 -96
44 42 -46
45 43 -65
46 44 -57
47 45 -41
48 46 -104
49 47 -51
50 48 -181
51 49 -229
52 50 -39
53 51 -69
54 52 -53
55 53 -59
56 54 -26
57 55 -75
58 56 -31
59 57 -60
60 58 -63
61 59 -40
62 60 -35
63 61 -79
64 62 -42
65 63 -22
66 64 -73
67 65 -71
68 66 -18
69 67 -55
70 68 -29
71 69 -43
72 70 -70
73 71 -49
74 72 -42
75 73 -29
76 74 -81
77 75 -36
78 76 -38
79 77 -36
80 78 -52
81 79 -28
82 80 -42
83 81 -52
84 82 -66
85 83 -31
86 84 -27
87 85 -49
88 86 -28
89 87 -54
90 88 -34
91 89 -35
92 90 -50
93 91 -36
94 92 -36
95 93 -46
96 94 -34
97 95 -135
98 96 -39
99 97 -36
100 98 -26
101 99 -56
102 100 -40
103 101 -40
104 102 -26
105 103 -28
106 104 -31
107 105 -35
108 106 -26
109 107 -57
110 108 -44
111 109 -41
112 110 -31
113 111 -26
114 112 -25
115 113 -41
116 114 -32
117 115 -44
118 116 -30
119 117 -32
120 118 -30
121 119 -25
122 120 -23
123 121 -47
124 122 -24
125 123 -45
126 124 -39
127 125 -21
128 126 -43
129 127 -143
130 128 -26
131 129 -20
132 130 -32
133 131 -16
134 132 -24
135 133 -42
136 134 -25
137 135 -36
138 136 -19
139 137 -29
140 138 -43
141 139 -17
142 140 -150
143 141 -32
144 142 -34
145 143 -19
146 144 -26
147 145 -30
148 146 -31
149 147 -49
150 148 -33
151 149 -21
152 150 -17
153 151 -48
154 152 -34
155 153 -20
156 154 -20
157 155 -26
158 156 -21
159 157 -13
160 158 -40
161 159 -22
162 160 -26
163 161 -30
164 162 -29
165 163 -25
166 164 -26
167 165 -27
168 166 -21
169 167 -29
170 168 -24
171 169 -17
172 170 -22
173 171 -35
174 172 -35
175 173 -18
176 174 -135
177 175 -15
178 176 -23
179 177 -28
180 178 -25
181 179 -24
182 180 -29
183 181 -31
184 182 -24
185 183 -129
186 184 -45
187 185 -24
188 186 -17
189 187 -20
190 188 -21
191 189 -23
192 190 -15
193 191 -32
194 192 -22
195 193 -19
196 194 -17
197 195 -45
198 196 -15
199 197 -14
200 198 -14
201 199 -37
202 200 -23
203 201 -17
204 202 -19
205 203 -21
206 204 -23
207 205 -27
208 206 -14
209 207 -18
210 208 -23
211 209 -34
212 210 -23
213 211 -13
214 212 -25
215 213 -17
216 214 -13
217 215 -21
218 216 -29
219 217 -18
220 218 -24
221 219 -15
222 220 -27
223 221 -25
224 222 -21
225 223 -19
226 224 -17
227 225 -18
228 226 -13
229 227 -22
230 228 -14
231 229 -13
232 230 -29
233 231 -23
234 232 -15
235 233 -15
236 234 -14
237 235 -28
238 236 -25
239 237 -17
240 238 -23
241 239 -29
242 240 -15
243 241 -14
244 242 -15
245 243 -23
246 244 -15
247 245 -16
248 246 -19
249 247 -13
250 248 -16
251 249 -17
252 250 -25
253 251 -30
254 252 -13
255 253 -14
256 254 -15
257 255 -22
258 256 -14
259 257 -17
260 258 -126
261 259 -15
262 260 -21
263 261 -16
264 262 -23
265 263 -14
266 264 -13
267 265 -13
268 266 -19
269 267 -13
270 268 -19
271 269 -17
272 270 -17
273 271 -13
274 272 -19
275 273 -13
276 274 -13
277 275 -16
278 276 -22
279 277 -14
280 278 -15
281 279 -19
282 280 -34
283 281 -13
284 282 -15
285 283 -32
286 284 -13
287 285 -13
288 286 -13
289 287 -14
290 288 -16
291 289 -13
292 290 -13
293 291 -17
294 292 -13
295 293 -13
296 294 -22
297 295 -14
298 296 -15
299 297 -13
300 298 -13
301 299 -13
302 300 -16
303 301 -13
304 302 -14
305 303 -13
306 304 -13
307 305 -13
308 306 -24
309 307 -13
310 308 -13
311 309 -15
312 310 -13
313 311 -13
314 312 -13
315 313 -15
316 314 -13
317 315 -19
318 316 -15
319 317 -17
320 318 -13
321 319 -13
322 320 -13
323 321 -13
324 322 -13
325 323 -15
326 324 -13
327 325 -13
328 326 -13
329 327 -123
330 328 -13
331 329 -13
332 330 -13
333 331 -13
334 332 -13
335 333 -13
336 334 -13
337 335 -13
338 336 -16
339 337 -13
340 338 -23
341 339 -13
342 340 -13
343 341 -13
344 342 -13
345 343 -13
346 344 -13
347 345 -13
348 346 -13
349 347 -13
350 348 -13
351 349 -13
352 350 -134
353 351 -13
354 352 -13
355 353 -13
356 354 -13
357 355 -13
358 356 -13
359 357 -13
360 358 -13
361 359 -13
362 360 -15
363 361 -13
364 362 -13
365 363 -13
366 364 -13
367 365 -13
368 366 -13
369 367 -13
370 368 -13
371 369 -14
372 370 -13
373 371 -13
374 372 -13
375 373 -13
376 374 -13
377 375 -13
378 376 -13
379 377 -124
380 378 -13
381 379 -13
382 380 -13
383 381 -13
384 382 -13
385 383 -13
386 384 -13
387 385 -13
388 386 -13
389 387 -13
390 388 -13
391 389 -121
392 390 -13
393 391 -13
394 392 -13
395 393 -13
396 394 -13
397 395 -13
398 396 -13
399 397 -13
400 398 -17
401 399 -13

View File

@@ -0,0 +1 @@
{"algo_name": "Q-learning", "env_name": "CliffWalking-v0", "train_eps": 400, "test_eps": 20, "gamma": 0.9, "epsilon_start": 0.95, "epsilon_end": 0.01, "epsilon_decay": 300, "lr": 0.1, "device": "cpu", "seed": 10, "show_fig": false, "save_fig": true, "result_path": "C:\\Users\\24438\\Desktop\\rl-tutorials\\codes\\QLearning/outputs/CliffWalking-v0/20220826-224730/results/", "model_path": "C:\\Users\\24438\\Desktop\\rl-tutorials\\codes\\QLearning/outputs/CliffWalking-v0/20220826-224730/models/", "n_states": 48, "n_actions": 4}

View File

@@ -0,0 +1,21 @@
episodes,rewards,steps
0,-13,13
1,-13,13
2,-13,13
3,-13,13
4,-13,13
5,-13,13
6,-13,13
7,-13,13
8,-13,13
9,-13,13
10,-13,13
11,-13,13
12,-13,13
13,-13,13
14,-13,13
15,-13,13
16,-13,13
17,-13,13
18,-13,13
19,-13,13
1 episodes rewards steps
2 0 -13 13
3 1 -13 13
4 2 -13 13
5 3 -13 13
6 4 -13 13
7 5 -13 13
8 6 -13 13
9 7 -13 13
10 8 -13 13
11 9 -13 13
12 10 -13 13
13 11 -13 13
14 12 -13 13
15 13 -13 13
16 14 -13 13
17 15 -13 13
18 16 -13 13
19 17 -13 13
20 18 -13 13
21 19 -13 13

View File

@@ -0,0 +1,401 @@
episodes,rewards,steps
0,-2131,448
1,-1086,492
2,-586,388
3,-220,220
4,-154,154
5,-122,122
6,-150,150
7,-159,159
8,-164,164
9,-88,88
10,-195,195
11,-114,114
12,-60,60
13,-179,179
14,-101,101
15,-304,205
16,-96,96
17,-119,119
18,-113,113
19,-98,98
20,-106,106
21,-105,105
22,-77,77
23,-51,51
24,-105,105
25,-136,136
26,-100,100
27,-29,29
28,-79,79
29,-114,114
30,-82,82
31,-70,70
32,-75,75
33,-51,51
34,-94,94
35,-52,52
36,-93,93
37,-71,71
38,-73,73
39,-48,48
40,-52,52
41,-96,96
42,-46,46
43,-65,65
44,-57,57
45,-41,41
46,-104,104
47,-51,51
48,-181,82
49,-229,130
50,-39,39
51,-69,69
52,-53,53
53,-59,59
54,-26,26
55,-75,75
56,-31,31
57,-60,60
58,-63,63
59,-40,40
60,-35,35
61,-79,79
62,-42,42
63,-22,22
64,-73,73
65,-71,71
66,-18,18
67,-55,55
68,-29,29
69,-43,43
70,-70,70
71,-49,49
72,-42,42
73,-29,29
74,-81,81
75,-36,36
76,-38,38
77,-36,36
78,-52,52
79,-28,28
80,-42,42
81,-52,52
82,-66,66
83,-31,31
84,-27,27
85,-49,49
86,-28,28
87,-54,54
88,-34,34
89,-35,35
90,-50,50
91,-36,36
92,-36,36
93,-46,46
94,-34,34
95,-135,36
96,-39,39
97,-36,36
98,-26,26
99,-56,56
100,-40,40
101,-40,40
102,-26,26
103,-28,28
104,-31,31
105,-35,35
106,-26,26
107,-57,57
108,-44,44
109,-41,41
110,-31,31
111,-26,26
112,-25,25
113,-41,41
114,-32,32
115,-44,44
116,-30,30
117,-32,32
118,-30,30
119,-25,25
120,-23,23
121,-47,47
122,-24,24
123,-45,45
124,-39,39
125,-21,21
126,-43,43
127,-143,44
128,-26,26
129,-20,20
130,-32,32
131,-16,16
132,-24,24
133,-42,42
134,-25,25
135,-36,36
136,-19,19
137,-29,29
138,-43,43
139,-17,17
140,-150,51
141,-32,32
142,-34,34
143,-19,19
144,-26,26
145,-30,30
146,-31,31
147,-49,49
148,-33,33
149,-21,21
150,-17,17
151,-48,48
152,-34,34
153,-20,20
154,-20,20
155,-26,26
156,-21,21
157,-13,13
158,-40,40
159,-22,22
160,-26,26
161,-30,30
162,-29,29
163,-25,25
164,-26,26
165,-27,27
166,-21,21
167,-29,29
168,-24,24
169,-17,17
170,-22,22
171,-35,35
172,-35,35
173,-18,18
174,-135,36
175,-15,15
176,-23,23
177,-28,28
178,-25,25
179,-24,24
180,-29,29
181,-31,31
182,-24,24
183,-129,30
184,-45,45
185,-24,24
186,-17,17
187,-20,20
188,-21,21
189,-23,23
190,-15,15
191,-32,32
192,-22,22
193,-19,19
194,-17,17
195,-45,45
196,-15,15
197,-14,14
198,-14,14
199,-37,37
200,-23,23
201,-17,17
202,-19,19
203,-21,21
204,-23,23
205,-27,27
206,-14,14
207,-18,18
208,-23,23
209,-34,34
210,-23,23
211,-13,13
212,-25,25
213,-17,17
214,-13,13
215,-21,21
216,-29,29
217,-18,18
218,-24,24
219,-15,15
220,-27,27
221,-25,25
222,-21,21
223,-19,19
224,-17,17
225,-18,18
226,-13,13
227,-22,22
228,-14,14
229,-13,13
230,-29,29
231,-23,23
232,-15,15
233,-15,15
234,-14,14
235,-28,28
236,-25,25
237,-17,17
238,-23,23
239,-29,29
240,-15,15
241,-14,14
242,-15,15
243,-23,23
244,-15,15
245,-16,16
246,-19,19
247,-13,13
248,-16,16
249,-17,17
250,-25,25
251,-30,30
252,-13,13
253,-14,14
254,-15,15
255,-22,22
256,-14,14
257,-17,17
258,-126,27
259,-15,15
260,-21,21
261,-16,16
262,-23,23
263,-14,14
264,-13,13
265,-13,13
266,-19,19
267,-13,13
268,-19,19
269,-17,17
270,-17,17
271,-13,13
272,-19,19
273,-13,13
274,-13,13
275,-16,16
276,-22,22
277,-14,14
278,-15,15
279,-19,19
280,-34,34
281,-13,13
282,-15,15
283,-32,32
284,-13,13
285,-13,13
286,-13,13
287,-14,14
288,-16,16
289,-13,13
290,-13,13
291,-17,17
292,-13,13
293,-13,13
294,-22,22
295,-14,14
296,-15,15
297,-13,13
298,-13,13
299,-13,13
300,-16,16
301,-13,13
302,-14,14
303,-13,13
304,-13,13
305,-13,13
306,-24,24
307,-13,13
308,-13,13
309,-15,15
310,-13,13
311,-13,13
312,-13,13
313,-15,15
314,-13,13
315,-19,19
316,-15,15
317,-17,17
318,-13,13
319,-13,13
320,-13,13
321,-13,13
322,-13,13
323,-15,15
324,-13,13
325,-13,13
326,-13,13
327,-123,24
328,-13,13
329,-13,13
330,-13,13
331,-13,13
332,-13,13
333,-13,13
334,-13,13
335,-13,13
336,-16,16
337,-13,13
338,-23,23
339,-13,13
340,-13,13
341,-13,13
342,-13,13
343,-13,13
344,-13,13
345,-13,13
346,-13,13
347,-13,13
348,-13,13
349,-13,13
350,-134,35
351,-13,13
352,-13,13
353,-13,13
354,-13,13
355,-13,13
356,-13,13
357,-13,13
358,-13,13
359,-13,13
360,-15,15
361,-13,13
362,-13,13
363,-13,13
364,-13,13
365,-13,13
366,-13,13
367,-13,13
368,-13,13
369,-14,14
370,-13,13
371,-13,13
372,-13,13
373,-13,13
374,-13,13
375,-13,13
376,-13,13
377,-124,25
378,-13,13
379,-13,13
380,-13,13
381,-13,13
382,-13,13
383,-13,13
384,-13,13
385,-13,13
386,-13,13
387,-13,13
388,-13,13
389,-121,22
390,-13,13
391,-13,13
392,-13,13
393,-13,13
394,-13,13
395,-13,13
396,-13,13
397,-13,13
398,-17,17
399,-13,13
1 episodes rewards steps
2 0 -2131 448
3 1 -1086 492
4 2 -586 388
5 3 -220 220
6 4 -154 154
7 5 -122 122
8 6 -150 150
9 7 -159 159
10 8 -164 164
11 9 -88 88
12 10 -195 195
13 11 -114 114
14 12 -60 60
15 13 -179 179
16 14 -101 101
17 15 -304 205
18 16 -96 96
19 17 -119 119
20 18 -113 113
21 19 -98 98
22 20 -106 106
23 21 -105 105
24 22 -77 77
25 23 -51 51
26 24 -105 105
27 25 -136 136
28 26 -100 100
29 27 -29 29
30 28 -79 79
31 29 -114 114
32 30 -82 82
33 31 -70 70
34 32 -75 75
35 33 -51 51
36 34 -94 94
37 35 -52 52
38 36 -93 93
39 37 -71 71
40 38 -73 73
41 39 -48 48
42 40 -52 52
43 41 -96 96
44 42 -46 46
45 43 -65 65
46 44 -57 57
47 45 -41 41
48 46 -104 104
49 47 -51 51
50 48 -181 82
51 49 -229 130
52 50 -39 39
53 51 -69 69
54 52 -53 53
55 53 -59 59
56 54 -26 26
57 55 -75 75
58 56 -31 31
59 57 -60 60
60 58 -63 63
61 59 -40 40
62 60 -35 35
63 61 -79 79
64 62 -42 42
65 63 -22 22
66 64 -73 73
67 65 -71 71
68 66 -18 18
69 67 -55 55
70 68 -29 29
71 69 -43 43
72 70 -70 70
73 71 -49 49
74 72 -42 42
75 73 -29 29
76 74 -81 81
77 75 -36 36
78 76 -38 38
79 77 -36 36
80 78 -52 52
81 79 -28 28
82 80 -42 42
83 81 -52 52
84 82 -66 66
85 83 -31 31
86 84 -27 27
87 85 -49 49
88 86 -28 28
89 87 -54 54
90 88 -34 34
91 89 -35 35
92 90 -50 50
93 91 -36 36
94 92 -36 36
95 93 -46 46
96 94 -34 34
97 95 -135 36
98 96 -39 39
99 97 -36 36
100 98 -26 26
101 99 -56 56
102 100 -40 40
103 101 -40 40
104 102 -26 26
105 103 -28 28
106 104 -31 31
107 105 -35 35
108 106 -26 26
109 107 -57 57
110 108 -44 44
111 109 -41 41
112 110 -31 31
113 111 -26 26
114 112 -25 25
115 113 -41 41
116 114 -32 32
117 115 -44 44
118 116 -30 30
119 117 -32 32
120 118 -30 30
121 119 -25 25
122 120 -23 23
123 121 -47 47
124 122 -24 24
125 123 -45 45
126 124 -39 39
127 125 -21 21
128 126 -43 43
129 127 -143 44
130 128 -26 26
131 129 -20 20
132 130 -32 32
133 131 -16 16
134 132 -24 24
135 133 -42 42
136 134 -25 25
137 135 -36 36
138 136 -19 19
139 137 -29 29
140 138 -43 43
141 139 -17 17
142 140 -150 51
143 141 -32 32
144 142 -34 34
145 143 -19 19
146 144 -26 26
147 145 -30 30
148 146 -31 31
149 147 -49 49
150 148 -33 33
151 149 -21 21
152 150 -17 17
153 151 -48 48
154 152 -34 34
155 153 -20 20
156 154 -20 20
157 155 -26 26
158 156 -21 21
159 157 -13 13
160 158 -40 40
161 159 -22 22
162 160 -26 26
163 161 -30 30
164 162 -29 29
165 163 -25 25
166 164 -26 26
167 165 -27 27
168 166 -21 21
169 167 -29 29
170 168 -24 24
171 169 -17 17
172 170 -22 22
173 171 -35 35
174 172 -35 35
175 173 -18 18
176 174 -135 36
177 175 -15 15
178 176 -23 23
179 177 -28 28
180 178 -25 25
181 179 -24 24
182 180 -29 29
183 181 -31 31
184 182 -24 24
185 183 -129 30
186 184 -45 45
187 185 -24 24
188 186 -17 17
189 187 -20 20
190 188 -21 21
191 189 -23 23
192 190 -15 15
193 191 -32 32
194 192 -22 22
195 193 -19 19
196 194 -17 17
197 195 -45 45
198 196 -15 15
199 197 -14 14
200 198 -14 14
201 199 -37 37
202 200 -23 23
203 201 -17 17
204 202 -19 19
205 203 -21 21
206 204 -23 23
207 205 -27 27
208 206 -14 14
209 207 -18 18
210 208 -23 23
211 209 -34 34
212 210 -23 23
213 211 -13 13
214 212 -25 25
215 213 -17 17
216 214 -13 13
217 215 -21 21
218 216 -29 29
219 217 -18 18
220 218 -24 24
221 219 -15 15
222 220 -27 27
223 221 -25 25
224 222 -21 21
225 223 -19 19
226 224 -17 17
227 225 -18 18
228 226 -13 13
229 227 -22 22
230 228 -14 14
231 229 -13 13
232 230 -29 29
233 231 -23 23
234 232 -15 15
235 233 -15 15
236 234 -14 14
237 235 -28 28
238 236 -25 25
239 237 -17 17
240 238 -23 23
241 239 -29 29
242 240 -15 15
243 241 -14 14
244 242 -15 15
245 243 -23 23
246 244 -15 15
247 245 -16 16
248 246 -19 19
249 247 -13 13
250 248 -16 16
251 249 -17 17
252 250 -25 25
253 251 -30 30
254 252 -13 13
255 253 -14 14
256 254 -15 15
257 255 -22 22
258 256 -14 14
259 257 -17 17
260 258 -126 27
261 259 -15 15
262 260 -21 21
263 261 -16 16
264 262 -23 23
265 263 -14 14
266 264 -13 13
267 265 -13 13
268 266 -19 19
269 267 -13 13
270 268 -19 19
271 269 -17 17
272 270 -17 17
273 271 -13 13
274 272 -19 19
275 273 -13 13
276 274 -13 13
277 275 -16 16
278 276 -22 22
279 277 -14 14
280 278 -15 15
281 279 -19 19
282 280 -34 34
283 281 -13 13
284 282 -15 15
285 283 -32 32
286 284 -13 13
287 285 -13 13
288 286 -13 13
289 287 -14 14
290 288 -16 16
291 289 -13 13
292 290 -13 13
293 291 -17 17
294 292 -13 13
295 293 -13 13
296 294 -22 22
297 295 -14 14
298 296 -15 15
299 297 -13 13
300 298 -13 13
301 299 -13 13
302 300 -16 16
303 301 -13 13
304 302 -14 14
305 303 -13 13
306 304 -13 13
307 305 -13 13
308 306 -24 24
309 307 -13 13
310 308 -13 13
311 309 -15 15
312 310 -13 13
313 311 -13 13
314 312 -13 13
315 313 -15 15
316 314 -13 13
317 315 -19 19
318 316 -15 15
319 317 -17 17
320 318 -13 13
321 319 -13 13
322 320 -13 13
323 321 -13 13
324 322 -13 13
325 323 -15 15
326 324 -13 13
327 325 -13 13
328 326 -13 13
329 327 -123 24
330 328 -13 13
331 329 -13 13
332 330 -13 13
333 331 -13 13
334 332 -13 13
335 333 -13 13
336 334 -13 13
337 335 -13 13
338 336 -16 16
339 337 -13 13
340 338 -23 23
341 339 -13 13
342 340 -13 13
343 341 -13 13
344 342 -13 13
345 343 -13 13
346 344 -13 13
347 345 -13 13
348 346 -13 13
349 347 -13 13
350 348 -13 13
351 349 -13 13
352 350 -134 35
353 351 -13 13
354 352 -13 13
355 353 -13 13
356 354 -13 13
357 355 -13 13
358 356 -13 13
359 357 -13 13
360 358 -13 13
361 359 -13 13
362 360 -15 15
363 361 -13 13
364 362 -13 13
365 363 -13 13
366 364 -13 13
367 365 -13 13
368 366 -13 13
369 367 -13 13
370 368 -13 13
371 369 -14 14
372 370 -13 13
373 371 -13 13
374 372 -13 13
375 373 -13 13
376 374 -13 13
377 375 -13 13
378 376 -13 13
379 377 -124 25
380 378 -13 13
381 379 -13 13
382 380 -13 13
383 381 -13 13
384 382 -13 13
385 383 -13 13
386 384 -13 13
387 385 -13 13
388 386 -13 13
389 387 -13 13
390 388 -13 13
391 389 -121 22
392 390 -13 13
393 391 -13 13
394 392 -13 13
395 393 -13 13
396 394 -13 13
397 395 -13 13
398 396 -13 13
399 397 -13 13
400 398 -17 17
401 399 -13 13

View File

@@ -0,0 +1 @@
{"algo_name": "Q-learning", "env_name": "Racetrack-v0", "train_eps": 400, "test_eps": 20, "gamma": 0.9, "epsilon_start": 0.95, "epsilon_end": 0.01, "epsilon_decay": 300, "lr": 0.1, "device": "cpu", "seed": 10, "show_fig": false, "save_fig": true, "result_path": "C:\\Users\\24438\\Desktop\\rl-tutorials\\codes\\QLearning/outputs/Racetrack-v0/20220826-224626/results/", "model_path": "C:\\Users\\24438\\Desktop\\rl-tutorials\\codes\\QLearning/outputs/Racetrack-v0/20220826-224626/models/", "n_states": 4, "n_actions": 9}

Binary file not shown.

After

Width:  |  Height:  |  Size: 39 KiB

View File

@@ -0,0 +1,21 @@
episodes,rewards,steps
0,-1000,1000
1,2,8
2,4,6
3,3,7
4,2,8
5,3,7
6,4,6
7,-1000,1000
8,3,7
9,-11,11
10,-19,19
11,-18,18
12,1,9
13,1,9
14,4,6
15,-16,16
16,-17,17
17,4,6
18,-16,16
19,4,6
1 episodes rewards steps
2 0 -1000 1000
3 1 2 8
4 2 4 6
5 3 3 7
6 4 2 8
7 5 3 7
8 6 4 6
9 7 -1000 1000
10 8 3 7
11 9 -11 11
12 10 -19 19
13 11 -18 18
14 12 1 9
15 13 1 9
16 14 4 6
17 15 -16 16
18 16 -17 17
19 17 4 6
20 18 -16 16
21 19 4 6

Binary file not shown.

After

Width:  |  Height:  |  Size: 40 KiB

View File

@@ -0,0 +1,401 @@
episodes,rewards,steps
0,-3580,1000
1,-2960,1000
2,-2670,1000
3,-2720,1000
4,-2670,1000
5,-2570,1000
6,-2407,977
7,-2012,852
8,-2500,1000
9,-2530,1000
10,-2550,1000
11,-437,187
12,-80,40
13,-2450,1000
14,-338,148
15,-1175,525
16,-755,325
17,-411,181
18,-1068,448
19,-785,325
20,-149,79
21,-628,268
22,-423,183
23,-282,122
24,-2198,938
25,-13,13
26,-253,113
27,-48,28
28,-72,42
29,-123,63
30,-305,145
31,-72,32
32,-142,72
33,-13,13
34,4,6
35,-1285,545
36,-174,94
37,-436,196
38,-759,339
39,-11,11
40,-17,17
41,-283,123
42,-181,81
43,-44,24
44,-55,35
45,-135,65
46,-577,277
47,-234,114
48,-54,34
49,4,6
50,-29,19
51,-100,50
52,-32,22
53,-23,23
54,4,6
55,-17,17
56,-18,18
57,-48,28
58,-34,24
59,-45,25
60,-29,19
61,1,9
62,-77,37
63,3,7
64,-25,15
65,-3,13
66,-78,48
67,-69,39
68,-105,45
69,-48,28
70,3,7
71,4,6
72,-100,50
73,-130,60
74,-20,20
75,4,6
76,4,6
77,4,6
78,4,6
79,-47,27
80,4,6
81,4,6
82,-174,94
83,-12,12
84,-26,16
85,3,7
86,3,7
87,-42,32
88,-48,28
89,-97,57
90,-11,11
91,-16,16
92,-15,15
93,4,6
94,-147,67
95,-52,32
96,-97,47
97,3,7
98,-17,17
99,3,7
100,4,6
101,3,7
102,3,7
103,3,7
104,1,9
105,4,6
106,4,6
107,3,7
108,4,6
109,-68,38
110,3,7
111,4,6
112,-14,14
113,4,6
114,-57,37
115,3,7
116,4,6
117,-12,12
118,3,7
119,3,7
120,-64,34
121,-13,13
122,3,7
123,-13,13
124,4,6
125,3,7
126,-32,22
127,-41,31
128,3,7
129,3,7
130,3,7
131,4,6
132,4,6
133,3,7
134,-12,12
135,-31,21
136,4,6
137,3,7
138,-51,31
139,-48,28
140,4,6
141,-85,45
142,-14,14
143,4,6
144,3,7
145,-6,16
146,4,6
147,4,6
148,-15,15
149,4,6
150,-24,24
151,3,7
152,-14,14
153,-18,18
154,3,7
155,4,6
156,-85,45
157,-51,31
158,3,7
159,2,8
160,3,7
161,-79,39
162,-14,14
163,-13,13
164,4,6
165,3,7
166,4,6
167,3,7
168,-74,34
169,-15,15
170,4,6
171,-14,14
172,4,6
173,-31,21
174,-8,18
175,4,6
176,4,6
177,4,6
178,4,6
179,-29,19
180,4,6
181,3,7
182,4,6
183,-82,42
184,3,7
185,4,6
186,4,6
187,-11,11
188,-23,23
189,-33,23
190,3,7
191,-12,12
192,-44,24
193,-62,42
194,-16,16
195,4,6
196,-12,12
197,3,7
198,-13,13
199,3,7
200,3,7
201,4,6
202,4,6
203,4,6
204,-28,18
205,-16,16
206,3,7
207,4,6
208,-12,12
209,-13,13
210,-66,36
211,-14,14
212,4,6
213,4,6
214,-15,15
215,-60,30
216,4,6
217,3,7
218,4,6
219,-33,23
220,-12,12
221,-14,14
222,4,6
223,3,7
224,-97,47
225,4,6
226,2,8
227,4,6
228,4,6
229,3,7
230,-11,11
231,4,6
232,3,7
233,3,7
234,4,6
235,3,7
236,3,7
237,-32,22
238,-13,13
239,3,7
240,-22,22
241,4,6
242,2,8
243,-31,21
244,4,6
245,-4,14
246,-30,20
247,4,6
248,3,7
249,-26,16
250,4,6
251,-12,12
252,2,8
253,1,9
254,4,6
255,2,8
256,2,8
257,-12,12
258,3,7
259,-48,28
260,4,6
261,4,6
262,-51,31
263,-12,12
264,4,6
265,2,8
266,2,8
267,2,8
268,3,7
269,4,6
270,4,6
271,-17,17
272,4,6
273,-13,13
274,-16,16
275,-97,57
276,3,7
277,-1,11
278,-32,22
279,3,7
280,4,6
281,3,7
282,3,7
283,3,7
284,3,7
285,2,8
286,3,7
287,-15,15
288,2,8
289,-18,18
290,4,6
291,-36,26
292,4,6
293,4,6
294,4,6
295,4,6
296,-77,47
297,-14,14
298,3,7
299,3,7
300,3,7
301,4,6
302,3,7
303,4,6
304,-12,12
305,-45,35
306,-63,43
307,2,8
308,4,6
309,4,6
310,-13,13
311,4,6
312,-13,13
313,4,6
314,3,7
315,-30,20
316,-13,13
317,3,7
318,4,6
319,4,6
320,-12,12
321,-13,13
322,3,7
323,3,7
324,3,7
325,3,7
326,-36,26
327,4,6
328,3,7
329,3,7
330,3,7
331,3,7
332,-14,14
333,-16,16
334,3,7
335,3,7
336,-14,14
337,1,9
338,2,8
339,3,7
340,4,6
341,-36,26
342,-14,14
343,-78,48
344,2,8
345,-37,27
346,3,7
347,3,7
348,-37,27
349,-16,16
350,4,6
351,-15,15
352,4,6
353,2,8
354,-44,24
355,-13,13
356,-14,14
357,-17,17
358,-13,13
359,3,7
360,2,8
361,4,6
362,3,7
363,-5,15
364,-14,14
365,2,8
366,-12,12
367,3,7
368,4,6
369,2,8
370,2,8
371,1,9
372,-16,16
373,1,9
374,4,6
375,-16,16
376,3,7
377,2,8
378,-13,13
379,-44,34
380,-16,16
381,-30,20
382,4,6
383,4,6
384,2,8
385,-15,15
386,4,6
387,3,7
388,2,8
389,4,6
390,2,8
391,3,7
392,3,7
393,-14,14
394,-15,15
395,3,7
396,-13,13
397,3,7
398,4,6
399,3,7
1 episodes rewards steps
2 0 -3580 1000
3 1 -2960 1000
4 2 -2670 1000
5 3 -2720 1000
6 4 -2670 1000
7 5 -2570 1000
8 6 -2407 977
9 7 -2012 852
10 8 -2500 1000
11 9 -2530 1000
12 10 -2550 1000
13 11 -437 187
14 12 -80 40
15 13 -2450 1000
16 14 -338 148
17 15 -1175 525
18 16 -755 325
19 17 -411 181
20 18 -1068 448
21 19 -785 325
22 20 -149 79
23 21 -628 268
24 22 -423 183
25 23 -282 122
26 24 -2198 938
27 25 -13 13
28 26 -253 113
29 27 -48 28
30 28 -72 42
31 29 -123 63
32 30 -305 145
33 31 -72 32
34 32 -142 72
35 33 -13 13
36 34 4 6
37 35 -1285 545
38 36 -174 94
39 37 -436 196
40 38 -759 339
41 39 -11 11
42 40 -17 17
43 41 -283 123
44 42 -181 81
45 43 -44 24
46 44 -55 35
47 45 -135 65
48 46 -577 277
49 47 -234 114
50 48 -54 34
51 49 4 6
52 50 -29 19
53 51 -100 50
54 52 -32 22
55 53 -23 23
56 54 4 6
57 55 -17 17
58 56 -18 18
59 57 -48 28
60 58 -34 24
61 59 -45 25
62 60 -29 19
63 61 1 9
64 62 -77 37
65 63 3 7
66 64 -25 15
67 65 -3 13
68 66 -78 48
69 67 -69 39
70 68 -105 45
71 69 -48 28
72 70 3 7
73 71 4 6
74 72 -100 50
75 73 -130 60
76 74 -20 20
77 75 4 6
78 76 4 6
79 77 4 6
80 78 4 6
81 79 -47 27
82 80 4 6
83 81 4 6
84 82 -174 94
85 83 -12 12
86 84 -26 16
87 85 3 7
88 86 3 7
89 87 -42 32
90 88 -48 28
91 89 -97 57
92 90 -11 11
93 91 -16 16
94 92 -15 15
95 93 4 6
96 94 -147 67
97 95 -52 32
98 96 -97 47
99 97 3 7
100 98 -17 17
101 99 3 7
102 100 4 6
103 101 3 7
104 102 3 7
105 103 3 7
106 104 1 9
107 105 4 6
108 106 4 6
109 107 3 7
110 108 4 6
111 109 -68 38
112 110 3 7
113 111 4 6
114 112 -14 14
115 113 4 6
116 114 -57 37
117 115 3 7
118 116 4 6
119 117 -12 12
120 118 3 7
121 119 3 7
122 120 -64 34
123 121 -13 13
124 122 3 7
125 123 -13 13
126 124 4 6
127 125 3 7
128 126 -32 22
129 127 -41 31
130 128 3 7
131 129 3 7
132 130 3 7
133 131 4 6
134 132 4 6
135 133 3 7
136 134 -12 12
137 135 -31 21
138 136 4 6
139 137 3 7
140 138 -51 31
141 139 -48 28
142 140 4 6
143 141 -85 45
144 142 -14 14
145 143 4 6
146 144 3 7
147 145 -6 16
148 146 4 6
149 147 4 6
150 148 -15 15
151 149 4 6
152 150 -24 24
153 151 3 7
154 152 -14 14
155 153 -18 18
156 154 3 7
157 155 4 6
158 156 -85 45
159 157 -51 31
160 158 3 7
161 159 2 8
162 160 3 7
163 161 -79 39
164 162 -14 14
165 163 -13 13
166 164 4 6
167 165 3 7
168 166 4 6
169 167 3 7
170 168 -74 34
171 169 -15 15
172 170 4 6
173 171 -14 14
174 172 4 6
175 173 -31 21
176 174 -8 18
177 175 4 6
178 176 4 6
179 177 4 6
180 178 4 6
181 179 -29 19
182 180 4 6
183 181 3 7
184 182 4 6
185 183 -82 42
186 184 3 7
187 185 4 6
188 186 4 6
189 187 -11 11
190 188 -23 23
191 189 -33 23
192 190 3 7
193 191 -12 12
194 192 -44 24
195 193 -62 42
196 194 -16 16
197 195 4 6
198 196 -12 12
199 197 3 7
200 198 -13 13
201 199 3 7
202 200 3 7
203 201 4 6
204 202 4 6
205 203 4 6
206 204 -28 18
207 205 -16 16
208 206 3 7
209 207 4 6
210 208 -12 12
211 209 -13 13
212 210 -66 36
213 211 -14 14
214 212 4 6
215 213 4 6
216 214 -15 15
217 215 -60 30
218 216 4 6
219 217 3 7
220 218 4 6
221 219 -33 23
222 220 -12 12
223 221 -14 14
224 222 4 6
225 223 3 7
226 224 -97 47
227 225 4 6
228 226 2 8
229 227 4 6
230 228 4 6
231 229 3 7
232 230 -11 11
233 231 4 6
234 232 3 7
235 233 3 7
236 234 4 6
237 235 3 7
238 236 3 7
239 237 -32 22
240 238 -13 13
241 239 3 7
242 240 -22 22
243 241 4 6
244 242 2 8
245 243 -31 21
246 244 4 6
247 245 -4 14
248 246 -30 20
249 247 4 6
250 248 3 7
251 249 -26 16
252 250 4 6
253 251 -12 12
254 252 2 8
255 253 1 9
256 254 4 6
257 255 2 8
258 256 2 8
259 257 -12 12
260 258 3 7
261 259 -48 28
262 260 4 6
263 261 4 6
264 262 -51 31
265 263 -12 12
266 264 4 6
267 265 2 8
268 266 2 8
269 267 2 8
270 268 3 7
271 269 4 6
272 270 4 6
273 271 -17 17
274 272 4 6
275 273 -13 13
276 274 -16 16
277 275 -97 57
278 276 3 7
279 277 -1 11
280 278 -32 22
281 279 3 7
282 280 4 6
283 281 3 7
284 282 3 7
285 283 3 7
286 284 3 7
287 285 2 8
288 286 3 7
289 287 -15 15
290 288 2 8
291 289 -18 18
292 290 4 6
293 291 -36 26
294 292 4 6
295 293 4 6
296 294 4 6
297 295 4 6
298 296 -77 47
299 297 -14 14
300 298 3 7
301 299 3 7
302 300 3 7
303 301 4 6
304 302 3 7
305 303 4 6
306 304 -12 12
307 305 -45 35
308 306 -63 43
309 307 2 8
310 308 4 6
311 309 4 6
312 310 -13 13
313 311 4 6
314 312 -13 13
315 313 4 6
316 314 3 7
317 315 -30 20
318 316 -13 13
319 317 3 7
320 318 4 6
321 319 4 6
322 320 -12 12
323 321 -13 13
324 322 3 7
325 323 3 7
326 324 3 7
327 325 3 7
328 326 -36 26
329 327 4 6
330 328 3 7
331 329 3 7
332 330 3 7
333 331 3 7
334 332 -14 14
335 333 -16 16
336 334 3 7
337 335 3 7
338 336 -14 14
339 337 1 9
340 338 2 8
341 339 3 7
342 340 4 6
343 341 -36 26
344 342 -14 14
345 343 -78 48
346 344 2 8
347 345 -37 27
348 346 3 7
349 347 3 7
350 348 -37 27
351 349 -16 16
352 350 4 6
353 351 -15 15
354 352 4 6
355 353 2 8
356 354 -44 24
357 355 -13 13
358 356 -14 14
359 357 -17 17
360 358 -13 13
361 359 3 7
362 360 2 8
363 361 4 6
364 362 3 7
365 363 -5 15
366 364 -14 14
367 365 2 8
368 366 -12 12
369 367 3 7
370 368 4 6
371 369 2 8
372 370 2 8
373 371 1 9
374 372 -16 16
375 373 1 9
376 374 4 6
377 375 -16 16
378 376 3 7
379 377 2 8
380 378 -13 13
381 379 -44 34
382 380 -16 16
383 381 -30 20
384 382 4 6
385 383 4 6
386 384 2 8
387 385 -15 15
388 386 4 6
389 387 3 7
390 388 2 8
391 389 4 6
392 390 2 8
393 391 3 7
394 392 3 7
395 393 -14 14
396 394 -15 15
397 395 3 7
398 396 -13 13
399 397 3 7
400 398 4 6
401 399 3 7