强化学习matlab代码
该代码使用一个迷宫示例演示了强化学习(Q-learning)算法,在迷宫示例中,机器人只能通过向左,向右,向上和向下方向移动来到达其目的地。在每个步骤中,都会根据机器人动作的结果来教导并重新学习它是否是一个好动作,
应用介绍
该代码使用一个迷宫示例演示了强化学习(Q-learning)算法,在迷宫示例中,机器人只能通过向左,向右,向上和向下方向移动来到达其目的地。在每个步骤中,都会根据机器人动作的结果来教导并重新学习它是否是一个好动作,最终整个过程会一次又一次地重复,直到到达目的地为止。此时,该过程将再次开始,以便可以验证所学到的内容,并且可以忘记在第一遍过程中进行的不必要的操作,依此类推。这是一个很好的教程示例,适用于必须在旅途中完成学习的情况,即无需使用培训示例。可用于游戏中,以学习和提高AI算法与人类玩家以及其他几种场景的竞争能力。
在小迷宫上,收敛速度会很快,而在大迷宫上,收敛会花费一些时间。您可以通过修改代码以提高Q学习效率来提高收敛速度。
©版权声明:本文内容由互联网用户自发贡献,版权归原创作者所有,本站不拥有所有权,也不承担相关法律责任。如果您发现本站中有涉嫌抄袭的内容,欢迎发送邮件至: www_apollocode_net@163.com 进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
转载请注明出处: apollocode » 强化学习matlab代码
文件列表(部分)
名称 | 大小 | 修改日期 |
---|---|---|
maze-61-21.txt | 2.60 KB | 2017-06-22 |
maze-9-9.txt | 0.19 KB | 2017-06-22 |
QLearning_Maze_Walk.m | 10.01 KB | 2017-06-22 |
Random_Maze_Walk.m | 8.86 KB | 2017-06-22 |
Read_Maze.m | 1.92 KB | 2017-06-22 |
textscanu.m | 4.05 KB | 2017-06-22 |
license.txt | 1.28 KB | 2017-06-22 |
发表评论 取消回复