该代码使用一个迷宫示例演示了强化学习(Q-learning)算法,在迷宫示例中,机器人只能通过向左,向右,向上和向下方向移动来到达其目的地。在每个步骤中,都会根据机器人动作的结果来教导并重新学习它是否是一个好动作,
2021-02-08
35 下载量
微信捐赠
微信扫一扫体验