算法 - 阿波罗仿真与代码网

算法

该代码使用一个迷宫示例演示了强化学习（Q-learning）算法，在迷宫示例中，机器人只能通过向左，向右，向上和向下方向移动来到达其目的地。在每个步骤中，都会根据机器人动作的结果来教导并重新学习它是否是一个好动作，

2021-02-08

37
下载量

算法 首页 算法