本文是对论文《Action Space Shaping in Deep Reinforcement Learning》的解读,这篇论文主要讲解了三种动作空间预处理的方式,分别是(1...
使用 SUMO 进行仿真(5)-Detectors 介绍
在前面的内容中,我们完成了路网的搭建,车辆的生成,也了解了信号灯控制的相关内容。现在我们希望可以获得一些监测的数据。这个时候我们就可以通过设置 detector(探测器) 来完成检...
Reinforcement Learning(强化学习)- Pong 环境介绍
本文会介绍 OpenAI Gym 中的一款 Atari 游戏,Pong(类似乒乓)。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 p...
Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍
本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 policy,来...
Reinforcement Learning(强化学习)-MountainCar 环境介绍
本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy,可以使...
使用 SUMO 进行仿真(4)-信号灯(Traffic Light)
本文会介绍 SUMO 中信号灯(Traffic Light)的相关内容。包括如何生成带有 Traffic Light 的路网,如何设置信号灯,如何利用 TraCI 来控制信号灯。
使用 SUMO 进行仿真(3)-车流的生成(Route 文件)
在本文中我们会着重介绍了车流的生成。包括生成车流的方式,也会介绍 route 文件的相关内容。生成车流的方式包括直接修改 route 文件,通过 flow 指定起点和终点,通过 t...
使用 SUMO 进行仿真(2)-Node 和 Edge
本文是 SUMO 进行仿真的第二篇。主要详细的介绍 Node 和 Edge 这两个文件类型(详细了解一下这两个文件的组成,如何生成 Network),通过这两个文件来生成 Netw...
使用 SUMO 进行仿真(1)-快速入门
本文会介绍 SUMO。主要是从 node 和 edge 文件开始,一步一步新建 network,route,最后完整路网和车流的生成。
Reinforcement Learning(强化学习)-Gym 使用介绍
这一篇作为强化学习的开篇, 会介绍其工具gym的使用. 之后大部分强化学习的实验, 都会基于gym来进行完成. 所以这一篇好好介绍一下gym的使用, 特别是gym配合colab的使...
3