本文是阅读论文 CURL: Contrastive Unsupervised Representations for Reinforcement Learning 的一些记录。这篇...
Reinforcement Learning with Augmented Data 阅读
这篇文章尝试将数据增强的方法用在强化学习中,并取得了很好的效果。和很多其他的好论文一样,Simple idea but very very work,值得一看。
Reinforcement Learning(强化学习) – MuJoCo 环境介绍
本文主要对 MuJoCo 环境进行简单的介绍。目前 Mujoco 最新版已经开源免费,不再需要激活许可。
Action Space Shaping in Deep Reinforcement Learning 阅读
本文是对论文《Action Space Shaping in Deep Reinforcement Learning》的解读,这篇论文主要讲解了三种动作空间预处理的方式,分别是(1...
使用 SUMO 进行仿真(5)-Detectors 介绍
在前面的内容中,我们完成了路网的搭建,车辆的生成,也了解了信号灯控制的相关内容。现在我们希望可以获得一些监测的数据。这个时候我们就可以通过设置 detector(探测器) 来完成检...
Reinforcement Learning(强化学习)- Pong 环境介绍
本文会介绍 OpenAI Gym 中的一款 Atari 游戏,Pong(类似乒乓)。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 p...
Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍
本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 policy,来...
Reinforcement Learning(强化学习)-MountainCar 环境介绍
本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy,可以使...
使用 SUMO 进行仿真(4)-信号灯(Traffic Light)
本文会介绍 SUMO 中信号灯(Traffic Light)的相关内容。包括如何生成带有 Traffic Light 的路网,如何设置信号灯,如何利用 TraCI 来控制信号灯。
使用 SUMO 进行仿真(3)-车流的生成(Route 文件)
在本文中我们会着重介绍了车流的生成。包括生成车流的方式,也会介绍 route 文件的相关内容。生成车流的方式包括直接修改 route 文件,通过 flow 指定起点和终点,通过 t...
3