强化学习 | 文艺数学君

【多智能体强化学习】EPyMARL 使用介绍

【多智能体强化学习】EPyMARL 使用介绍

这里介绍一个多智能体强化学习的仓库 EPyMARL，包含简单使用，各个文件夹的含义，和各个文件运行之后的关联。后续会基于这个仓库来学习不同的多智能体强化学习算法。

04月02日评论

强化学习资料收集整理

强化学习资料收集整理

这里会收集一些强化学习的资料，方便在学习过程中使用。这里会分为初学强化学习的资料，和进阶的时候用到的资料。

03月20日评论

SMARTS 创建场景以及 Bubble

SMARTS 创建场景以及 Bubble

本文会着重介绍如何在 SMARTS 中来创建环境，以及通过 Bubble 的概念，只控制指定区域的 Agent。

04月27日评论

SMARTS 快速上手使用

SMARTS 快速上手使用

这里对 SMARTS 进行了简单的介绍。主要是包含（1）SMARTS 的安装；（2）SMARTS 中的一些概念：SMARTS Env，对不同 RL 框架的接口；SMARTS RL ...

04月21日评论

Reinforcement Learning(强化学习) - MuJoCo 环境介绍

Reinforcement Learning(强化学习) – MuJoCo 环境介绍

本文主要对 MuJoCo 环境进行简单的介绍。目前 Mujoco 最新版已经开源免费，不再需要激活许可。

01月24日评论

使用 SUMO 进行仿真(5)-Detectors 介绍

使用 SUMO 进行仿真(5)-Detectors 介绍

在前面的内容中，我们完成了路网的搭建，车辆的生成，也了解了信号灯控制的相关内容。现在我们希望可以获得一些监测的数据。这个时候我们就可以通过设置 detector（探测器）来完成检...

11月03日评论

Reinforcement Learning(强化学习)- Pong 环境介绍

Reinforcement Learning(强化学习)- Pong 环境介绍

本文会介绍 OpenAI Gym 中的一款 Atari 游戏，Pong（类似乒乓）。会分别介绍 Observation，Action 和 Reward 的含义。最后给一个随机的 p...

11月03日评论

Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍

Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍

本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation，Action 和 Reward 的含义。最后给一个随机的 policy，来...

11月02日评论

Reinforcement Learning(强化学习)-MountainCar 环境介绍

Reinforcement Learning(强化学习)-MountainCar 环境介绍

本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy，可以使...

10月19日评论

使用 SUMO 进行仿真(4)-信号灯（Traffic Light）

使用 SUMO 进行仿真(4)-信号灯（Traffic Light）

本文会介绍 SUMO 中信号灯（Traffic Light）的相关内容。包括如何生成带有 Traffic Light 的路网，如何设置信号灯，如何利用 TraCI 来控制信号灯。

09月26日评论

目录

繁
本页二维码