这里介绍一个多智能体强化学习的仓库 EPyMARL,包含简单使用,各个文件夹的含义,和各个文件运行之后的关联。后续会基于这个仓库来学习不同的多智能体强化学习算法。
Reinforcement Learning(强化学习) – MuJoCo 环境介绍
本文主要对 MuJoCo 环境进行简单的介绍。目前 Mujoco 最新版已经开源免费,不再需要激活许可。
Reinforcement Learning(强化学习)- Pong 环境介绍
本文会介绍 OpenAI Gym 中的一款 Atari 游戏,Pong(类似乒乓)。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 p...
Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍
本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 policy,来...
Reinforcement Learning(强化学习)-MountainCar 环境介绍
本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy,可以使...
Reinforcement Learning(强化学习)-Gym 使用介绍
这一篇作为强化学习的开篇, 会介绍其工具gym的使用. 之后大部分强化学习的实验, 都会基于gym来进行完成. 所以这一篇好好介绍一下gym的使用, 特别是gym配合colab的使...