强化学习环境 Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍 本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 policy,来... 11月02日评论 阅读全文