• 联系我们
  • 贡献者
  • 文章归档
  • 热门标签
  • 留言板
  • 网站收藏
  • 代码高亮

文艺数学君 文艺数学君

换一种姿势学数学

  • 首页
  • 数学可视化
    • 数学分析
    • 高等代数
    • 概率论与数理统计
  • 数据分析
    • 应用回归分析
    • 时间序列分析
    • 多元统计
    • 大数据分析
    • 机器学习
    • 深度学习
  • 编程珠玑
    • python快速入门
    • python数据分析
    • Python库介绍
    • Wolfram快速入门
    • Wolfram语言入门习题
    • Wolfram语言进阶
    • Mathematica绘图
    • Wolfram语言与数学
  • 数学美拾趣
    • 北邮人论坛十大
    • 数学与生活
    • 美丽的图像
    • 有好物(软件)
    • 网站建设
首页强化学习
CURL: Contrastive Unsupervised Representations for Reinforcement Learning 阅读 强化学习论文

CURL: Contrastive Unsupervised Representations for Reinforcement Learning 阅读

本文是阅读论文 CURL: Contrastive Unsupervised Representations for Reinforcement Learning 的一些记录。这篇...
王 茂南 03月16日评论
阅读全文
Reinforcement Learning with Augmented Data 阅读 强化学习论文

Reinforcement Learning with Augmented Data 阅读

这篇文章尝试将数据增强的方法用在强化学习中,并取得了很好的效果。和很多其他的好论文一样,Simple idea but very very work,值得一看。
王 茂南 03月12日评论
阅读全文
Reinforcement Learning(强化学习) - MuJoCo 环境介绍 强化学习环境

Reinforcement Learning(强化学习) – MuJoCo 环境介绍

本文主要对 MuJoCo 环境进行简单的介绍。目前 Mujoco 最新版已经开源免费,不再需要激活许可。
王 茂南 01月24日评论
阅读全文
Action Space Shaping in Deep Reinforcement Learning 阅读 强化学习论文

Action Space Shaping in Deep Reinforcement Learning 阅读

本文是对论文《Action Space Shaping in Deep Reinforcement Learning》的解读,这篇论文主要讲解了三种动作空间预处理的方式,分别是(1...
王 茂南 09月19日评论
阅读全文
使用 SUMO 进行仿真(5)-Detectors 介绍 SUMO 资料

使用 SUMO 进行仿真(5)-Detectors 介绍

在前面的内容中,我们完成了路网的搭建,车辆的生成,也了解了信号灯控制的相关内容。现在我们希望可以获得一些监测的数据。这个时候我们就可以通过设置 detector(探测器) 来完成检...
王 茂南 11月03日评论
阅读全文
Reinforcement Learning(强化学习)- Pong 环境介绍 强化学习环境

Reinforcement Learning(强化学习)- Pong 环境介绍

本文会介绍 OpenAI Gym 中的一款 Atari 游戏,Pong(类似乒乓)。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 p...
王 茂南 11月03日评论
阅读全文
Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍 强化学习环境

Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍

本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation,Action 和 Reward 的含义。最后给一个随机的 policy,来...
王 茂南 11月02日评论
阅读全文
Reinforcement Learning(强化学习)-MountainCar 环境介绍 强化学习环境

Reinforcement Learning(强化学习)-MountainCar 环境介绍

本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy,可以使...
王 茂南 10月19日评论
阅读全文
使用 SUMO 进行仿真(4)-信号灯(Traffic Light) SUMO 资料

使用 SUMO 进行仿真(4)-信号灯(Traffic Light)

本文会介绍 SUMO 中信号灯(Traffic Light)的相关内容。包括如何生成带有 Traffic Light 的路网,如何设置信号灯,如何利用 TraCI 来控制信号灯。
王 茂南 09月26日评论
阅读全文
使用 SUMO 进行仿真(3)-车流的生成(Route 文件) SUMO 资料

使用 SUMO 进行仿真(3)-车流的生成(Route 文件)

在本文中我们会着重介绍了车流的生成。包括生成车流的方式,也会介绍 route 文件的相关内容。生成车流的方式包括直接修改 route 文件,通过 flow 指定起点和终点,通过 t...
王 茂南 09月25日评论
阅读全文

文章导航

1 2
最新文章热评文章热门文章最近留言

    最新文章

  • 北邮人论坛十大_2023_03_23 北邮人论坛十大_2023_03_23 03/23
  • 北邮人论坛十大_2023_03_22 北邮人论坛十大_2023_03_22 03/22
  • 北邮人论坛十大_2023_03_21 北邮人论坛十大_2023_03_21 03/21
  • 北邮人论坛十大_2023_03_20 北邮人论坛十大_2023_03_20 03/20
  • 北邮人论坛十大_2023_03_19 北邮人论坛十大_2023_03_19 03/19

    热评文章

  • KDD99数据集与NSL-KDD数据集介绍 KDD99数据集与NSL-KDD数据集介绍 05/24 25
  • GRU for Time Series in Pytorch--Pytorch实现时间序列分析 GRU for Time Series in Pytorch–Pytorch实现时间序列分析 06/08 15
  • Mathematica进阶[5]--关于Evaluate的使用 Mathematica进阶[5]–关于Evaluate的使用 10/06 10
  • 元胞自动机--一维双色 元胞自动机–一维双色 01/14 4
  • 关于恶龙的故事和信息准确性的一些想法 关于恶龙的故事和信息准确性的一些想法 12/05 4

    热门文章

  • 安装 Ubuntu 系统及软件安装和配置安装 Ubuntu 系统及软件安装和配置01/19
  • Reinforcement Learning(强化学习) - MuJoCo 环境介绍Reinforcement Learning(强化学习) – MuJoCo 环境介绍01/24
  • 北邮人论坛十大_2023_01_16北邮人论坛十大_2023_01_1601/16
  • 北邮人论坛十大_2023_03_07北邮人论坛十大_2023_03_0703/07
  • 北邮人论坛十大_2023_01_27北邮人论坛十大_2023_01_2701/27

    最近留言

  • wwy wwy 请问有完整代码吗,可以学习一下吗
  • wwy wwy 请问有完整代码吗
  • XIEWEI XIEWEI 你好博主,我有些问题想问下您,能方便加个联系方式吗
  • 马内 马内 暑期快乐,感谢博主的分享,支持了。 现在,Gravatar这种网站都会被墙。
  • 马内 马内 北邮论坛十大 很不错
  • 书剑一笑 书剑一笑 博主你好!看了您的文章受益匪浅,能不能加您好友,一起讨论关于流量监测的问题?
  • xs.zhou xs.zhou 很不错的网站,用心了
  • hg123 hg123 你好,想问一下,每行数据后面的那个0-21之间的数指的是预测正确的模型个数吗?是可以不需要的数据吗?谢谢!!
  • 张颖 张颖 我想请问一下,具体的攻击类型有对应具体的特征吗
  • hanhan hanhan 主要我是看一些文章宣称最后5分类准确率可达96-98%这个样子我就惊了,实在不知道怎么调出这个玩意。

作者墙

  • 周卷卷周卷卷
  • 遇见数学遇见数学
  • 邵亚男邵亚男
  • 孙慧中孙慧中
  • 孙晓楠孙晓楠
  • 王祥赛王祥赛
  • 赵奕林赵奕林
  • 赵倩赵倩
  • 王 茂南王 茂南

热门文章

  • 安装 Ubuntu 系统及软件安装和配置安装 Ubuntu 系统及软件安装和配置01/19
  • Reinforcement Learning(强化学习) - MuJoCo 环境介绍Reinforcement Learning(强化学习) – MuJoCo 环境介绍01/24
  • 北邮人论坛十大_2023_01_16北邮人论坛十大_2023_01_1601/16
  • 北邮人论坛十大_2023_03_07北邮人论坛十大_2023_03_0703/07
  • 北邮人论坛十大_2023_01_27北邮人论坛十大_2023_01_2701/27

快捷入口

  • 这是什么
  • 文章归档
  • 热门标签
  • 联系我们
  • 机器学习
  • 入门习题
  • 应用数学
  • 数学经典
  • 回归分析
  • 最美数学

关于本站

文艺数学君旨在通过图形化的语言,来分享一些有趣的数学知识,并会结合Mathematica和Python等软件做数学与实际的应用。

关注我们

 weixin
Copyright ©  2017-2023 文艺数学君  版权所有.
公安备案号 11010802024744号 备案号 京ICP备17055827号-1
  • 目录
  • 繁
  • 本页二维码