这一篇文章记录一下强化学习在网络流量检测, 入侵检测方面的相关应用.
Pytorch实现Actor Critic Baseline (A2C, Cliff Walking PlayGround)
这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Actor-Critic Baseline (A2C). 因为目前很少有使用Cliff ...
Pytorch实现Deep Q-Learning(Cliff Walking PlayGround)
这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Deep Q-Learning. 也是对官网教程的详细说明.
强化学习的一些应用-信号灯方向论文
这一篇会介绍一下强化学习在实际生活中的一些应用. 我们会看一下如何将一个实际的问题转换为使用强化学习可以解决的问题.
强化学习解决背包问题
这一篇介绍使用强化学习来解决背包问题. 也是作为一个引子,来看一下如何使用强化学习, 来解决这种优化问题.
Reinforcement Learning(强化学习)-Cliff Walking Playground环境介绍
这一篇介绍强化学习中的Cliff Walking Playground的环境. 包括环境的大体介绍, 以及环境代码的简单实验.
模型的可解释性简单说明(Interpreting machine learning models)
这一篇介绍关于模型可解释性方向的一些方法,主要会介绍为什么需要模型的可解释性,和传统的模型的可解释的一些做法。以及现在一些更加通用的模型的可解释性的方式。
t-SNE与AE对MNIST可视化
本文介绍关于使用t-SNE进行可视化, 会使用MNIST作为测试数据集. 本文会主要分为两个部分, 首先使用AE对数据进行降维, 降到24维, 接着使用t-SNE对数据进一步降维,...
Importance Sampling (重要性采样)介绍
这一篇是关于重要性抽样(importance sampling)的介绍, 包括他的背景知识, 相关的数学转换和最后的例子.
Reinforcement Learning(强化学习)-Windy Gridworld Playground环境介绍
这一篇文章介绍强化学习中的一个环境Windy Gridworld Playground, 主要围绕observation, action和reward三个详细展开, 并给出模拟的例...
10