这一篇会介绍一下强化学习在实际生活中的一些应用. 我们会看一下如何将一个实际的问题转换为使用强化学习可以解决的问题.
强化学习解决背包问题
这一篇介绍使用强化学习来解决背包问题. 也是作为一个引子,来看一下如何使用强化学习, 来解决这种优化问题.
Reinforcement Learning(强化学习)-Cliff Walking Playground环境介绍
这一篇介绍强化学习中的Cliff Walking Playground的环境. 包括环境的大体介绍, 以及环境代码的简单实验.
模型的可解释性简单说明(Interpreting machine learning models)
这一篇介绍关于模型可解释性方向的一些方法,主要会介绍为什么需要模型的可解释性,和传统的模型的可解释的一些做法。以及现在一些更加通用的模型的可解释性的方式。
t-SNE与AE对MNIST可视化
本文介绍关于使用t-SNE进行可视化, 会使用MNIST作为测试数据集. 本文会主要分为两个部分, 首先使用AE对数据进行降维, 降到24维, 接着使用t-SNE对数据进一步降维,...
Importance Sampling (重要性采样)介绍
这一篇是关于重要性抽样(importance sampling)的介绍, 包括他的背景知识, 相关的数学转换和最后的例子.
Reinforcement Learning(强化学习)-Windy Gridworld Playground环境介绍
这一篇文章介绍强化学习中的一个环境Windy Gridworld Playground, 主要围绕observation, action和reward三个详细展开, 并给出模拟的例...
模型解释–SHAP Value的简单介绍
这一篇文章主要介绍一下关于SHAP方法,会介绍关于Shapley Value的计算方式,通过举例进行说明。接着会举一个实际的例子,来说明如何使用SHAP来进行模型的解释,和对最后结...
Reinforcement Learning(强化学习)-BlackJack环境介绍
这一篇是对于BlackJack环境的介绍, 介绍了里面observation, reward和action分别是什么, 以及一个可能会出现的报错NotImplementedErro...
Reinforcement Learning(强化学习)-Gym 使用介绍
这一篇作为强化学习的开篇, 会介绍其工具gym的使用. 之后大部分强化学习的实验, 都会基于gym来进行完成. 所以这一篇好好介绍一下gym的使用, 特别是gym配合colab的使...
10