在之前的内容中, 我们通过自己定义的损失函数和系数更新的方法来更新系数. 但其实在Pytorch中, 已经包含了相应的函数, 可以直接来计算损失, 和完成梯度下降. 所以在这一部分...
Pytorch入门教程05-梯度下降算法
之前我们讲了如何求梯度, 如何使用Pytorch求解梯度. 这里我们介绍梯度下降法, 用一个例子, 介绍如何优化参数.
Pytorch入门教程04-非叶子节点梯度保存
这里主要介绍在Pytorch中Hook的使用, 我们可以用其来保存非叶子节点的梯度.
Pytorch入门教程03-正向传播与反向传播
这一篇主要通过一个例子, 来介绍正向传播与反向传播的相关内容.
Pytorch入门教程02-梯度的求解
这一篇介绍一下使用Pytorch来求解梯度. 会给出一个例子, 我们自己推导一遍梯度的求导, 然后与Pytorch的autograd的结果比较.
Pytorch入门教程01-张量(Tensor)的介绍
这一篇是Pytorch快速入门的第一篇, 主要介绍Pytorch中张量的相关操作, 张量的类型, 张量的运算, 和CPU与GPU相互转换.
强化学习的一些应用-通用领域
这一篇文章介绍使用强化学习在一些通用的问题上的应用, 例如强化学习解决数据不平衡的问题, 强化学习解决feature cost的问题. 这些都不是局限在一个领域, 希望可以有所启发...
强化学习的一些应用-入侵检测方向论文
这一篇文章记录一下强化学习在网络流量检测, 入侵检测方面的相关应用.
Pytorch实现Actor Critic Baseline (A2C, Cliff Walking PlayGround)
这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Actor-Critic Baseline (A2C). 因为目前很少有使用Cliff ...
Pytorch实现Deep Q-Learning(Cliff Walking PlayGround)
这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Deep Q-Learning. 也是对官网教程的详细说明.
10