Pytorch快速入门 Pytorch入门教程06-损失函数和优化器 在之前的内容中, 我们通过自己定义的损失函数和系数更新的方法来更新系数. 但其实在Pytorch中, 已经包含了相应的函数, 可以直接来计算损失, 和完成梯度下降. 所以在这一部分... 10月05日评论 阅读全文
Pytorch快速入门 Pytorch入门教程05-梯度下降算法 之前我们讲了如何求梯度, 如何使用Pytorch求解梯度. 这里我们介绍梯度下降法, 用一个例子, 介绍如何优化参数. 10月04日评论 阅读全文
Pytorch快速入门 Pytorch入门教程02-梯度的求解 这一篇介绍一下使用Pytorch来求解梯度. 会给出一个例子, 我们自己推导一遍梯度的求导, 然后与Pytorch的autograd的结果比较. 10月02日评论 阅读全文
Pytorch快速入门 Pytorch入门教程01-张量(Tensor)的介绍 这一篇是Pytorch快速入门的第一篇, 主要介绍Pytorch中张量的相关操作, 张量的类型, 张量的运算, 和CPU与GPU相互转换. 10月01日评论 阅读全文
深度学习 强化学习的一些应用-通用领域 这一篇文章介绍使用强化学习在一些通用的问题上的应用, 例如强化学习解决数据不平衡的问题, 强化学习解决feature cost的问题. 这些都不是局限在一个领域, 希望可以有所启发... 09月13日评论 阅读全文
深度学习 Pytorch实现Actor Critic Baseline (A2C, Cliff Walking PlayGround) 这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Actor-Critic Baseline (A2C). 因为目前很少有使用Cliff ... 08月21日评论 阅读全文
深度学习 Pytorch实现Deep Q-Learning(Cliff Walking PlayGround) 这一篇简单介绍使用Pytorch在环境Cliff Walking PlayGround上实现Deep Q-Learning. 也是对官网教程的详细说明. 08月12日评论 阅读全文