data analysis - 第2页

自注意力和位置编码

自注意力和位置编码

本文会介绍「自注意力」模型，自注意力的关键就是一句话，查询、键和值都来自同一组输入。同时也会介绍位置编码的内容，来克服「自注意力」没有考虑输入的顺序。

10月17日评论

多头注意力

多头注意力

在实际中，我们希望给定相同的 queries、keys 和 values，我们希望模型可以学习到不同的内容，然后将这些内容给组合起来。这就会用到「多头注意力」机制。本文会介绍「多头...

10月16日评论

使用注意力机制的 seq2seq

使用注意力机制的 seq2seq

这一篇中，我们介绍使用注意力机制的 Seq2Seq。我们会将「注意力机制」用在 Seq2Seq 模型上面。这样在预测词元时，如果不是所有输入词元都相关，模型将仅对齐（或参与）输入序...

10月15日评论

注意力分数

注意力分数

本文会来介绍「注意力分数」的计算。特别的，这里我们会使用高维的 query ，key 和 value 来举例子。可以将「注意力分数」理解为 query 和 key 的相似度。会介...

09月28日评论

注意力机制

注意力机制

本文会介绍「注意力机制」的相关内容。主要会介绍「非参注意力机制」和「带有参数的注意力」。这里均使用一维数据作为例子。通过本文对 query，key-value 有所了解。也知道什么...

09月27日评论

在 Pytorch 中使用 Tensorboard 进行可视化

在 Pytorch 中使用 Tensorboard 进行可视化

本文主要是介绍如何使用 Pytorch 结合 Tensorboard 对训练过程进行可视化。主要介绍以下的几个功能，向 Tensorboard 添加单个或是多个指标，向 Tenso...

01月20日评论

使用 SUMO 进行仿真(5)-Detectors 介绍

使用 SUMO 进行仿真(5)-Detectors 介绍

在前面的内容中，我们完成了路网的搭建，车辆的生成，也了解了信号灯控制的相关内容。现在我们希望可以获得一些监测的数据。这个时候我们就可以通过设置 detector（探测器）来完成检...

11月03日评论

Reinforcement Learning(强化学习)- Pong 环境介绍

Reinforcement Learning(强化学习)- Pong 环境介绍

本文会介绍 OpenAI Gym 中的一款 Atari 游戏，Pong（类似乒乓）。会分别介绍 Observation，Action 和 Reward 的含义。最后给一个随机的 p...

11月03日评论

Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍

Reinforcement Learning(强化学习)-LunarLander-v2 环境介绍

本文会介绍 OpenAI 中 LunarLander-v2 这个环境。会分别介绍 Observation，Action 和 Reward 的含义。最后给一个随机的 policy，来...

11月02日评论

Reinforcement Learning(强化学习)-MountainCar 环境介绍

Reinforcement Learning(强化学习)-MountainCar 环境介绍

本文会介绍 OpenAI 中 MountainCar-v0 这个环境。主要介绍其中 action 和 observation 分别是什么。以及最后给一个简单的 policy，可以使...

10月19日评论

15

目录

繁
本页二维码