t-SNE与AE对MNIST可视化

2020年7月2日07:02:43

评论1 6445字阅读21分29秒

摘要本文介绍关于使用t-SNE进行可视化, 会使用MNIST作为测试数据集. 本文会主要分为两个部分, 首先使用AE对数据进行降维, 降到24维, 接着使用t-SNE对数据进一步降维, 降低到2维, 并进行可视化.

文章目录(Table of Contents)

简介

本文介绍关于使用t-SNE进行可视化, 会使用MNIST作为测试数据集. 因为t-SNE的计算速度比较慢, 所以通常的做法是:

在这一部分, 我们会首先使用AutoEncoder将MNIST图片降到24维, 接着使用t-SNE进一步进行降维, 并进行可视化.

于是, 这里实验可以分为两个大部分, 分别是训练AE和使用t-SNE进行降维可视化, 下面我们来分开进行介绍.

首先我们将MNIST图片使用AE来进行降维, 关于完整的代码还是可以参考Github的链接.

这里我们使用卷积网络来组成encode, 使用逆卷积来组成decode.

# 定义网络
class DeepAutoEncoder(nn.Module):
def __init__(self):
super(DeepAutoEncoder, self).__init__()
self.encoder = nn.Sequential(
nn.Conv2d(in_channels=1, out_channels=3, kernel_size=2, stride=1, padding=0, bias=False),
nn.BatchNorm2d(3),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=2, padding=0, bias=False),
nn.BatchNorm2d(6),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(in_channels=6, out_channels=6, kernel_size=3, stride=2, padding=0, bias=False),
nn.BatchNorm2d(6),
nn.LeakyReLU(0.2, inplace=True),
nn.Conv2d(in_channels=6, out_channels=6, kernel_size=4, stride=2, padding=0, bias=False),
nn.BatchNorm2d(6),
nn.LeakyReLU(0.2, inplace=True),
) # encoder可以将图片大小转换为 1*28*28 -> 6*2*2
self.decoder = nn.Sequential(
nn.ConvTranspose2d(in_channels=6, out_channels=6, kernel_size=4, stride=2, bias=False), # 1->4
nn.BatchNorm2d(6),
nn.ReLU(True),
nn.ConvTranspose2d(in_channels=6, out_channels=6, kernel_size=3, stride=2, bias=False), # 1->4
nn.BatchNorm2d(6),
nn.ReLU(True),
nn.ConvTranspose2d(in_channels=6, out_channels=3, kernel_size=3, stride=2, bias=False), # 4 -> 10
nn.BatchNorm2d(3),
nn.ReLU(True),
nn.ConvTranspose2d(in_channels=3, out_channels=1, kernel_size=2, stride=1, bias=False), # 10 -> 22
nn.BatchNorm2d(1),
# nn.Tanh()
) # decoder可以将图片大小转换为 6*2*2 -> 1*28*28
def forward(self, x):
x = self.encoder(x)
# print(x.shape)
x = self.decoder(x)
return x

在上面设计网络的时候, 我们可以简单使用数据集进行测试. 我们可以查看输出的大小.

在定义模型完毕之后, 就是模型的训练. 我们这里使用L1 Loss进行训练, 使用Adam优化器.

# ----------
# 初始化网络
# ----------
AE = DeepAutoEncoder().to(device) # 定义分类器
# ------------
# 定义损失函数
# ------------
criterion = nn.L1Loss()
# -----------------------
# 定义损失函数和优化器
# -----------------------
learning_rate = 0.0005
optimizer = torch.optim.Adam(AE.parameters(), lr=learning_rate)
lossList = []
# ---------
# 开始训练
# ---------
num_epochs = 20
total_step = len(train_loader) # 依次epoch的步骤
# 开始训练
for epoch in range(num_epochs):
totalLoss = 0 # 总的误差
for i, (images, _) in enumerate(train_loader):
batch_size = images.size(0)
images = images.to(device)
# ---------------------
# 开始训练discriminator
# ---------------------
AE.train()
# 首先计算真实的图片
fake_image = AE(images) # 计算重构之后的内容
loss = criterion(images, fake_image) # 计算loss
optimizer.zero_grad() # 优化器梯度都要清0
loss.backward() # 反向传播
optimizer.step() # 进行优化
totalLoss = totalLoss + loss.item()
# ---------
# 打印结果
# ---------
if (i+2) % 280 == 0:
t = datetime.now() #获取现在的时间
print('Time {}, Epoch [{}/{}], Step [{}/{}], loss:{:.4f}'.format(t, epoch, num_epochs, i+1, total_step, totalLoss/(i+1)))
lossList.append(totalLoss/(i+1))

之后绘制loss的变化曲线.

接着我们使用上面训练的AE来进行图像的重构, 看一下最后output的结果. 首先我们选出16张测试的图片, 并查看原始图片.

# 查看重构的图像
T_images = torch.stack(([train_dataset[i][0] for i in range(16)]))
show(make_grid(T_images, nrow=4, padding=0, normalize=True, range=None, scale_each=False, pad_value=0))

接着我们同样对上面的16张图片, 将他们作为input, 来查看output.

# 查看重构的图片
fake_image = AE(T_images.to(device))
show(make_grid(fake_image.cpu().detach(), nrow=4, padding=0, normalize=True, range=None, scale_each=False, pad_value=0))

在训练好上面的encode之后, 我们使用t-SNE对encode的输出进行可视化.

因为这里需要接收Numpy的数据, 所以我们需要首先将数据从trainloader中提取出来.

接着我们对上面encode之后的结果使用t-SNE进行降维

最后对上面得到的结果进行可视化即可:

# 进行可视化
cmap = plt.get_cmap('plasma',10) # 数字与颜色的转换
# 获得可视化数据
v_x = x_encode
v_y = labelsList
# 进行可视化
fig = plt.figure(figsize=(14,8))
ax = fig.add_subplot(1,1,1)
classes = [0,1,2,3,4,5,6,7,8,9]
for key in classes:
ix = np.where(v_y==key)
ax.scatter(v_x[ix][:,0], v_x[ix][:,1], color=cmap(key), label=key)
ax.text(np.mean(v_x[ix][:,0]), np.mean(v_x[ix][:,1]), key, fontsize=18, bbox=dict(facecolor='white', alpha=0.5))
ax.legend()
plt.show()