Saliency Maps的原理与简单实现(使用Pytorch实现)

2019年6月27日07:24:15

评论10 3106字阅读10分21秒

摘要这一篇主要介绍一种模型解释的方式，Saliency Maps来进行对模型的解释。我们会结合论文说明Saliency Maps的基本原理和实验Pytorch来完成Saliency Maps的实验。

文章目录(Table of Contents)

介绍

这一篇会介绍一下Saliency Maps的简单原理。Saliency Maps简单来说可以理解为是用来做模型的解释，可以用来知道哪些变量对于模型来说是重要的。我们也可以理解为Saliency map即特征图，可以告诉我们图像中的像素点对图像分类结果的影响。

这一篇文章介绍了两种可视化的方式，一种在我之前也有简单的涉及，就是通过指定某个class的概率最大，来通过反向传播来修改input image，不过在文章中他有一些改进来保证最后输出结果的可视化。文章链接如下：使用CNN在MNIST上实现简单的攻击样本

这里会主要介绍关于Saliency Maps的内容。

下面我就实验论文里的进行解释(具体的可以查看原始的论文).

整体的目标 : 给一张图片I_0, 对应的分类是c, 有一个模型给出图片I_0的概率值是S_c(I),我们想要衡量I_0的某个像素点对分类器S_c(I)的影响.

下面给一个比较直观的解释，假如我们的模型S_c(I)是一个线性模型，如下所示：

那么我们就可以通过观察W的大小来看出每个像素点对应的重要度的信息。

对于复杂的网络来说，模型S_c(I)是一个复杂的非线性模型。但是对于给的图像I_0, 我们可以在I_0的周围对模型S_c(I)进行一阶泰勒展开，如下所示：

其中的W就是模型S_c(I)对I的导数：

所以，最终我们要做的就是计算W的值。到这里W的计算方式也给出来了，其实就是整个网络进行方向传播，计算输入X的梯度，就是这里的W.(也可以看一下后面具体代码的实现)

对于上面计算梯度W可以用来表示每个特征的重要度，我们可以这么来进行理解。导数的大小表示某个像素点改变一点，对最后结果的影响。

如下图所示，我们可以认为是x_n的改变对y_k的改变

于是，这样计算下来相当于是导数的计算

下面一些是原论文的实验的结果。后面会有具体的实现方式讲解。

计算Saliency Map的时候首先要计算与图像像素对应的正确分类中的标准化分数的梯度(这是一个标量)。如果图像的形状是(3, H, W)，这个梯度的形状也是(3, H, W)；
对于图像中的每个像素点，这个梯度告诉我们当像素点发生轻微改变时，正确分类分数变化的幅度。
之后，我们计算出梯度的绝对值，然后再取三个颜色通道的最大值；因此最后的saliency map的形状是(H, W)为一个通道的灰度图。

对于Saliency Maps的实验，这里只给出核心代码，全部的代码见链接(github仓库)。

def compute_saliency_maps(X, y, model):
"""
X表示图片, y表示分类结果, model表示使用的分类模型
Input :
- X : Input images : Tensor of shape (N, 3, H, W)
- y : Label for X : LongTensor of shape (N,)
- model : A pretrained CNN that will be used to computer the saliency map
Return :
- saliency : A Tensor of shape (N, H, W) giving the saliency maps for the input images
"""
# 确保model是test模式
model.eval()
# 确保X是需要gradient
X.requires_grad_()
saliency = None
logits = model.forward(X)
logits = logits.gather(1, y.view(-1, 1)).squeeze() # 得到正确分类
logits.backward(torch.FloatTensor([1., 1., 1., 1., 1.])) # 只计算正确分类部分的loss
saliency = abs(X.grad.data) # 返回X的梯度绝对值大小
saliency, _ = torch.max(saliency, dim=1)
return saliency.squeeze()