在CNN上增加一层CAM告诉你CNN到底关注什么

Cam(Class Activation Mapping)是一个很有意思的算法，他能够将神经网络到底在关注什么可视化的表现出来。但同时它的实现却又如此简介，相比NIN，googLenet这些使用GAP（Global Average Pooling）用来代替全连接层，他却将其输出的权重和featuremap相乘，累加，将其用图像表示出来。

其网络架构如下

Class Activation Mapping具体论文

当然Cam的目的并不仅仅是将其表示出来，神经网络所关注的地方，通常就是物体所在的地方，因此它可以辅助训练检测网络。

因此就有了PlacesNet。

论文

在这里可以体验

网络上基本都是基于AlexNet等网络，其实任何网络，只要加一层全局池化层就可以帮助我们将CNN关注什么表示出来，因此我对Tensorflow官方Mnist的CNN网络进行少量的修改，实现了CAM。只是将最后的全连接层，改为了全局池化层。

CAM的核心公式很简单

\[S_c = \sum_{k} {W_k^c} {\sum_{x,y} {f_k(x,y)}}
\]

将全局平均池化层输出的权重乘上feature map累加

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

import matplotlib.pyplot as plt

import numpy as np

%matplotlib inline

mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

/home/lyn/anaconda3/lib/python3.6/importlib/_bootstrap.py:205: RuntimeWarning: compiletime version 3.5 of module 'tensorflow.python.framework.fast_tensor_util' does not match runtime version 3.6

  return f(*args, **kwds)

Extracting /tmp/data/train-images-idx3-ubyte.gz

Extracting /tmp/data/train-labels-idx1-ubyte.gz

Extracting /tmp/data/t10k-images-idx3-ubyte.gz

Extracting /tmp/data/t10k-labels-idx1-ubyte.gz

在读入数据后，设定基本的学习参数

# Training Parameters

learning_rate = 0.001

num_steps = 10000

batch_size = 128

display_step = 10

# Network Parameters

num_input = 784 # MNIST data input (img shape: 28*28)

num_classes = 10 # MNIST total classes (0-9 digits)

# tf Graph input

X = tf.placeholder(tf.float32, [None, num_input])

Y = tf.placeholder(tf.int32, [None, num_classes])

# Create some wrappers for simplicity

def conv2d(x, W, b, strides=1):

    # Conv2D wrapper, with bias and relu activation

    x = tf.nn.conv2d(x, W, strides=[1, strides, strides, 1], padding='SAME')

    x = tf.nn.bias_add(x, b)

    return tf.nn.relu(x)

def maxpool2d(x, k=2):

    # MaxPool2D wrapper

    return tf.nn.max_pool(x, ksize=[1, k, k, 1], strides=[1, k, k, 1],

                          padding='SAME')

在实际使用中我们需要获得得feature map，与全局池化层相乘并累加

def conv_layers(x,weights,biases):

    x = tf.reshape(x, shape=[-1, 28, 28, 1])

    # Convolution Layer

    conv1 = conv2d(x, weights['wc1'], biases['bc1'])

    # Max Pooling (down-sampling)

    conv1 = maxpool2d(conv1, k=2)

    # Convolution Layer

    conv2 = conv2d(conv1, weights['wc2'], biases['bc2'])

    # Max Pooling (down-sampling)

    conv2 = maxpool2d(conv2, k=2)

    return conv2

def out_layer(conv2,weights,biases):

    gap = tf.nn.avg_pool(conv2,ksize=[1,7,7,1],strides=[1,7,7,1],padding="SAME")

    gap = tf.reshape(gap,[-1,128])

    out = tf.add(tf.matmul(gap, weights['out']), biases['out'])

    return out

def generate_heatmap(conv2,label,weights):

    conv2_resized = tf.image.resize_images(conv2,[28,28])

    label_w = tf.gather(tf.transpose(weights['out']),label)

    label_w = tf.reshape(label_w,[-1,128,1])

    conv2_resized = tf.reshape(conv2_resized,[-1,28*28,128])

    classmap = tf.matmul( conv2_resized, label_w )

    classmap = tf.reshape( classmap, [-1, 28,28] )

    return classmap

# Store layers weight & bias

weights = {

    # 5x5 conv, 1 input, 32 outputs

    'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32])),

    # 5x5 conv, 32 inputs, 64 outputs

    'wc2': tf.Variable(tf.random_normal([5, 5, 32, 128])),

    'out': tf.Variable(tf.random_normal([128, num_classes]))

}

biases = {

    'bc1': tf.Variable(tf.random_normal([32])),

    'bc2': tf.Variable(tf.random_normal([128])),

    'bd1': tf.Variable(tf.random_normal([1024])),

    'out': tf.Variable(tf.random_normal([num_classes]))

}

# Construct model

conv2 = conv_layers(X, weights, biases)

logits = out_layer(conv2,weights, biases)

prediction = tf.nn.softmax(logits)

classmap = generate_heatmap(conv2,tf.argmax(prediction,1),weights)

loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(

    logits=logits, labels=Y))

optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)

train_op = optimizer.minimize(loss_op)

# Evaluate model

correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))

accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# Initialize the variables (i.e. assign their default value)

init = tf.global_variables_initializer()

sess = tf.Session()

sess.run(init)

for step in range(1, num_steps+1):

    batch_x, batch_y = mnist.train.next_batch(batch_size)

    # Run optimization op (backprop)

    sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})

    if step % display_step == 0 or step == 1:

        # Calculate batch loss and accuracy

        loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,

                                                             Y: batch_y})

        print("Step " + str(step) + ", Minibatch Loss= " + \

              "{:.4f}".format(loss) + ", Training Accuracy= " + \

              "{:.3f}".format(acc))

print("Optimization Finished!")

# Calculate accuracy for 256 MNIST test images

print("Testing Accuracy:", \

    sess.run(accuracy, feed_dict={X: mnist.test.images[:256],

                                  Y: mnist.test.labels[:256],}

            ))

sess.run(conv2,feed_dict={X:mnist.test.images[:10],Y:mnist.test.labels[:10]})

classmaps = sess.run(classmap,feed_dict={X:mnist.test.images[:10],Y:mnist.test.labels[:10]})

Testing Accuracy: 0.976562

for i in range(9):

    plt.subplot(33*10+i+1)

    plt.axis("off")

    plt.imshow(classmaps[i],cmap="gray")

    plt.title("label is"+str(np.argmax(mnist.test.labels[i])))

黑色为正权重点，白色为负权重点。

当然由于网络太浅，使用了全局平均池化以后，训练时间大大增长，准确率也不如之前。

在CNN上增加一层CAM告诉你CNN到底关注什么的更多相关文章

Ext JS treegrid 发生的在tree上增加itemclick 与在其它列上增加actioncolumn 发生事件冲突(event conflict)的解决办法
Ext JS treegrid 发生的在tree上增加itemclick 与在其它列上增加actioncolumn 发生事件冲突(event conflict)的解决办法最近在适用Ext JS4开发 ...
AIX上增加逻辑卷时报错误0516-787 extendlv: Maximum allocation for logical volume
AIX上增加逻辑卷时报错误0516-787 extendlv: Maximum allocation for logical volume jdelv02 is 512. 在往aix使用chfs -a ...
跟我一起学extjs5(05--主界面上增加顶部和底部区域)
跟我一起学extjs5(05--主界面上增加顶部和底部区域) 这一节为主界面加一个顶部区域和底部区域. 一个管理系统的界面能够粗分为顶部标题部分.中间数据展示和处理的部分.底部备注和状 ...
SQL某个字段在原内容上增加固定内容或replace查找替换内容
今天正好遇到一个SQL小问题,特做备注在原有的表中数据如pic 在不动原内容的基础上增加../路径,但不能修改原数据值原数据 SQL: pic字段需要增加'../'的内容 update Bmps ...
在iOS上增加手势锁屏、解锁功能
在iOS上增加手势锁屏.解锁功能在一些涉及个人隐私的场景下,尤其是当移动设备包含太多私密信息时,为用户的安全考虑是有必要的. 桌面版的QQ在很多年前就考虑到用户离开电脑后隐私泄露的危险,提供了“离开 ...
sharepoint 2010 在自定义列表的字段上增加功能菜单
sharepoint 2010 在自定义列表的字段上增加功能菜单方法打开sharepoint designer 2010,找到需要修改的视图页面,例如allitem.aspx,编辑这个页面,点击高级 ...
在Linux服务器上增加硬盘没那么简单【转】
运维案例:HP服务器,LINUX系统在保障数据的前提下扩展/home分区部门需求:研发部门提出需要在现有的服务器上扩容磁盘空间,以满足开发环境的磁盘需求.现有空间1.6T需要增加到2T. 需求调查分 ...
ASP.NET Web API实践系列06, 在ASP.NET MVC 4 基础上增加使用ASP.NET WEB API
本篇尝试在现有的ASP.NET MVC 4 项目上增加使用ASP.NET Web API. 新建项目,选择"ASP.NET MVC 4 Web应用程序". 选择"基本&q ...
Mirror--如何在主库上增加文件
由于各种原因,如磁盘不空不足,需要对主库增加数据库文件到其他磁盘上,而镜像服务器上没有对应盘符,很多人会选择删除镜像,重新完备还原来搭建镜像,这种方式耗时耗力. 在做此类操作时,需要对主服务器和镜像服 ...

随机推荐

【leetcode】447. Number of Boomerangs
题目如下: 解题思路:我首先用来时间复杂度是O(n^3)的解法,会判定为超时:后来尝试O(n^2)的解法,可以被AC.对于任意一个点,我们都可以计算出它与其余点的距离,使用一个字典保存每个距离的点的数 ...
Linux根据进程号查找其程序文件路径及 lsof 命令使用
查找进程文件路径 lsof -p pid 1.列出所有打开的文件: lsof 备注: 如果不加任何参数,就会打开所有被打开的文件,建议加上一下参数来具体定位 2. 查看谁正在使用某个文件 lsof ...
[LeetCode] 238. 除自身以外数组的乘积 ☆☆☆(左积*右积)
描述给定长度为 n 的整数数组 nums,其中 n > 1,返回输出数组 output ,其中 output[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积. 示例: 输入: ...
linux find rm ls 逻辑非运用
需求场景描述查找出除已知文件外的文件办法: [root@VM_58_118_centos test]# .1_fv1..0_pv1..6_15752678845473..2_fv1..4_pv1. ...
【HDOJ6621】K-th Closest Distance（主席树，二分）
题意:给定一个长为n的序列,有m次强制在线的询问,每次询问位置[L,R]中abs(a[i]-p)第k小的值 n,m<=1e5,a[i]<=1e6,p<=1e6,k<=169 思 ...
学习日记9、easyui控件两次请求服务器端问题
<select id="BankCard" class="easyui-combobox" style="width: 600px;" ...
（转）jupyter常用快捷键
转:http://www.mamicode.com/info-detail-2395285.html Jupyter Notebook 有两种键盘输入模式.即命令模式和编辑模式,这与 vim有些类似. ...
牛客提高D4t2 卖羊驼
分析不难想到dp[i][j]表示前i个数分了j组的最大值我们发现这个dp状态有决策单调性 g[i][j]表示对于第i个数它的第j位最近出现的位置每次一定从这些点转移预处理即可似乎还可以做到1 ...
P2239螺旋矩阵
传送看到这数据范围,显然咱不能暴力直接模拟(二维数组开不下,而且会T掉) 我们目前有两种选择: 1.优化暴力走这边(jyy tql%%%) 2.数学做法我们看一下题目中的那个矩阵我们能不能找 ...
CSS-父元素宽度自适应子元素宽度之和
最近碰见这样一个需求,要让图片横向排列设置 x 方向的滚动条滚动查看,原本当直接创建一个 IFC(inline,float 什么的)就解决了,搞了半天发现搞不定(IFC 也是不能父元素宽度自适应子元素 ...

在CNN上增加一层CAM告诉你CNN到底关注什么

在CNN上增加一层CAM告诉你CNN到底关注什么的更多相关文章

随机推荐

热门专题