net.params['layername'].[0]/[1]

caffe的一个程序跑完之后会在snapshot所指定的目录下产生一个后缀名为caffemode的文件，这里存放的就是我们在训练网络的时候得到的每层参数的信息。

net.params['layername'][0].data #访问权重参数（num_filter,channel,weight,high

net.params['layername'][1].data  #访问bias，格式是（biase,）

如下所示，这里的net.params使用的是字典的格式：

格式： layername (num_filter,channel,kernel_size,kernel_size) (biase_counts,)

net.blobs['layername'].data

保存着网络结构的字典类型，记录着图片数据。

net.blobs['layername'].data.shape  #得到输入图片的大小

net.blobs['layername'].data.reshape(0,3,227,227)  #改变图片大小（batch——number,channel,image_size,image_size） 只有最开始的时候第二位是channel，之后的图片数据第二位是feature_map的个数
#net.blobs['layername'].data[0,:36] 表示batch_size里的第一个图片卷积层后的featuresmap图像中的前36幅feature map图像

查看cnn各层的输出值（activations）的结构

#第i次循环体的内部

#layer_name提取的是net的第i层的名称

#blob提取的是第i层的输出数据（4d）

for layer_name, blob in net.blobs.iteritems():

    print layer_name + '\t' + str(blob.data.shape)

结果是：

data (50, 3, 227, 227) 网络的输入，batch_number = 50，图像为227*227*3的RGB图像

conv1 (50, 96, 55, 55) 第一个conv层的输出图像大小为55*55，feature maps个数为96

pool1 (50, 96, 27, 27) 第一个pool层的图像尺寸为27*27，feature map个数为96

norm1 (50, 96, 27, 27) 第一个norm层的图像尺寸为27*27，feature map个数为96

conv2 (50, 256, 27, 27) 第二个conv层的图像尺寸为27*27，feature map个数为256

pool2 (50, 256, 13, 13) 第二个pool层的图像尺寸为13*13，feature map个数为256

norm2 (50, 256, 13, 13) 第二个norm层的图像尺寸为13*13，feature map个数为256

conv3 (50, 384, 13, 13) 第三个conv层的图像尺寸为13*13，feature map个数为384

conv4 (50, 384, 13, 13) 第四个conv层的图像尺寸为13*13，feature map个数为384

conv5 (50, 256, 13, 13) 第五个conv层的图像尺寸为13*13，feature map个数为256

pool5 (50, 256, 6, 6) 第五个pool层的图像尺寸为13*13，feature map个数为256

fc6 (50, 4096)
第六个fc层的图像尺寸为4096

fc7 (50, 4096)
第七个fc层的图像尺寸为4096

fc8 (50, 1000)
第八个fc层的图像尺寸为1000

prob (50, 1000)
probablies层的尺寸为1000

查看每一层的参数结构

#第i次循环体的内部

#layer_name提取的是第i层的名字

#params提取的是第i层的参数

for layer_name, param in net.params.iteritems():

    print layer_name + '\t' + str(param[0].data.shape, str(param[1].data.shape)

结果是：

conv1 (96, 3, 11, 11) (96,) 第一个conv层的filters的尺寸，这里的3是因为输入层的data为rgb，可以看做三个feature maps

conv2 (256, 48, 5, 5) (256,) 第二个conv层的filters尺寸

conv3 (384, 256, 3, 3) (384,)第三个conv层的filters尺寸

conv4 (384, 192, 3, 3) (384,)第四个conv层的filters尺寸

conv5 (256, 192, 3, 3) (256,)第五个conv层的filters尺寸

fc6 (4096, 9216) (4096,)第一个fc层的权值尺寸

fc7 (4096, 4096) (4096,)第二个fc层的权值尺寸

fc8 (1000, 4096) (1000,)第三个fc层的权值尺寸

应该注意到，由于pool层和norm层并没有需要优化的参数，所以参数中并没有关于pool层和norm层的信息

下面给出filters如何对输入数据进行filter的一幅形象化的图：

可视化4D数据的函数

def func(data):

    #输入数据为一个ndarray,尺寸可以为（batch_size,height,width）或（batch_size,height,width,channel）

    #前者是batch_size个灰度图像的数据，后者是batch_size个rgb图像的数据

    #在一个sqrt（n） by sqrt(n) 的格子中，显示没一幅图像

    #对图像进行normlization

    data = （data-data.min()）/(data.max()-data.min())

    #强制性的使输入的图像个数为平方数，不足平方的时候，手动添加几幅图

    n = int(np.ceil(np.sqrt(data.shape(0))))

    #每一幅小图像之间加入空隙

    padding(((0,n**2-data.shape[0]),(0,1),(0,1)) + ((0,0),)*(data.ndim-3))

    data = np.pad(data,padding,mode='constant',constant_values=1)  #pad with ones (white)

    #将所有输入的data图像平复在一个nadarray_data中

    data = data.reshape((n,n),data.shape[1:]).transpose(0,2,1,3) + tuple(range(4,data.ndim + 1))

    #data的一个小例子（3,120,120）

    data = data.reshape((n * data.shape[1], n * data.shape[3]) + data.shape[4:])

    # 显示data所对应的图像

    plt.imshow(data); plt.axis('off')

可视化例子

 import numpy as np

 import sys,os

 # 设置当前的工作环境在caffe下

 caffe_root = '/home/xxx/caffe/'

 # 我们也把caffe/python也添加到当前环境

 sys.path.insert(0, caffe_root + 'python')

 import caffe

 os.chdir(caffe_root)#更换工作目录

 # 设置网络结构

 net_file=caffe_root + 'models/bvlc_reference_caffenet/deploy.prototxt'

 # 添加训练之后的参数

 caffe_model=caffe_root + 'models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel'

 # 均值文件

 mean_file=caffe_root + 'python/caffe/imagenet/ilsvrc_2012_mean.npy'

 # 这里对任何一个程序都是通用的，就是处理图片

 # 把上面添加的两个变量都作为参数构造一个Net

 net = caffe.Net(net_file,caffe_model,caffe.TEST)

 # 得到data的形状，这里的图片是默认matplotlib底层加载的

 transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})

 # matplotlib加载的image是像素[0-1],图片的数据格式[weight,high,channels]，RGB

 # caffe加载的图片需要的是[0-255]像素，数据格式[channels,weight,high],BGR，那么就需要转换

 # channel 放到前面

 transformer.set_transpose('data', (2,0,1))

 transformer.set_mean('data', np.load(mean_file).mean(1).mean(1))

 # 图片像素放大到[0-255]

 transformer.set_raw_scale('data', 255)

 # RGB-->BGR 转换

 transformer.set_channel_swap('data', (2,1,0))

 # 这里才是加载图片

 im=caffe.io.load_image(caffe_root+'examples/images/cat.jpg')

 # 用上面的transformer.preprocess来处理刚刚加载图片

 net.blobs['data'].data[...] = transformer.preprocess('data',im)

 #注意,网络开始向前传播啦

 out = net.forward()

 # 最终的结果: 当前这个图片的属于哪个物体的概率(列表表示)

 output_prob = out['prob']

 # 找出最大的那个概率

 print 'predicted class is:', output_prob.argmax()

 # 也可以找出前五名的概率

 top_inds = output_prob.argsort()[::-1][:5]

 print 'probabilities and labels:'

 zip(output_prob[top_inds], labels[top_inds])

 # 最后加载数据集进行验证

 imagenet_labels_filename = caffe_root + 'data/ilsvrc12/synset_words.txt'

 labels = np.loadtxt(imagenet_labels_filename, str, delimiter='\t')

 top_k = net.blobs['prob'].data[0].flatten().argsort()[-1:-6:-1]

 for i in np.arange(top_k.size):

     print top_k[i], labels[top_k[i]]

import os

import numpy as np

import os

import matplotlib.pyplot as plt

import matplotlib.patches as  mpatches

%matplotlib inline

# 设置默认的属性：用于在ipython中显示图片

plt.rcParams['figure.figsize'] = (10, 10)

plt.rcParams['image.interpolation'] = 'nearest'

plt.rcParams['image.cmap'] = 'gray'

from math import pow

from skimage import transform as tf 

caffe_root='/opt/modules/caffe-master/'

sys.insert.path(0,caffe_root+'python')

caffe_modelcaffe=caffe_root+''

caffe_deploy=caffe_root+''

caffe.set_mode_cpu()

net=caffe.Net(caffe_deploy,caffe_modelcaffe,caffe.TEST)

transform=caffe.io.Transformer({'data':net.blobs['data'].data.shape})

transform.set_transpose('data',(2,0,1))

transform.set_raw_scale('data',255)

transform.set_channel_swap('data',(2,1,0))

#把加载到的图片缩放到固定的大小

net.blobs['data'].reshape(1,2,227,227)

image=caffe.io.load_image('/opt/data/person/1.jpg')

transformed_image=transform.preprocess('data',image)

plt.inshow(image)

# 把警告过transform.preprocess处理过的图片加载到内存

net.blobs['data'].data[...]=transformed_image

output=net.forward()

#因为这里仅仅测试了一张图片

#output_pro的shape中有对于1000个object相似的概率

output_pro=output['prob'][0]

#从候选的区域中找出最有可能的那个object的索引

output_pro_max_index=output_pro.argmax()

labels_file = caffe_root + '.../synset_words.txt'

if not os.path.exists(labels_file):

    print "in the direct without this synset_words.txt "

    return

labels=np.loadtxt(labels_file,str,delimiter='\t')

# 从对应的索引文件中找到最终的预测结果

outpur_label=labels[output_pro_max_index]

# 也可以找到排名前五的预测结果

top_five_index=output_pro.argsort()[::-1][:5]

print 'probabilities and labels:'

zip(output_pro[top_five_index],labels[top_five_index])

pycaffe 可视化常用的更多相关文章

BVLC CaffeNet可视化及类别预测
一.介绍 bvlc_reference_caffenet网络模型是由AlexNet的网络模型改写的,输入图片尺寸大小为227x227x3,输出的为该图片对应1000个分类的概率值. 介绍参考:caff ...
mnist全连接层网络权值可视化
一.数据准备网络结构:lenet_lr.prototxt 训练好的模型:lenet_lr_iter_10000.caffemodel 下载地址:链接:https://pan.baidu.com/s/ ...
python 数据分析 Matplotlib常用图表
Matplotlib绘图一般用于数据可视化常用的图表有: 折线图散点图/气泡图条形图/柱状图饼图直方图箱线图热力图需要学习的不只是如何绘图,更要知道什么样的数据用什么图表展示效果最好 ...
pyhton matplotlib可视化图像基础（二维函数图、柱状图、饼图、直方图以及折线图）
//2019.07.22pyhton中matplotlib模块的应用pyhton中matplotlib是可视化图像库的第三方库,它可以实现图像的可视化,输出不同形式的图形1.可视化图形的输出和展示需要 ...
【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
阿铭linux笔记
2015-09-06虚拟机网络设置.wmv: curl 获取在命令行显示的网页 dhclient 分配ip地址 ifdown eth0 关闭网卡eth0 ifup eh0 ...
机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)
##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...
[UFLDL] ConvNet
二十三(Convolution和Pooling练习) 三十八(Stacked CNN简单介绍) 三十六(关于构建深度卷积SAE网络的一点困惑) 五十(Deconvolution Network简单理 ...
《Tensorflow技术解析与实战》第四章
Tensorflow基础知识 Tensorflow设计理念 (1)将图的定义和图的运行完全分开,因此Tensorflow被认为是一个"符合主义"的库 (2)Tensorflow中涉 ...

随机推荐

WebStorm配置github
1.配置github 2.安装git,配置git 3.配置ssh,用git中的git Bash 4.迁出项目 5.提交文件 6.查看
Parquet学习总结
深入分析Parquet列式存储格式 Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的 ...
java日期类型与字符串类型的相互转换
package cn.zwq.convert; import java.text.ParseException; import java.text.SimpleDateFormat; import j ...
乌班图之 Ubuntu 16.04 LTS连接无线上网炒鸡慢问题！！！
用VMware装了Ubuntu 16.04 LTS后连接无线上网,发现出奇的慢. 果断感觉有问题,立马找度娘,果然有问题!!! 网上查找亲测有效的方法为: 在终端运行:sudo gedit /etc/ ...
HTML基础——网站图片显示页面
1.图片标签 <img /> 属性: src:指的是图片显示的路径(位置) 绝对路径:D:\Pictures\Saved Pictures 相对路径: ①同一级:直接写文件名称或者./文件 ...
为什么在3ds Max 按系统默认的快捷键AIT+W 视口最大化切换没反应？
经常使用3ds Max快捷键做效果图可谓是提高作图速度的毕竟之路,做效果图的朋友或许会遇到最大化视口显示失灵的问题,max默认快捷键为Alt+W,这里我不建议大家更改max的默认快捷键,当然Max也提 ...
Angualr+asp.net core webapi+efcore系列
想着学习一门前端框架,WTF,看了又看,卧槽对于.Net程序员来说,还有什么比面向对象更香的呢,所以果断的选择了Angular.正好看各路大神以及官方文档想学习一下asp.net core,那就搞起吧 ...
K8s初探
1. K8s概述 2. K8s的工作原理什么是K8s 用法: 核心概念集群 Kubernetes Master Node Pod Lable Replication Con ...
壹、js的概述
一.js的起源 1992年的时候,一家名为Nomnas的公司开发出了c减减的嵌入式脚本语言:然后利用分享的方式,扩大其市场. 之后,Netscape为了扩展浏览器的功能,开发了一个名为LiveScri ...
[转载]vim常用命令总结
内容出处https://www.jianshu.com/p/a8ab13cff1ea 如有侵权请告知移动.跳转 h.j.k.l:分别对应左.下.上.右.按键盘分布,从左到右,逆时针. w:移动到下一 ...

pycaffe 可视化常用