caffe源代码分析--Blob类代码研究
作者:linger
转自须注明转自:http://blog.csdn.net/lingerlanlan/article/details/24379689
数据成员
shared_ptr<SyncedMemory>data_;//data数据。指向SyncedMemory的智能指针
shared_ptr<SyncedMemory>diff_;//表示“差”。用于更新data_
intnum_;
intchannels_;
intheight_;
intwidth_;
intcount_;
构造函数
Blob():num_(0),channels_(0),height_(0),width_(0),count_(0),data_(),diff_(){}
功能:简单的初始化
explicitBlob(constintnum,constintchannels,constintheight,constintwidth);
功能:调用Reshape函数。初始化数据成员
template<typenameDtype>
Blob<Dtype>::Blob(constintnum,constintchannels,constintheight,
constintwidth)
{
Reshape(num,channels, height, width);
}
析构函数
virtual~Blob(){}
功能:啥都没做?
voidReshape(constintnum,constintheight,
constintwidth,constintchannels);
功能:初始化数据成员,智能指针指向SyncedMemory对象。此时SyncedMemory对象事实上并没有为自己的“数据”申请内存,仅仅是自己“数据”的大小(size)。
template<typenameDtype>
voidBlob<Dtype>::Reshape(constintnum,constintchannels,constintheight,
constintwidth)
{
CHECK_GE(num,0);
CHECK_GE(channels,0);
CHECK_GE(height,0);
CHECK_GE(width,0);
num_=
num;
channels_=
channels;
height_=
height;
width_=
width;
count_=num_*channels_*height_*width_;
if(count_){
data_.reset(newSyncedMemory(count_*sizeof(Dtype)));
diff_.reset(newSyncedMemory(count_*sizeof(Dtype)));
}else{
data_.reset(reinterpret_cast<SyncedMemory*>(NULL));
diff_.reset(reinterpret_cast<SyncedMemory*>(NULL));
}
}
成员訪问函数
功能:就是返回一些成员变量
inlineintnum()const{returnnum_;}
inlineintchannels()const{returnchannels_;}
inlineintheight()const{returnheight_;}
inlineintwidth()const{returnwidth_;}
inlineintcount()const{returncount_;}
inlineintoffset(constintn,constintc
= 0, constinth
= 0,constintw
= 0) const{
return((n
* channels_+ c) *height_+
h) *width_+ w;
//计算偏移量,由于数据在内存是一维数组形式的,所以须要计算偏移量来訪问
}
“数据”指针返回函数
功能:事实上这些函数就是调用SyncedMemory的函数,来返回数据的指针
constDtype*cpu_data()const;
constDtype*gpu_data()const;
constDtype*cpu_diff()const;
constDtype*gpu_diff()const;
Dtype*mutable_cpu_data();
Dtype*mutable_gpu_data();
Dtype*mutable_cpu_diff();
Dtype*mutable_gpu_diff();
inlineDtypedata_at(constintn,constintc,constinth,
constintw)const{
//从cpu訪问数据data
return*(cpu_data()+
offset(n, c, h, w));
}
inlineDtypediff_at(constintn,constintc,constinth,
constintw)const{
//从cpu訪问数据diff
return*(cpu_diff()
+ offset(n, c, h, w));
}
函数voidUpdate()
功能:更新data_的数据,就是减去diff_的数据。
template<typenameDtype>
voidBlob<Dtype>::Update(){
//We
will perform update based on where the data is located.
switch(data_->head()){
caseSyncedMemory::HEAD_AT_CPU:
//perform
computation on CPU
caffe_axpy<Dtype>(count_,Dtype(-1),
reinterpret_cast<constDtype*>(diff_->cpu_data()),
reinterpret_cast<Dtype*>(data_->mutable_cpu_data()));
//在math_functions.cpp能够找到该函数的实现。事实上这函数也是封装了mkl的函数。这里调用是为了实现了两个向量的减法。
break;
caseSyncedMemory::HEAD_AT_GPU:
caseSyncedMemory::SYNCED:
//perform
computation on GPU
caffe_gpu_axpy<Dtype>(count_,Dtype(-1),
reinterpret_cast<constDtype*>(diff_->gpu_data()),
reinterpret_cast<Dtype*>(data_->mutable_gpu_data()));
//在math_functions.cpp能够找到该函数的实现。事实上这函数也是封装了cublas的函数。这里调用是为了实现了两个向量的减法。
break;
default:
LOG(FATAL)<<"Syncedmemnot
initialized.";
}
}
函数voidCopyFrom(constBlob<Dtype>&source,boolcopy_diff
= false,boolreshape
= false);
功能:从source拷贝数据。copy_diff作为标志来区分是拷贝data还是拷贝diff。
template<typenameDtype>
voidBlob<Dtype>::CopyFrom(constBlob&source,boolcopy_diff,boolreshape)
{
if(num_!=
source.num() || channels_!=
source.channels() ||
height_!=
source.height() || width_!=
source.width()) {
if(reshape)
{
Reshape(source.num(),source.channels(), source.height(), source.width());
}else{
LOG(FATAL)<<"Tryingto
copy blobs of different sizes.";
}
}
switch(Caffe::mode()){
caseCaffe::GPU:
if(copy_diff){
CUDA_CHECK(cudaMemcpy(diff_->mutable_gpu_data(),source.gpu_diff(),
sizeof(Dtype)*count_,cudaMemcpyDeviceToDevice));
}else{
CUDA_CHECK(cudaMemcpy(data_->mutable_gpu_data(),source.gpu_data(),
sizeof(Dtype)*count_,cudaMemcpyDeviceToDevice));
}
break;
caseCaffe::CPU:
if(copy_diff){
memcpy(diff_->mutable_cpu_data(),source.cpu_diff(),
sizeof(Dtype)*count_);
}else{
memcpy(data_->mutable_cpu_data(),source.cpu_data(),
sizeof(Dtype)*count_);
}
break;
default:
LOG(FATAL)<<"Unknowncaffemode.";
}
}
函数voidFromProto(constBlobProto&proto);
功能:从proto读数据进来,事实上就是反序列化
template<typenameDtype>
voidBlob<Dtype>::FromProto(constBlobProto&proto){
Reshape(proto.num(),proto.channels(),proto.height(),proto.width());
//copy
data
Dtype*data_vec
= mutable_cpu_data();
for(inti
= 0; i < count_;++i) {
data_vec[i]=proto.data(i);
}
if(proto.diff_size()>
0) {
Dtype*diff_vec
= mutable_cpu_diff();
for(inti
= 0; i < count_;++i) {
diff_vec[i]=proto.diff(i);
}
}
}
函数voidToProto(BlobProto*proto,boolwrite_diff
= false)const;
功能:序列化到proto保存
template<typenameDtype>
voidBlob<Dtype>::ToProto(BlobProto*proto,boolwrite_diff)const{
proto->set_num(num_);
proto->set_channels(channels_);
proto->set_height(height_);
proto->set_width(width_);
proto->clear_data();
proto->clear_diff();
constDtype*data_vec
= cpu_data();
for(inti
= 0; i < count_;++i) {
proto->add_data(data_vec[i]);
}
if(write_diff)
{
constDtype*diff_vec
= cpu_diff();
for(inti
= 0; i < count_;++i) {
proto->add_diff(diff_vec[i]);
}
}
}
caffe源代码分析--Blob类代码研究的更多相关文章
- caffe源代码分析--math_functions.cu代码研究
当中用到一个宏定义CUDA_KERNEL_LOOP 在common.hpp中有. #defineCUDA_KERNEL_LOOP(i,n) \ for(inti = blockIdx.x * bloc ...
- caffe源代码分析--softmax_layer.cpp
caffe源代码分析--softmax_layer.cpp // Copyright 2013 Yangqing Jia // #include <algorithm> #include ...
- Caffe源码-Blob类
Blob类简介 Blob是caffe中的数据传递的一个基本类,网络各层的输入输出数据以及网络层中的可学习参数(learnable parameters,如卷积层的权重和偏置参数)都是Blob类型.Bl ...
- Red5源代码分析 - 关键类及其初始化过程
原文地址:http://semi-sleep.javaeye.com/blog/348768 Red5如何响应rmpt的请求,中间涉及哪些关键类? 响应请求的流程如下: 1.Red5在启动时会调用RT ...
- caffe源代码分析--data_layer.cpp
dataLayer作为整个网络的输入层, 数据从leveldb中取. leveldb的数据是通过图片转换过来的. 网络建立的时候. datalayer主要是负责设置一些參数,比方batchsize.c ...
- ffdshow 源代码分析 8: 视频解码器类(TvideoCodecDec)
===================================================== ffdshow源代码分析系列文章列表: ffdshow 源代码分析 1: 整体结构 ffds ...
- Media Player Classic - HC 源代码分析 2:核心类 (CMainFrame)(1)
===================================================== Media Player Classic - HC 源代码分析系列文章列表: Media P ...
- Caffe源代码中Solver文件分析
Caffe源代码(caffe version commit: 09868ac , date: 2015.08.15)中有一些重要的头文件,这里介绍下include/caffe/solver.hpp文件 ...
- ffdshow 源代码分析 9: 编解码器有关类的总结
===================================================== ffdshow源代码分析系列文章列表: ffdshow 源代码分析 1: 整体结构 ffds ...
随机推荐
- vim:隆重推荐括号补全插件--auto-pairs
太好用了,括号相关的各种麻烦都一一解决,剩下的就是熟练,熟练,在熟练了.呵呵 连教程都做得这么好,先放这里,以后慢慢翻译. Auto Pairs Insert or delete brackets, ...
- Xilinx中的xapp1052理解
xapp1052是xilinx官方给出的一个有关DMA数据传输的样例,用于PC端和FPGA端之间的DMA数据传输.首先需要说的是,xapp1052并不是一个完整的DMA数据传输的终端硬件设计,这在下面 ...
- 如何学好FPGA
http://bbs.elecfans.com/jishu_278578_1_1.html 掌握FPGA可以找到一份很好的工作,对于有经验的工作人员,使用FPGA可以让设计变得非常有灵活性.掌握了FP ...
- CocoaPods did not set the base configuration of your project 问题解决方式
今天在使用pod install的时候.出现了 [!] CocoaPods did not set the base configuration of your project because you ...
- express 设置node_env的环境变量
设置process.env.NODE_ENV的环境变量可以用以下2种方式: //在你的app.js文件中设置 process.env.NODE_ENV = 'development'; //在pack ...
- iOS开发-模拟器的小常识
/* 补充: 让模拟器锁屏: command + l */ 让模拟器变大变小 打开Xcode模拟器,选择Window->Scale->
- jar包调用jar包内部和外部的配置文件
http://blog.csdn.net/lpftobetheone/article/details/32689467 **************************************** ...
- 从c++看js的那些概念
感觉c++逐渐没落了,js正风生水起,各种概念层出不穷. reactjs,flux ,angularjs cmd,amd模块化设计. 初看起来好像很高端的样子,后来发现也不过是如此. c++毕竟经历了 ...
- 【C#】List<T>对象的深复制
一.List对象中的T是值类型的情况(int 类型等) 对于值类型的List直接用以下方法就可以复制: List<T> oldList = new List<T>(); old ...
- [应用]Linux下" >/dev/null 2>&1 "
转自:http://blog.csdn.net/sunrier/article/details/7695839 这条命令的意思就是在后台执行这个程序,并将错误输出2重定向到标准输出1,然后将标准输出1 ...