【Caffe代码解析】compute_image

功能：

计算训练数据库的平均图像。

由于平均归一化训练图像会对结果有提升，所以Caffe里面，提供了一个可选项。

用法：

compute_image_mean [FLAGS] INPUT_DB [OUTPUT_FILE]\n”)

參数：INPUT_DB：数据库

參数（可选）：OUTPUT_FILE：输出文件名称,不提供的话，不保存平均图像blob

实现方法：

数据源：求平均图像的方法是直接从数据库（LevelDB或者LMDB）里面直接读取出来的，而不是直接用图像数据库里面求出，意味着，必须先进行图像到数据库的转换后，才干求平均图像这一步。

接下来就是遍历KV数据库的每个值while (cursor->valid()) 将每个数据值转换为Datum，datum.ParseFromString(cursor->value());

接着将Datum阶码到sum_blob 中。sum_blob 是一个num=1，channels=图像.channel,height=图像.height ,width=图像.width 的blob

累加：

sum_blob.set_data(i, sum_blob.data(i) + (uint8_t)data[i]);

最后求平均：

sum_blob.set_data(i, sum_blob.data(i) / count);

存在的问题：上述代码仅仅是先累加在处于数目求和，显然，假设须要求平均的图像的数目相当多的话，就有可能溢出（浮点溢出）。

最后，假设要求简单一点的话，也能够直接求每个通道的平均值。

源码：//2015.06.04版本号

#include <stdint.h>

#include <algorithm>

#include <string>

#include <utility>

#include <vector>

#include "boost/scoped_ptr.hpp"

#include "gflags/gflags.h"

#include "glog/logging.h"

#include "caffe/proto/caffe.pb.h"

#include "caffe/util/db.hpp"

#include "caffe/util/io.hpp"

using namespace caffe;  // NOLINT(build/namespaces)

using std::max;

using std::pair;

using boost::scoped_ptr;

DEFINE_string(backend, "lmdb",

        "The backend {leveldb, lmdb} containing the images");

int main(int argc, char** argv) {

  ::google::InitGoogleLogging(argv[0]);

#ifndef GFLAGS_GFLAGS_H_

  namespace gflags = google;

#endif

  gflags::SetUsageMessage("Compute the mean_image of a set of images given by"

        " a leveldb/lmdb\n"

        "Usage:\n"

        "    compute_image_mean [FLAGS] INPUT_DB [OUTPUT_FILE]\n");

  gflags::ParseCommandLineFlags(&argc, &argv, true);

  if (argc < 2 || argc > 3) {

    gflags::ShowUsageWithFlagsRestrict(argv[0], "tools/compute_image_mean");

    return 1;

  }

  scoped_ptr<db::DB> db(db::GetDB(FLAGS_backend));

  db->Open(argv[1], db::READ);

  scoped_ptr<db::Cursor> cursor(db->NewCursor());

  BlobProto sum_blob;

  int count = 0;

  // load first datum

  Datum datum;

  datum.ParseFromString(cursor->value());

  if (DecodeDatumNative(&datum)) {

    LOG(INFO) << "Decoding Datum";

  }

  sum_blob.set_num(1);

  sum_blob.set_channels(datum.channels());

  sum_blob.set_height(datum.height());

  sum_blob.set_width(datum.width());

  const int data_size = datum.channels() * datum.height() * datum.width();

  int size_in_datum = std::max<int>(datum.data().size(),

                                    datum.float_data_size());

  for (int i = 0; i < size_in_datum; ++i) {

    sum_blob.add_data(0.);

  }

  LOG(INFO) << "Starting Iteration";

  while (cursor->valid()) {

    Datum datum;

    datum.ParseFromString(cursor->value());

    DecodeDatumNative(&datum);

    const std::string& data = datum.data();

    size_in_datum = std::max<int>(datum.data().size(),

        datum.float_data_size());

    CHECK_EQ(size_in_datum, data_size) << "Incorrect data field size " <<

        size_in_datum;

    if (data.size() != 0) {

      CHECK_EQ(data.size(), size_in_datum);

      for (int i = 0; i < size_in_datum; ++i) {

        sum_blob.set_data(i, sum_blob.data(i) + (uint8_t)data[i]);

      }

    } else {

      CHECK_EQ(datum.float_data_size(), size_in_datum);

      for (int i = 0; i < size_in_datum; ++i) {

        sum_blob.set_data(i, sum_blob.data(i) +

            static_cast<float>(datum.float_data(i)));

      }

    }

    ++count;

    if (count % 10000 == 0) {

      LOG(INFO) << "Processed " << count << " files.";

    }

    cursor->Next();

  }

  if (count % 10000 != 0) {

    LOG(INFO) << "Processed " << count << " files.";

  }

  for (int i = 0; i < sum_blob.data_size(); ++i) {

    sum_blob.set_data(i, sum_blob.data(i) / count);

  }

  // Write to disk

  if (argc == 3) {

    LOG(INFO) << "Write to " << argv[2];

    WriteProtoToBinaryFile(sum_blob, argv[2]);

  }

  const int channels = sum_blob.channels();

  const int dim = sum_blob.height() * sum_blob.width();

  std::vector<float> mean_values(channels, 0.0);

  LOG(INFO) << "Number of channels: " << channels;

  for (int c = 0; c < channels; ++c) {

    for (int i = 0; i < dim; ++i) {

      mean_values[c] += sum_blob.data(dim * c + i);

    }

    LOG(INFO) << "mean_value channel [" << c << "]:" << mean_values[c] / dim;

  }

  return 0;

}

【Caffe代码解析】compute_image_mean的更多相关文章

【Caffe代码解析】Layer网络层
Layer 功能: 是全部的网络层的基类,当中.定义了一些通用的接口,比方前馈.反馈.reshape,setup等. #ifndef CAFFE_LAYER_H_ #define CAFFE_LAYE ...
【Caffe代码解析】Blob
主要功能: Blob 是Caffe作为传输数据的媒介,不管是网络权重參数,还是输入数据,都是转化为Blob数据结构来存储,网络,求解器等都是直接与此结构打交道的. 其直观的能够把它看成一个有4纬的结构 ...
VBA常用代码解析
031 删除工作表中的空行如果需要删除工作表中所有的空行,可以使用下面的代码. Sub DelBlankRow() DimrRow As Long DimLRow As Long Dimi As L ...
[nRF51822] 12、基础实验代码解析大全 · 实验19 - PWM
一.PWM概述: PWM(Pulse Width Modulation):脉冲宽度调制技术,通过对一系列脉冲的宽度进行调制,来等效地获得所需要波形. PWM 的几个基本概念: 1) 占空比:占空比是指 ...
[nRF51822] 11、基础实验代码解析大全 · 实验16 - 内部FLASH读写
一.实验内容: 通过串口发送单个字符到NRF51822,NRF51822 接收到字符后将其写入到FLASH 的最后一页,之后将其读出并通过串口打印出数据. 二.nRF51822芯片内部flash知识 ...
[nRF51822] 10、基础实验代码解析大全 · 实验15 - RTC
一.实验内容: 配置NRF51822 的RTC0 的TICK 频率为8Hz,COMPARE0 匹配事件触发周期为3 秒,并使能了TICK 和COMPARE0 中断. TICK 中断中驱动指示灯D1 翻 ...
[nRF51822] 9、基础实验代码解析大全 · 实验12 - ADC
一.本实验ADC 配置分辨率:10 位. 输入通道:5,即使用输入通道AIN5 检测电位器的电压. ADC 基准电压:1.2V. 二.NRF51822 ADC 管脚分布 NRF51822 的ADC ...
java集合框架之java HashMap代码解析
java集合框架之java HashMap代码解析文章Java集合框架综述后,具体集合类的代码,首先以既熟悉又陌生的HashMap开始. 源自http://www.codeceo.com/arti ...
Kakfa揭秘 Day8 DirectKafkaStream代码解析
Kakfa揭秘 Day8 DirectKafkaStream代码解析今天让我们进入SparkStreaming,看一下其中重要的Kafka模块DirectStream的具体实现. 构造Stream ...

随机推荐

selenium - 常用页面操作
# 2.常用页面操作 # 访问某一个页面url = 'http://www.baidu.com'driver.get(url) # 获取页面的标题title = driver.titleprint(t ...
linux dd命令创建一定大小的文件
http://www.cnblogs.com/jikexianfeng/p/6103500.html
javascript学习笔记 - 引用类型单体内置对象
七单体内置对象 1.Global对象不属于任何对象的属性和方法,都归于它.全局作用域中定义的变量.函数,都属于Global对象 1.1 URI编码 encodeURI <＝>deco ...
筒子们，使用Protobuf优化你的协议
Protocol buffers是google提供的一种将结构化数据进行序列化和反序列化的方法,其优点是语言中立,平台中立,可扩展性好,目前在google内部大量用于数据存储,通讯协议等方面.PB在功 ...
ajax对象的获取及其常用属性
ajax对象的获取及其常用属性 (1)什么是ajax asynchronous javascript and xml(异步的javascript和xml). 是一种用来改善用户体验的技术,其实质是利用 ...
Github管理第一步：在Eclipse中导入既存Github Java Project
1.前提从官网下载的最新版本的Eclipse已经集成了Github插件,所以忽略了配置说明. 如果在下面的步骤中你找不到Git的设定目录,可能你的Eclipse中还没有Github,请自行解决. 2 ...
【前端学习笔记】2015-09-10~~~~ css层叠样式表~~格式
关于颜色的定义: 有几种方式:1.直接接英文单词 2.#16进制 3.rgb(100%:0%:0%)或者里面写像素,此处百分号不能省略. 加多个属性时,用“;”分开前面如果是定义标签的样式时, ...
【前端学习笔记】2015-09-06 ~~~~ setAttribute()、slice()
所遇记录: 1.setAttribute("属性",value),相同的还有addAttribute("属性名",value),getAttribute(“属性 ...
Zabbix实现短信报警设置（实战）
配置环境: zabbix 2.2.15 1.配置示警媒介类型此文件所在位置:/usr/lib/zabbix/alertscripts/ 必须拥有执行权限,并且改变所属用户和组要修改此脚本的路径,需 ...
C# 图像旋转代码
方法一: public static Bitmap rotateImage(Bitmap b, float angle) { //create a new empty bitmap to hold r ...

【Caffe代码解析】compute_image_mean

【Caffe代码解析】compute_image_mean的更多相关文章

随机推荐

热门专题