将自己数据转化为cifar10支持的lmdb
首先,看一下cafferoot/data/cifar10(cafferoot指的是自己caffe安装的根目录)下面的get_cifar10.sh
可见其下载的是bin格式的图片,然后通过cafferoot/examples/cifar10/create_cifar10.sh将bin文件转化为lmdb格式。
那么这样的问题来了,由于,cifar10由官网提供了2进制的bin文件,如果我们想训练自己的模型呢?如果我们想加进自己的图片呢。所以,一个保持和官网cifar10同步的将传统的jpg、png等格式转为bin格式的程序应用而生。
进入正题
1,cifar10的bin数据格式
image 的大小为32*32,flag为0-9,共10类,使用的是cifar-10数据集
二进制数据格式为flag,R(1024),G(1024),B(1024),每个通道按行排列
2,读取cifar10的bin文件,将bin文件中数据转化为图片并显示
- void read_cifar_bin(string file_address,vector<Mat>& image,vector<int>& flag)
- {
- int width = 32, height = 32;//注意这个数值,根据自己样本的大小进行修改,重要的事情说三遍
- ifstream fin(file_address, ios::binary);
- while (!fin.eof())
- {
- char flag_tmp;
- unsigned char tmp;
- Mat image_tmp(width, height, CV_8UC3);
- fin.read((char *)&flag_tmp, sizeof(flag_tmp));
- for (int j = 2; j >=0; j--)
- {
- for (int r = 0; r < image_tmp.rows; r++)
- for (int c = 0; c < image_tmp.cols; c++)
- {
- fin.read((char *)&tmp, sizeof(tmp));
- image_tmp.at<Vec3b>(r, c)[j] = tmp;
- }
- }
- image.push_back(image_tmp);
- flag.push_back(flag_tmp);
- }
- }
3,将自己的jpg,png等传统格式转化为cifar10支持的bin文件
- void write_cifar_bin(string file_address, vector<string>& image_address, vector<int>& flag)
- {
- ofstream fout(file_address, ios::binary);
- for (size_t i = 0; i < image_address.size(); i++)
- {
- Mat image_tmp = imread(image_address[i], 1);
- resize(image_tmp, image_tmp, Size(32, 32));
- int pix[1024];
- char flag_tmp = flag[i];
- fout.write((char *)&flag_tmp, sizeof(flag_tmp));
- for (int j = 2; j >= 0; j--)
- {
- for (int r = 0; r < image_tmp.rows; r++)
- for (int c = 0; c < image_tmp.cols; c++)
- {
- unsigned char tmp = image_tmp.at<Vec3b>(r, c)[j];
- fout.write((char *)&tmp, sizeof(tmp));
- }
- }
- }
- }
- int main()
- {
- string file_address = "data_batch_1.bin";
- vector<Mat> image;
- vector<int>flag;
- read_cifar_bin(file_address, image, flag);
- imshow("test", image[5000]);//随便需要显示的图像。可以跟改[]中数据进行验证
- waitKey();
- return 0;
- }
5,将bin转为图片的测试,并保存为jpg,并且保存相应的flag
- int main()
- {
- string file_address = "data_batch_1.bin";
- vector<Mat> image;
- vector<int>flag;
- read_cifar_bin(file_address, image, flag);
- ofstream mydata_batch_1("mydata_batch_1.txt");
- for (int i = 0; i < image.size(); i++)
- {
- char buffer[50];
- char address[100] = ".\\data_batch_1\\";
- _itoa(i, buffer, 10);
- imwrite(strcat(address, strcat(buffer, ".jpg")), image[i]);
- mydata_batch_1 << address << buffer <<".jpg"<< " " << flag[i] << endl;
- cout << i << endl;
- waitKey(1);
- }
- return 0;
- }
6,将图像转为bin
- int main()
- {
- string file_address = "mydata_batch_1.bin";
- vector<string> image_address;
- vector<int> flag;
- ifstream finSample("mydata_batch_1.txt");
- char buf[100], buftmp[50], flagtmp[10];
- while (!finSample.eof())
- {
- finSample.getline(buf, sizeof(buf));
- sscanf(buf, "%s %s", buftmp, flagtmp);
- int tmp=atoi(flagtmp);
- image_address.push_back(buftmp);
- flag.push_back(tmp);
- }
- write_cifar_bin(file_address, image_address, flag);
- return 0;
- }
7,实验测试
(1)【步骤4】将cifar10的data_batch_1.bin转化为图像的测试,从左到右依次为image[0],image[5000],image[9999](cifar10每个batch有10000个图像,所以是0-9999)
(2) 【步骤5】将cifar10的data_batch_1.bin转化为图像,并保存在jpg格式的测试。
(3)【步骤6】将第二步生成的jpg转化为bin文件, 程序运行后将生成mydata_batch_1.bin,可以看到和原始的data_batch_1.bin有着同样的大小。
那么到底这个和原始的一样不一样呢?我们还是使用步骤4的程序进行测试,同样的还是测试image[0],image[5000],image[9999],从下图可以看出和原始的bin的数据是一样的。
有了上面的2个转化程序,就可以转化自己的图像了,then let's make some noise!
将自己数据转化为cifar10支持的lmdb的更多相关文章
- C# Json数据反序列化为Dictionary并根据关键字获取指定值1
Json数据: { "dataSet": { "header": { "returnCode": "0", " ...
- C# Json数据反序列化为Dictionary并根据关键字获取指定值
Json数据: { "dataSet": { "header": { "returnCode": "0", " ...
- 将Dictionary序列化为json数据 、json数据反序列化为Dictionary
需要引用System.Web.Extensions dll类库 /// <summary> /// 将json数据反序列化为Dictionary /// </summary> ...
- Excel数据转化为sql脚本
在实际项目开发中,有时会遇到客户让我们把大量Excel数据导入数据库的情况.这时我们就可以通过将Excel数据转化为sql脚本来批量导入数据库. 1 在数据前插入一列单元格,用来拼写sql语句. 具体 ...
- C#:Json数据反序列化为Dictionary并根据关键字获取指定的值
转自曾是土木人原文 C#:Json数据反序列化为Dictionary并根据关键字获取指定的值 Json数据: { "dataSet": { "header": ...
- [转]Excel数据转化为sql脚本
在实际项目开发中,有时会遇到客户让我们把大量Excel数据导入数据库的情况.这时我们就可以通过将Excel数据转化为sql脚本来批量导入数据库. 1 在数据前插入一列单元格,用来拼写sql语句. 具体 ...
- 记一次深刻的教训-----将mat数据转化为SequenceFile
深刻的体会就是,“java.lang.NullPointer.Exception”就是空指针异常可能是由于数组部分元素未被初始化引起的. 1)使用jmatio将mat数据转化为SequenceFile ...
- 把数据转化为JSON格式用ajax进行前后端交互
接着在https://www.cnblogs.com/dong973711/p/10907733.html的基础上做验证. 从前端提交数据 前端页面,submit.html <!DOCTYPE ...
- MySQL随机获取数据的方法,支持大数据量
最近做项目,需要做一个从mysql数据库中随机取几条数据出来. 总所周知,order by rand 会死人的..因为本人对大数据量方面的只是了解的很少,无解,去找百度老师..搜索结果千篇一律.特发到 ...
随机推荐
- fiddler与Charles的区别
一.Fiddle2(v2.4.2.6,windows) fiddler除了常规的替换http请求.模拟慢网速外,还有一些日常开发里能用到的特殊功能. 1. http代理服务器 fiddler启动的时候 ...
- grunt使用
grunt例子:https://github.com/Aquarius1993/gruntDemo 1.前提是已经有npm(可以通过安装nodejs实现) 2. npm update -g npm 更 ...
- 2017《Java技术》预备作业01
2017<Java技术>预备作业 1.学习使用MarkDown 本学期的随笔都将使用MarkDown格式,要求熟练掌握MarkDown语法,学会如何使用标题,插入超链接,列表,插入图片,插 ...
- MySQL 实用技巧
概述: MySQL有许多实用的技巧,利用这些技巧能提高工作的效率,减少一些不必要的麻烦.以下是几个我在MySQL日常维护从常用的技巧. 一.prompt 命令 功能:设置mysql客户端提示符 说明: ...
- Codeforces 382E Ksenia and Combinatorics 【组合计数】*
Codeforces 382E Ksenia and Combinatorics Ksenia has her winter exams. Today she is learning combinat ...
- UITableView 滚动流程性优化
影响 UITableView 滚动的流畅性的原因 1. 在代理方法中做了过多的计算占用了 UI 线程的时间 2.同上 3.Cell 中 view 的组织复杂 关于第一点,首先要明白 tablevi ...
- 重温CLR(十二) 委托
回调函数是一种非常有用的编程机制,它的存在已经有很多年了..NET通过委托来提供回调函数机制.不同于其他平台(比如非托管C++)的回调机制,委托的功能要多得多.例如,委托确保回调方法是类型安全的(这是 ...
- {Notes}{LaTeX}{enumerate}
\usepackage{enumerate} \begin{enumerate}{(1)} \setcounter{enumi}{2} % begin with 2 \item first \item ...
- Sprint第一个冲刺(第十天)
一.Sprint介绍 更新工程部署文件:实现了云端登录:设计经营情况以及数据分析界面. 实验截图: 任务进度: 二.Sprint周期 看板: 燃尽图:
- python 之 list,tuple,dict,set
基本类型, 其中set好像提到的很少 list : [] 根据字面, 是一个列表, 所以有序, 可以通过序号方位 tuple: () 是不变的list, 通过序号访问 dict: {}, 字 ...