OFRecord 图片文件制数据集

在 OFRecord 数据格式和加载与准备 OFRecord 数据集中，分别学习了 OFRecord 数据格式，以及如何将其它数据集转为 OFRecord 数据集并使用。

本文介绍如何将图片文件制作为 OFRecord 数据集，并提供了相关的制作脚本，方便用户直接使用或者在此基础上修改。内容包括：

制作基于 MNIST 手写数字数据集的 OFRecord 数据集
OFRecord 的编解码方式
在自制的 OFRecord 数据集上进行训练

用图片文件制作 OFRecord 文件

使用 MNIST 数据集中的图片文件来制作一个 OFRecord 格式文件。

作为示例，仅使用了50张图片，相关脚本和数据集的下载地址为 img2ofrecord

下载相关压缩包并解压

$ wget https://oneflow-static.oss-cn-beijing.aliyuncs.com/oneflow-tutorial-attachments/img2ofrecord.zip

$ unzip img2ofrecord.zip

进入到对应目录，并运行 OFRecord 制作脚本 img2ofrecord.py

$ cd ./img_to_ofrecord

$ python img2ofrecord.py --part_num=5 --save_dir=./dataset/ --img_format=.png --image_root=./images/train_set/

脚本运行过程中，将输出以下内容

The image root is: ./images/train_set/

The amount of OFRecord data part is: 5

The directory of Labels is: ./images/train_label/label.txt

The image format is: .png

The OFRecord save directory is: ./dataset/

Start Processing......

./images/train_set/00000030_3.png feature saved

./images/train_set/00000034_0.png feature saved

./images/train_set/00000026_4.png feature saved

./images/train_set/00000043_9.png feature saved

......

Process image successfully !!!

至此 OFRecord 文件制作完毕，并保存在 ./dataset 目录下

代码解读

整个代码目录构造如下

img_to_ofrecord

├── images

├── train_set

├── 00000000_5.png

├── 00000001_0.png

├── 00000002_4.png

......

├── train_label

├── label.txt

├── img2ofrecord.py

├── lenet_train.py

images 目录存放原始示例训练数据集以及标签文件

的标签文件是以 json 格式存储的，格式如下：

{"00000030_3.png": 3}

{"00000034_0.png": 0}

{"00000026_4.png": 4}

{"00000043_9.png": 9}

{"00000047_5.png": 5}

{"00000003_1.png": 1}

......

img2ofrecord.py 脚本将 MNIST 图片转换成 OFRecord 数据集
lenet_train.py 脚本则读取制作好的 OFRecord 数据集，并使用 LeNet 模型进行训练。

img2ofrecord.py 的命令行选项如下：

image_root 指定图片的根目录路径
part_num 指定生成 OFRecord 文件个数，如果该数目大于总图片数目，会报错
label_dir 指定标签的目录路径
img_format 指定图片的格式
save_dir 指定 OFRecord 文件保存的目录

脚本的编码流程

与 OFRecord 文件编码的相关逻辑也在 img2ofrecord.py 内，其编码流程如下：

首先，对读取进来的图片数据进行编码

def encode_img_file(filename, ext=".jpg"):

img = cv2.imread(filename)

encoded_data = cv2.imencode(ext, img)[1]

return encoded_data.tostring()

这里的 ext 是图片编码格式，目前，OneFlow 图片编解码支持的格式与 OpenCV 的一致，可参见 cv::ImwriteFlags，包括：

JPEG，一种最常见的有损编码格式，可参考 JPEG
PNG，一种常见的无损位图编码格式，可参考 Portable Network Graphics
TIFF，一种可扩展的压缩编码格式，可参考 Tagged Image File Format

然后，转化成 Feature 的形式，进行序列化，并将数据长度写入到文件中

def ndarray2ofrecords(dsfile, dataname, encoded_data, labelname, encoded_label):

topack = {dataname: bytes_feature(encoded_data),

labelname: int32_feature(encoded_label)}

ofrecord_features = ofrecord.OFRecord(feature=topack)

serilizedBytes = ofrecord_features.SerializeToString()

length = ofrecord_features.ByteSize()

dsfile.write(struct.pack("q", length))

dsfile.write(serilizedBytes)

使用自制的 OFRecord 数据集进行训练

运行目录下的 lenet_train.py，它将读取刚制作好的 OFRecord 数据集，在 Lenet 模型上进行训练

该训练脚本输出如下：

[6.778578]

[2.0212684]

[1.3814741]

[0.47514156]

[0.13277876]

[0.16388433]

[0.03788032]

[0.01225162]

......

至此，成功完成了数据集制作、读取与训练整个流程。

OFRecord 图片文件制数据集的更多相关文章

JavaScript根据文件名后缀判断是否图片文件
//JavaScript根据文件名后缀判断是否图片文件 //图片文件的后缀名 var imgExt = new Array(".png",".jpg",&quo ...
【荐】PHP操作MongoDB GridFS 存储文件，如图片文件
GridFS是MongoDB的一个内置功能,它提供一组文件操作的API以利用MongoDB存储文件,GridFS的基本原理是将文件保存在两个Collection中,一个保存文件索引,一个保存文件内容, ...
FileReader：读取本地图片文件并显示
最近忙得比狗还惨,导致长时间没能更新文章,真心对不住啊.抽空整理了下关于在页面上读取和显示本地图片的实例文章,本文通过实例讲解如何使用支持FileReader浏览器的用户将能够通过一个file inp ...
springmvc图片文件上传接口
springmvc图片文件上传用MultipartFile文件方式传输 Controller package com.controller; import java.awt.image.Buffer ...
C#对图片文件的压缩、裁剪操作初探
在做项目时,对图片的处理,以前都采用在上传时,限制其大小的方式,这样带来诸多不便.毕竟网站运维人员不一定会对图片做处理,经常超出大小限制,即使会使用图片处理软件的,也由于个人水平方面原因,处理效果差强 ...
Qt 怎么添加图片文件？
1.新建一个.qrc的文件 2.起个.qrc的文件名 3.完成后,添加图片文件 4.如图就好了.
C#对图片文件的压缩、裁剪操作
在做项目时,对图片的处理,以前都采用在上传时,限制其大小的方式,这样带来诸多不便.毕竟网站运维人员不一定会对图片做处理,经常超出大小限制,即使会使用图片处理软件的,也由于个人水平方面原因,处理效果差强 ...
[深入浅出WP8.1(Runtime)]生成图片和存储生成的图片文件
7.2.3 使用RenderTargetBitmap类生成图片 RenderTargetBitmap类可以将可视化对象转换为位图,也就是说它可以将任意的UIElement以位图的形式呈现.那么我们在实 ...
将gridFS中的图片文件写入硬盘
开启用户验证下的gridfs 连接使用,在执行脚本前可以在python shell中 from pymongo import Connectionfrom gridfs import *con = C ...

随机推荐

【beego】beego的路由设置
beego 存在三种方式的路由:固定路由.正则路由.自动路由基础路由从 beego 1.2 版本开始支持了基本的 RESTful 函数式路由,应用中的大多数路由都会定义在 routers/rout ...
Windows 10 系统进入测试模式命令
首先需要开启测试模式,内容如下: @bcdedit -set loadoptions DDISABLE_INTEGRITY_CHECKS @bcdedit -set TESTSIGNING ON 取消 ...
将一个eclipse的SSM项目用IDEA打开并运行
项目部署将一个eclipse项目用idea打开,并且部署到tomcat中 .或者你tomcat部署成功,但是启动就是404,下面的步骤就要更认真看了项目配置打开idea,Import Proj ...
Govern EventBus - 历经多年生产环境验证的事件驱动架构框架
Govern EventBus Govern EventBus 是一个历经四年生产环境验证的事件驱动架构框架, 通过事件总线机制来治理微服务间的远程过程调用. 使用本地事务来支持微服务内强一致性,事件 ...
Docker 部署net5程序
1.前言本文讲述使用docker容器部署.net5项目.实现跨平台. 部署环境:docker 容器.liunx系统.这里采用VmWare虚拟机.并采用MobaXterm工具实现终端连接linux系统 ...
Java 进行时间处理
Java 进行时间处理一.Calendar (1).Calender介绍 Calendar的中文翻译是日历,实际上,在历史上有着许多种计时的方法.所以为了计时的统一,必需指定一个日历的选择.那现在最 ...
Codeforces Round #687 (Div. 2, based on Technocup 2021 Elimination Round 2)
A. Prison Break 题意:就是在一个n*m的矩阵中,以(1,1)为起点(n,m)为终点,每个点以每个单位1s的速度移动,问总共至少需要多少秒,所有的矩阵点就能够全部移动到(r,c)中思路 ...
判断标准I/O的缓冲区类型
#include <stdio.h> void pr_stdio(const char *, FILE *); int main() { FILE *fp; fputs("ent ...
[Qt] 事件机制（三）
在主窗口Widget中增加几个小功能 1.点击左键,在左上角label中显示"haha",点击右键,显示"lala" 在widget.h中添加: 1 #incl ...
微信收藏了很多语音，有一些比较有意义的，但是发现只能收藏在微信，没有办法导出了，请大神看清楚，是微信【收藏】的语音，ios或者安卓的方法都可以

OFRecord 图片文件制数据集

OFRecord 图片文件制数据集的更多相关文章

随机推荐

热门专题