TensorFlow 图像预处理（一）图像编解码，图像尺寸调整

from: https://blog.csdn.net/chaipp0607/article/details/73029923

TensorFlow提供了几类图像处理函数，下面介绍图像的编码与解码，图像尺寸调整。

编码与解码

图像解码与编码：一张RGB三通道的彩色图像可以看成一个三维矩阵，矩阵中的不位置上的数字代表图像的像素值。然后图像在存储时并不是直接记录这些矩阵中的数字，而是经过了压缩编码。所以将一张图像还原成一个三维矩阵的过程就是解码的过程，反之就是编码了。其实如果大家熟悉opencv的话，imread和imwrite就是一个解码和编码的过程。
TensorFlow提供了常用图片格式的解码和编码操作，下面用一个jpg的图像演示：

import matplotlib.pyplot as plt

import tensorflow as tf

image_raw_data = tf.gfile.FastGFile('.//image//1.jpg','rb').read()

with tf.Session() as sess:

     img_data = tf.image.decode_jpeg(image_raw_data)

     print(img_data.eval())

     plt.imshow(img_data.eval())

     plt.show()

     #img_data = tf.image.convert_image_dtype(img_data,dtype = tf.float32)

     encoded_image = tf.image.encode_jpeg(img_data)

     with tf.gfile.GFile(".//image//3.jpg","wb") as f:

          f.write(encoded_image.eval())

其中：
decode_jpeg函数为jpeg（jpg）图片解码的过程，对应的encode_jpeg函数为编码过程，编码后将图片重命名写入到指定的路径下。

图像尺寸调整
图像尺寸调整属于基础的图像几何变换，TensorFlow提供了几种尺寸调整的函数：
tf.image.resize_images：将原始图像缩放成指定的图像大小，其中的参数method（默认值为ResizeMethod.BILINEAR）提供了四种插值算法，具体解释可以参考图像几何变换（缩放、旋转）中的常用的插值算法
tf.image.resize_image_with_crop_or_pad：剪裁或填充处理，会根据原图像的尺寸和指定的目标图像的尺寸选择剪裁还是填充，如果原图像尺寸大于目标图像尺寸，则在中心位置剪裁，反之则用黑色像素填充。
tf.image.central_crop：比例调整，central_fraction决定了要指定的比例，取值范围为(0，1]，该函数会以中心点作为基准，选择整幅图中的指定比例的图像作为新的图像。

import matplotlib.pyplot as plt

import tensorflow as tf

import numpy as np

image_raw_data = tf.gfile.FastGFile('.//image//1.jpg','rb').read()

with tf.Session() as sess:

     img_data = tf.image.decode_jpeg(image_raw_data)

     plt.imshow(img_data.eval())

     plt.show()

     resized = tf.image.resize_images(img_data, [100, 100], method=0)

     # TensorFlow的函数处理图片后存储的数据是float32格式的，需要转换成uint8才能正确打印图片。

     print("Digital type: ", resized.dtype)

     resized = np.asarray(resized.eval(), dtype='uint8')

     # tf.image.convert_image_dtype(rgb_image, tf.float32)

     plt.imshow(resized)

     plt.show()

     croped = tf.image.resize_image_with_crop_or_pad(img_data, 100, 100)

     padded = tf.image.resize_image_with_crop_or_pad(img_data, 500, 500)

     plt.imshow(croped.eval())

     plt.show()

     plt.imshow(padded.eval())

     plt.show()

     central_cropped = tf.image.central_crop(img_data, 0.5)

     plt.imshow(central_cropped.eval())

     plt.show()

原图：

resize_images(img_data, [100, 100], method=0)：

resize_image_with_crop_or_pad(img_data, 100, 100)：

resize_image_with_crop_or_pad(img_data, 500, 500)：

central_crop(img_data, 0.5)：

另外可以看 http://www.360doc.com/content/17/0513/14/10408243_653519828.shtml

tensorflow里面提供了实现图像进行裁剪和填充的函数，就是tf.image.resize_image_with_crop_or_pad（img，height，width ）。img表示需要改变的图像，height是改变后图像的高度，width是宽度。

例如：

import matplotlib.pyplot as plt;
import tensorflow as tf;
image_raw_data_jpg = tf.gfile.FastGFile('11.jpg', 'r').read()
with tf.Session() as sess:
img_data_jpg = tf.image.decode_jpeg(image_raw_data_jpg)
img_data_jpg = tf.image.convert_image_dtype(img_data_jpg, dtype=tf.float32)
crop = tf.image.resize_image_with_crop_or_pad(img_data_jpg, 500, 500)
pad = tf.image.resize_image_with_crop_or_pad(img_data_jpg, 2000, 2000)
plt.figure(1)
plt.imshow(crop.eval())
plt.figure(2)
plt.imshow(pad.eval())
plt.show()

结果：

TensorFlow 图像预处理（一）图像编解码，图像尺寸调整的更多相关文章

音视频编解码问题：javaCV如何快速进行音频预处理和解复用编解码（基于javaCV-FFMPEG）
前言: 前面我用了很多章实现了javaCV的基本操作,包括:音视频捕捉(摄像头视频捕捉和话筒音频捕捉),推流(本地音视频或者摄像头话筒混合推流到服务器),转流(rtsp->rtmp),收流(录制 ...
h.264参考图像列表、解码图像缓存
1.参考图像列表(reference picture list) 一般来说,h.264会把需要编码的图像分为三种类型:I.P.B,其中的B.P类型的图像由于采用了帧间编码的这种编码方式,而帧间编码又是 ...
『TensorFlow』第九弹_图像预处理_不爱红妆爱武装
部分代码单独测试: 这里实践了图像大小调整的代码,值得注意的是格式问题: 输入输出图像时一定要使用uint8编码, 但是数据处理过程中TF会自动把编码方式调整为float32,所以输入时没问题,输出时 ...
TensorFlow图像预处理完整样例
参考书 <TensorFlow:实战Google深度学习框架>(第2版) 以下TensorFlow程序完成了从图像片段截取,到图像大小调整再到图像翻转及色彩调整的整个图像预处理过程. #! ...
几个平台环境里视频编解码和图像scale的硬件加速的方法
记录一下遇到几个平台里的视频编解码和图像scale的硬件加速的方法 1,intel平台当包含GEN系列的集成GPU时,可用libva实现视频codec.颜色空间转换和图像scale的硬件加速,具体可使 ...
玩node-images模块---Node.js轻量级跨平台图像编解码库
Node.js轻量级跨平台图像编解码库 github:https://github.com/zhangyuanwei/node-images Features 功能特性轻量级:无需安装任何图像处理库 ...
基于3U PXIe的ZU7EV图像编解码设计方案
1.板卡简介基于3U PXIe的ZU7EV图像编码卡用于加固设备的图像接入,编解码采集存储.用于机载.舰载.车载等工作场景,支持工业级温度工作.(此方案是由北京太速设计的,已应用到实际领域) 2.主 ...
TensorFlow图像预处理-函数
更多的基本的API请参看TensorFlow中文社区:http://www.tensorfly.cn/tfdoc/api_docs/python/array_ops.html 下面是实验的代码,可以参 ...
图像预处理第9步：存为.bmp文件
//图像预处理第9步:将最终标准化后的字符图像分为单个单个的HDIB保存,并存为.bmp文件 void CChildView::OnImgprcToDibAndSave() { unsigned ch ...

随机推荐

转 Windows串口过滤驱动程序的开发
在Windows系统上与安全软件相关的驱动开发过程中,“过滤(filter)”是极其重要的一个概念.过滤是在不影响上层和下层接口的情况下,在Windows系统内核中加入新的层,从而不需要修改上层的软件 ...
session转载
sessionid是一个会话的key,浏览器第一次访问服务器会在服务器端生成一个session,有一个sessionid和它对应.tomcat生成的sessionid叫做jsessionid. ses ...
sql语句 MySQL
1.操作数据库 (1)创建数据库 CREATE DATABASE [IF NOT EXISTS] db_name [create_specification [, create_specifica ...
iOS开发 ----- 加载动画之牛顿摆的实现
牛顿摆动画自己看动画有一段时间了,但是还是不是很能理解其中的一些属性方法之类的东西,琢磨了一下午写了一个牛顿摆的动画,这里记录一下,一遍以后查看先上图先说下思路说下牛顿摆的大致运动过程根据牛顿 ...
NMM3DViewer 设计
在FrameworkInterfaces工程的INMM3DServer.cs中定义了岩石材料结构 BlockMaterial -----> StrBLOCKProperty publ ...
elasticsearch 查询模板
简单版示例: 2.x版本(相比于1.x版本,使用bool替代filtered,使用must替代query) { "query": { "bool": { &qu ...
很多shell命令后面的单横杠和双横杠，原来这个意思
原文: https://blog.csdn.net/deyili/article/details/5471023 ------------------------------------------- ...
iOS 推送获取手机设备的 deviceToken
第一步:申请证书: 第二步:申请app ids,应用名字必须一致.然后再进入进行编辑.使其enable,绿灯. 第三步:申请provisioning profile,生成.mobileprovisio ...
C#报错"线程间操作无效: 从不是创建控件“XXX”的线程访问它"--解决示例
C# Winform程序中,使用线程对界面进行更新需要特殊处理,否则会出现异常“线程间操作无效: 从不是创建控件“taskView”的线程访问它.” 在网文“http://www.cnblogs.co ...
[ssh新闻公布系统三]存储新闻
一.存储新闻dao方法在NewsDao.java中新增存储新闻的saveOrupdate方法 public void saveOrupdate(News news){ getSession().sa ...

TensorFlow 图像预处理（一） 图像编解码，图像尺寸调整

TensorFlow 图像预处理（一） 图像编解码，图像尺寸调整的更多相关文章

随机推荐

热门专题

TensorFlow 图像预处理（一）图像编解码，图像尺寸调整

TensorFlow 图像预处理（一）图像编解码，图像尺寸调整的更多相关文章