训练视觉相关的神经网络模型时，总是要用到图像的读写。方法有很多，比如matplotlib、cv2、PIL等。下面比较几种读写方式，旨在选出一个最快的方式，提升训练速度。

实验标准

　　因为训练使用的框架是Pytorch，因此读取的实验标准如下：

　　1、读取分辨率都为1920x1080的5张图片（png格式一张，jpg格式四张）并保存到数组。

　　2、将读取的数组转换为维度顺序为CxHxW的Pytorch张量，并保存到显存中（我使用GPU训练），其中三个通道的顺序为RGB。

　　3、记录各个方法在以上操作中所耗费的时间。因为png格式的图片大小差不多是质量有微小差异的jpg格式的10倍，所以数据集通常不会用png来保存，就不比较这两种格式的读取时间差异了。

　　写入的实验标准如下：

　　1、将5张1920x1080的5张图像对应的Pytorch张量转换为对应方法可使用的数据类型数组。

　　2、以jpg格式保存五张图片。

　　3、记录各个方法保存图片所耗费的时间。

实验情况

cv2

　　因为有GPU，所以cv2读取图片有两种方式：

　　1、先把图片都读取为一个numpy数组，再转换成保存在GPU中的pytorch张量。

　　2、初始化一个保存在GPU中的pytorch张量，然后将每张图直接复制进这个张量中。

　　第一种方式实验代码如下：

import os, torch

import cv2 as cv

import numpy as np

from time import time 

read_path = 'D:test'

write_path = 'D:test\\write\\'

# cv2读取 1

start_t = time()

imgs = np.zeros([5, 1080, 1920, 3])

for img, i in zip(os.listdir(read_path), range(5)):

  img = cv.imread(filename=os.path.join(read_path, img))

  imgs[i] = img

imgs = torch.tensor(imgs).to('cuda')[...,[2,1,0]].permute([0,3,1,2])/255

print('cv2 读取时间1：', time() - start_t)

# cv2保存

start_t = time()

imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()

for i in range(imgs.shape[0]):

  cv.imwrite(write_path + str(i) + '.jpg', imgs[i])

print('cv2 保存时间：', time() - start_t)

　　实验结果：

cv2 读取时间1： 0.39693760871887207

cv2 保存时间： 0.3560612201690674

　　第二种方式实验代码如下：

import os, torch

import cv2 as cv

import numpy as np

from time import time 

read_path = 'D:test'

write_path = 'D:test\\write\\'

# cv2读取 2

start_t = time()

imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')

for img, i in zip(os.listdir(read_path), range(5)):

  img = torch.tensor(cv.imread(filename=os.path.join(read_path, img)), device='cuda')

  imgs[i] = img

imgs = imgs[...,[2,1,0]].permute([0,3,1,2])/255

print('cv2 读取时间2：', time() - start_t)

# cv2保存

start_t = time()

imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()

for i in range(imgs.shape[0]):

  cv.imwrite(write_path + str(i) + '.jpg', imgs[i])

print('cv2 保存时间：', time() - start_t)

　　实验结果：

cv2 读取时间2： 0.23636841773986816

cv2 保存时间： 0.3066873550415039

matplotlib

　　同样两种读取方式，第一种代码如下：

import os, torch

import numpy as np

import matplotlib.pyplot as plt

from time import time 

read_path = 'D:test'

write_path = 'D:test\\write\\'

# matplotlib 读取 1

start_t = time()

imgs = np.zeros([5, 1080, 1920, 3])

for img, i in zip(os.listdir(read_path), range(5)):

  img = plt.imread(os.path.join(read_path, img))

  imgs[i] = img

imgs = torch.tensor(imgs).to('cuda').permute([0,3,1,2])/255

print('matplotlib 读取时间1：', time() - start_t)

# matplotlib 保存

start_t = time()

imgs = (imgs.permute([0,2,3,1])).cpu().numpy()

for i in range(imgs.shape[0]):

  plt.imsave(write_path + str(i) + '.jpg', imgs[i])

print('matplotlib 保存时间：', time() - start_t)

　　实验结果：

matplotlib 读取时间1： 0.45380306243896484

matplotlib 保存时间： 0.768944263458252

　　第二种方式实验代码：

import os, torch

import numpy as np

import matplotlib.pyplot as plt

from time import time 

read_path = 'D:test'

write_path = 'D:test\\write\\'

# matplotlib 读取 2

start_t = time()

imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')

for img, i in zip(os.listdir(read_path), range(5)):

  img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')

  imgs[i] = img

imgs = imgs.permute([0,3,1,2])/255

print('matplotlib 读取时间2：', time() - start_t)

# matplotlib 保存

start_t = time()

imgs = (imgs.permute([0,2,3,1])).cpu().numpy()

for i in range(imgs.shape[0]):

  plt.imsave(write_path + str(i) + '.jpg', imgs[i])

print('matplotlib 保存时间：', time() - start_t)

　　实验结果：

matplotlib 读取时间2： 0.2044532299041748

matplotlib 保存时间： 0.4737534523010254

　　需要注意的是，matplotlib读取png格式图片获取的数组的数值是在$[0, 1]$范围内的浮点数，而jpg格式图片却是在$[0, 255]$范围内的整数。所以如果数据集内图片格式不一致，要注意先转换为一致再读取，否则数据集的预处理就麻烦了。

PIL

　　PIL的读取与写入并不能直接使用pytorch张量或numpy数组，要先转换为Image类型，所以很麻烦，时间复杂度上肯定也是占下风的，就不实验了。

torchvision

　　torchvision提供了直接从pytorch张量保存图片的功能，和上面读取最快的matplotlib的方法结合，代码如下：

import os, torch

import matplotlib.pyplot as plt

from time import time

from torchvision import utils 

read_path = 'D:test'

write_path = 'D:test\\write\\'

# matplotlib 读取 2

start_t = time()

imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')

for img, i in zip(os.listdir(read_path), range(5)):

  img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')

  imgs[i] = img

imgs = imgs.permute([0,3,1,2])/255

print('matplotlib 读取时间2：', time() - start_t)

# torchvision 保存

start_t = time()

for i in range(imgs.shape[0]):

  utils.save_image(imgs[i], write_path + str(i) + '.jpg')

print('torchvision 保存时间：', time() - start_t)

　　实验结果：

matplotlib 读取时间2： 0.15358829498291016

torchvision 保存时间： 0.14760661125183105

　　可以看出这两个是最快的读写方法。另外，要让图片的读写尽量不影响训练进程，我们还可以让这两个过程与训练并行。

Python图像读写方法对比的更多相关文章

Object-c：两种文件读写的对比
一.读写方法对比:(主要针对本地读取本地文件) 方式\操作读写非URL方式 stringWithContentsOfFile writeToFile URL方式 stringWithConten ...
Python 3 读写文件的简单方法！
Python 3 读写文件的简单方法! a = open('test.txt','w') 这行代码创建了一个名为test的文本文档,模式是写入(模式分为三种,w代表写入,r代表阅读,a代表在尾行添加) ...
Python OpenCV 图像相识度对比
强大的openCV能做什么我就不啰嗦,你能想到的一切图像+视频处理. 这里,我们说说openCV的图像相似度对比, 嗯,说好听一点那叫图像识别,但严格讲, 图像识别是在一个图片中进行类聚处理,比如图片 ...
python——几种截图对比方式！
本次记录的几种截图对比方式,主要是为了在进行手机自动化测试时,通过截图对比来判断测试的正确性,方式如下: # -*- coding: utf- -*- ''' 用途:利用python实现多种方法来实现 ...
15.python文件(file)方法详解
文件的基本操作文件读写: 文件的读写满足以下3个步骤: 1).打开文件 2).操作数据(读.写) 3).关闭文件 --> 不要忘记 1).打开文件: python的open() 方法用于打开一 ...
python类及其方法
python类及其方法一.介绍在 Python 中,面向对象编程主要有两个主题,就是类和类实例类与实例:类与实例相互关联着:类是对象的定义,而实例是"真正的实物",它存放了类中 ...
NIO与普通IO文件读写性能对比
最近在熟悉java的nio功能.nio采用了缓冲区的方式进行文件的读写,这一点更接近于OS执行I/O的方式.写了个新旧I/O复制文件的代码,练练手,顺便验证一下两者读写性能的对比,nio是否真的比普通 ...
iPhone开发数据持久化总结（终结篇）—5种数据持久化方法对比
iPhone开发数据持久化总结(终结篇)—5种数据持久化方法对比 iphoneiPhoneIPhoneIPHONEIphone数据持久化对比总结本篇对IOS中常用的5种数据持久化方法进行简单 ...
python内置方法
1. 简介本指南归纳于我的几个月的博客,主题是魔法方法 . 什么是魔法方法呢?它们在面向对象的Python的处处皆是.它们是一些可以让你对类添加"魔法"的特殊方法. 它们经常是 ...

随机推荐

白话解析：一致性哈希算法 consistent hashing【转】
学习一致性哈希算法原理的时候看到博主朱双印的一片文章,看完就懂,大佬! 白话解析:一致性哈希算法 consistent hashing
Linux输入子系统转载
NQian 记录成长~ 首页新随笔联系订阅管理随笔 - 305 文章 - 0 评论 - 254 12.Linux之输入子系统分析(详解) 在此节之前,我们学的都是简单的字符驱动,涉及 ...
c++的一些习惯
1.显示转换:类型说明符(表达式),如a = int(z) 2.枚举类型enum:专门用来解决对数据的合法性检查问题,如一星期七天,如果用int/char等数据类型描述时,则需要对数据的合法性检查.声 ...
java流程控制学习
Java流程控制计算的步骤就是算法. 1.用户交互Scanner next()不能得到带有空格的字符串.[它是以空格为结束符]nextline()可以,[它是以回车为结束符] 2.顺序结构从上到下 ...
多测师讲解selenium _下拉框的定位_高级讲师肖sir
from selenium import webdriver from selenium.webdriver.support.ui import Select#导入类from time import ...
lftp源码安装时 error: Package requirements (gnutls >= 1.0.0) were not met: No package 'gnutls' found
lftp 使用疑惑与解决方法: 一,从官网下载源码后,解压./configure后,报错: error: Package requirements (gnutls >= 1.0.0) were ...
【纯水题】POJ 1852 Ants
题目大意有一根长$L$厘米米的水平木棍上有$n$个蚂蚁,它们以每秒1cm/s的爬(fei)行(ben)到木棍的一端,之后掉下去. 给出每个蚂蚁的起始位置,但是不知道它们爬行的方向.相向而行的 ...
CVE-2009-0927-Adobe Reader缓冲区溢出漏洞分析
0x00概述: 此漏洞的成因是由于Adobe Reader在处理PDF文档中所包含的JavaScript脚本时的Collab对象的getlcon()方式不正确处理输入的参数,而产生的缓冲区溢出,成功利 ...
linux(centos8):禁用selinux(临时关闭/永久关闭)
一,selinux的用途 1,什么是selinux SELinux:即安全增强型 Linux(Security-Enhanced Linux) 它是一个 Linux 内核模块,也是 Linux 的一个 ...
phpstorm配置sftp自动上传
勾选自动上传手动上传 qq_23049573 原创文章 14获赞 4访问量 2万+ 关注私信

Python图像读写方法对比

实验标准

实验情况

cv2

matplotlib

PIL

torchvision

Python图像读写方法对比的更多相关文章

随机推荐

热门专题