cv2, pil.image, plt.image 读图的差异

人是习惯性动物，当我们第一次用opencv时，肯定会觉得opencv的imread()方式很奇怪，做图像出来天天说图像是RGB图RGB图，可opencv读出来的图，却是BGR的顺序。是不是很奇怪，还不止这一点，opencv读进来的图，你在使用shape函数时，返回的是h,w,c，也就是height是第一个维度，然后是宽度，最后是通道数，就是彩色图是RGB三通道。但是我们在使用的时候，第一个维度又是width的，第二个维度是height。然后利用opencv进行保存和show的时候，也一定要保证是BGR通道的顺序，否则保存和显示出来的图是不对的。

可以跑一下以下代码试试。

import cv2

cv2_img=cv2.imread('./demo.jpg')

print(type(cv2_img) )

print(cv2_img.shape)# h,w,c

print(cv2_img[0,0,:]) # print左上角位置的像素值，一定要看清楚三个通道的值

cv2.imwrite('./test_cv2.jpg', cv2_img)

cv2_img_ch = cv2_img[:, :, ::-1] # 更改为RGB通道

print(cv2_img_ch[0,0,:])

cv2.imwrite('./test_cv2_ch.jpg', cv2_img_ch) # 看一下保存的图像是不是和原图一样？

正是因为这些原因，深度学习的处理图像时会存在是使用BGR还是使用RGB的图这个问题。还有一个另外的原因，那就是早起的深度学习平台caffe是基于opencv来读图的，读图顺序是BGR。

当然有人不喜欢opencv这种读图模式，那就换一种方式，比如最近发现在AGI领域，大家更倾向于用PIL库，用这个库来读图，更符合大家平常习惯的RGB模式，但是这个库也有问题，你如果想像opencv读进来的图像那样用，还要借助numpy进行转一下，因为本身这个函数读进来的并不是一个图向量，可以理解为一个索引。

from PIL import Image

import numpy as np

pil_img=Image.open('./demo.jpg').convert('RGB')

#关于此处convert('RGB')的使用，如果不使用.convert('RGB')进行转换,读出来的图像是RGBA四通道的,A通道为透明，通过convert('RGB')转成只有RGB三通道的数据。可以不加convert('RGB')打印出来看看。

print(type(pil_img) )

print(pil_img.size)# w,h 没有c

print(np.array(pil_img).shape)# h,w,c 但是c是RGB通道的，这里通过np.array转成可以读写的数据结构，原来读进来的是无法直接print打开的

print(pil_img[0,0,:]) # print左上角位置的像素值，一定要看清楚三个通道的值

#保存图

pil_img.save('./pil_img.jpg')

目前在diffusers的库中，有个load_image，也就是基于PIL.Image来实现的。

Parameters:

a array_like

Input array.

axes tuple or list of ints, optional

If specified, it must be a tuple or list which contains a permutation of [0, 1, …, N-1] where N is the number of axes of a. Negative indices can also be used to specify axes. The i-th axis of the returned array will correspond to the axis numbered axes[i] of the input. If not specified, defaults to range(a.ndim)[::-1], which reverses the order of the axes.

但是我们在做深度学习，通常是基于torch工作时，常常会碰到transpose和permute()这两个函数，这两个和numpy中的tranpose用途是基本一致的。但是torch.transpose只能对两个维度进行交换，而permute可以对多个维度进行交换。比如上面的实验，我们可以这么做。

import cv2

import torch

cv2_img=cv2.imread('./demo.jpg')

print(type(cv2_img) )

print(cv2_img.shape)# h,w,c

print(cv2_img[0,0,:]) # print左上角位置的像素值，一定要看清楚三个通道的值

cv2.imwrite('./test.jpg', cv2_img)

cv2_img_ch = cv2_img[:, :, ::-1] # 更改为RGB通道

print(cv2_img_ch[0,0,:])

cv2.imwrite('./test_ch.jpg', cv2_img_ch) # 看一下保存的图像是不是和原图一样？

t_cv2_img=cv2_img.transpose(2,0,1)

print(cv2_img.shape)# c,h,w

tt_cv2_img=torch.from_numpy(cv2_img).permute(2,0,1)

print(tt_cv2_img.shape)# c,h,w

tt_cv2_img=torch.from_numpy(cv2_img).transpose(2,0,1) # 此处会提示出错，torch的transpose只能交换两个维度

也就是说，如果是numpy的维度交换，可以随意用transpose()实现。但是如果你操作的对象是torch.tensor这种数据结构,尽量用permute()函数，用法其实和numpy的transpose()基本上完全一样。

cv2, pil.image, plt.image 读图的差异的更多相关文章

pickel加速caffe读图
64*64*3小图(12KB),batchSize=128,训练样本100万, 全部load进来内存受不了,load一次需要大半天训练时读入一个batch,ali云服务器上每个batch读入时间1. ...
matlab读图函数
最基本的读图函数:imread imread函数的语法并不难,I=imread('D:\fyc-00_1-005.png');其中括号内写图片所在的完整路径(注意路径要用单引号括起来).I代表这个图片 ...
LM_ReadImgMode.js PC单页轮播读图模式组件，零依赖！
LM_ReadImgMode.js PC单页轮播读图模式组件,零依赖! github:http://dtdxrk.github.io/LM-ReadImgMode/ TXT 1.全新的2.0版本,脱离 ...
扩增子图表解读5火山图：差异OTU的数量及变化规律
火山图 Volcano plot 在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化.由于它的形成像火山喷发的样子,所以被称为火山图.和上文讲的曼哈顿图类似. 火山图基本元素火山 ...
机器学习进阶-图像基本处理-视频的读取与处理 1.cv2.VideoCapture(视频的载入) 2.vc.isOpened(载入的视频是否可以打开) 3.vc.read(视频中一张图片的读取) 4.cv2.cvtColor(将图片转换为灰度图)
1.vc = cv2.VideoCapture('test.mp4') #进行视频的载入 2.vc.isOpened() # 判断载入的视频是否可以打开 3.ret, frame = vc.read( ...
【Python开发】python PIL读取图像转换为灰度图及另存为其它格式（也可批量改格式）
例如有一幅图,文件名为"a.jpg'. 读取: from PIL import Image #或直接import Image im = Image.open('a.jpg') 将图片转换成 ...
cv2 & PIL(pillow)显示图像
= OpenCV和PIL中显示图像方式不一样,且支持的格式也不同 = cv在显示图像时是自定义的显示窗口,而PIL中显示是调用操作系统中的默认打开程序如: import cv2 im = cv2.i ...
plt.figure()的使用,plt.plot(),plt.subplot(),plt.subplots()和图中图
参考:https://blog.csdn.net/m0_37362454/article/details/81511427 matplotlib官方文档:https://matplotlib.org/ ...
4.3Python数据处理篇之Matplotlib系列(三)---plt.plot()折线图
目录前言 (一)plt.plot()函数的本质 ==1.说明== ==2.源代码== ==3.展示效果== (二)plt.plot()函数缺省x时 ==1.说明== ==2.源代码== ==3.展示 ...
PIL 一秒切九图朋友圈发图神器
注意图片像素返回值是(宽度,高度),pil填像素点坐标原点左上角. 判断像素点是否在圆方程中. import numpy as np from PIL import Image file = inpu ...

随机推荐

这才是批量update的正确姿势！
前言最近我有位小伙伴问我,在实际工作中,批量更新的代码要怎么写. 这个问题挺有代表性的,今天拿出来给大家一起分享一下,希望对你会有所帮助. 1 案发现场有一天上午,在我的知识星球群里,有位小伙伴问 ...
Nuxt.js 应用中的 app:beforeMount 钩子详解
title: Nuxt.js 应用中的 app:beforeMount 钩子详解 date: 2024/10/4 updated: 2024/10/4 author: cmdragon excerpt ...
9. JS的数据类型,区别
js 有2大数据类型分类 : 基本数据类型: 1. string 字符串使用单.双引号包裹,或者使用反引号包裹 2. number 数字类型 3. boolean 布尔值 true false 4. ...
SaaS架构：多租户系统架构设计
什么是多租户? 多租户是SaaS领域的特有产物,在SaaS服务中,租户是指使用SaaS系统的客户,租户不同于用户,例如,B端SaaS产品,用户可能是某个组织下的员工,但整个企业组织是SaaS系统的租户 ...
OpenAI官方开源多智能体框架「Swarm」，并不是我想要的多智能体框架
今天早上,OpenAI实施团队的 @shyamal在Github上开源了Swarm这个OpenAI官方的多智能体框架.不得不说,OpenAI官方下场,获得的社区影响就是不一样,在微信群.朋友圈里已经出 ...
四、Spring Boot集成Spring Security之认证流程
二.概要说明本文主要介绍登录登出业务流程,所以使用基于内存的用户名密码,暂不介绍授权相关内容,后续会详细介绍基于数据库的认证及授权如何查看基于内存的默认用户名密码如何配置基于内存的自定义用户名密 ...
linux运维巡检脚本
#!/bin/bash#author by acrossyao#date: 2021-02-08#张波勇巡检脚本echo "--------------------------------- ...
[Java/日志] 日志框架打印应用程序日志代码的执行情况
0 引言我常以为 INFO 日志级别的应用程序日志代码,不会被执行(比如,实验1中的printTestLog函数).但今天线上的问题,证实了这个思路是错的. 1 验证实验版本信息 jdk : 1 ...
Fluent Operator：云原生日志管理的一把瑞士军刀
作者:程德昊,Fluent Member,KubeSphere Member Fluent Operator 介绍随着云原生技术的快速发展,技术的不断迭代,对于日志的采集.处理及转发提出了更高的要 ...
KubeSphere 3.3.2 版本正式发布！
距离上一个版本 v3.3.1 发布,已经过了 3 个多月,今天我们很高兴宣布 KubeSphere v3.3.2 正式发布! 此版本由 68 位贡献者参与代码提交,感谢各位贡献者对 KubeSpher ...

cv2, pil.image, plt.image 读图的差异

cv2, pil.image, plt.image 读图的差异的更多相关文章

随机推荐

热门专题