Opencv与Pillow图片操作差异对深度学习的影响

目前在使用Pytorch训练的深度学习模型算法，大部分由于pillow与torchvision中transforms的优异兼容都会采用Image.open from pillow的方式进行图像数据的读取和crop or resize。

这种方案在纯学术环境下不会暴露其问题，但是用到工业部署环境下就会暴露其致命的问题。由于目前C++工业部署大部分使用的还是opencv框架进行图像数据的处理，但是我们发现opencv读取图像进行resize操作时，其模型的预测精度比pillow前处理版本将下降10%到60%，这巨大的gap不由得引起我们的关注。为什么会造成这种情况。

于是我们对同一种图像分别用两个框架进行读取、resize这两个操作判断其像素间的差异。

import cv2

from PIL import Image

import numpy as np

# pillow读取并转换为int8格式数组

pil_img = Image.open("test.jpg").convert("RGB")

pil_arr = np.uint8(np.array(pil_img))

# opencv读取并转换为int8格式数组

cv_img = cv2.imread("test.jpg")

cv_img = cv2.cvtColor(cv_img, cv2.COLOR_BGR2RGB)

cv_arr = np.uint8(np.array(cv_img))

# 计算其读取误差

mean_error = np.mean(np.absolute(pil_arr - cv_arr))

读取平均像素误差

在这里我们就发现这两种框架在读取上就会造成误差，但是opencv和pillow读取有误差已经算是一个常识了，并且在未归一化的前提下只有0.0003像素值的平均误差已经很低了，应该不是造成巨大gap的原因。

归一化后的读取误差可以忽略不计

为了进一步的验证不是读取造成的模型推理精度误差，我们使用opencv读取的图片转换为pillow格式后，用pillow前处理然后推理得到的结果和pillow本身读取推理的结果是一致的。

接下来我们进一步对resize操作进行验证，两个框架均使用同一种resize算法：

# pillow resize

pil_img = pil_img.resize((300, 300), Image.BICUBIC)

pil_arr = np.uint8(np.array(pil_img))

# opencv读取并转换为int8格式数组

cv_img = cv2.resize(cv_img, (300, 300), cv2.INTER_CUBIC)

cv_arr = np.uint8(np.array(cv_img))

# 计算其resize误差

mean_error = np.mean(np.absolute(pil_arr - cv_arr))

resize平均像素误差

77的平均像素误差！要知道像素值的范围也只有0到255，将近三分之一的误差，说明两者在同一种resize的实现逻辑一定有巨大差异，这种误差将在使用opencv部署pillow训练模型的时候造成巨大的精度gap。

后续对此情况进行调研，发现这个问题在2017年的时候，就已经有人在pillow的官方仓库下提出。

pillow仓库问题链接

pillow框架在resize算法实现上和opencv、matlab均有巨大差异，但是pillow并不认为这是他们的问题，所以也一直没有修改。

从开发者的角度上来说，为了工业部署时对精度的良好把控，建议在训练时不要使用pillow框架和torchvision自带的前处理方案，保证训练和部署对数据处理的一致性，避免这种由框架不同导致的巨大gap。

Opencv与Pillow图片操作差异对深度学习的影响的更多相关文章

深度学习 + OpenCV，Python实现实时视频目标检测
使用 OpenCV 和 Python 对实时视频流进行深度学习目标检测是非常简单的,我们只需要组合一些合适的代码,接入实时视频,随后加入原有的目标检测功能. 在本文中我们将学习如何扩展原有的目标检测项 ...
给深度学习入门者的Python快速教程 - 番外篇之Python-OpenCV
这次博客园的排版彻底残了..高清版请移步: https://zhuanlan.zhihu.com/p/24425116 本篇是前面两篇教程: 给深度学习入门者的Python快速教程 - 基础篇给深度 ...
MXNet设计笔记之：深度学习的编程模式比较
市面上流行着各式各样的深度学习库,它们风格各异.那么这些函数库的风格在系统优化和用户体验方面又有哪些优势和缺陷呢?本文旨在于比较它们在编程模式方面的差异,讨论这些模式的基本优劣势,以及我们从中可以学到 ...
深度学习框架PyTorch一书的学习-第五章-常用工具模块
https://github.com/chenyuntc/pytorch-book/blob/v1.0/chapter5-常用工具/chapter5.ipynb 希望大家直接到上面的网址去查看代码,下 ...
深度学习基础系列（十一）| Keras中图像增强技术详解
在深度学习中,数据短缺是我们经常面临的一个问题,虽然现在有不少公开数据集,但跟大公司掌握的海量数据集相比,数量上仍然偏少,而某些特定领域的数据采集更是非常困难.根据之前的学习可知,数据量少带来的最直接 ...
28款GitHub最流行的开源机器学习项目,推荐GitHub上10 个开源深度学习框架
20 个顶尖的 Python 机器学习开源项目机器学习 2015-06-08 22:44:30 发布您的评价: 0.0 收藏 1收藏我们在Github上的贡献者和提交者之中检查了用Python语 ...
玩深度学习选哪块英伟达 GPU？有性价比排名还不够！
本文來源地址:https://www.leiphone.com/news/201705/uo3MgYrFxgdyTRGR.html 与“传统” AI 算法相比,深度学习(DL)的计算性能要求,可以说完 ...
faceswap深度学习AI实现视频换脸详解
给大家介绍最近超级火的黑科技应用deepfake,这是一个实现图片和视频换脸的app.前段时间神奇女侠加尔盖朵的脸被换到了爱情动作片上,233333.我们这里将会从github项目faceswap开始 ...
TensorFlow系列专题（三）：深度学习简介
一.深度学习的发展历程深度学习的起源阶段深度学习的发展阶段深度学习的爆发阶段二.深度学习的应用自然语言处理语音识别与合成图像领域三．参考文献一.深度学习的发展历程作为机器学习最 ...
推荐GitHub上10 个开源深度学习框架
推荐GitHub上10 个开源深度学习框架日前,Google 开源了 TensorFlow(GitHub),此举在深度学习领域影响巨大,因为 Google 在人工智能领域的研发成绩斐然,有着雄厚 ...

随机推荐

[BZOJ4671] 异或图题解
我能说什么!抽象了这! 看到 \(n\le 10\) 的黑题顿感大事不妙. 我们考虑设 \(f(i)\) 表示将 \(n\) 个点划分为至少 \(i\) 个连通块时的方案数.我们可以暴力枚举每个点在哪 ...
使用vscode开发微信小程序
1. 安装插件 2. 文件-打开文件夹-将新建的微信小程序导入,代码会有高亮的效果 3. 编辑内容,查看效果,如果有就说明插件引入成功.
autMan奥特曼机器人--可爱猫对接微信教程
教程开始文章底部下载可爱猫框架以及对应的微信版本 1.安装3.4.0.38版本微信,解压可爱猫框架压缩包如果微信安装了高于3.4.0.38的版本,请先卸载 2.打开可爱猫框架,会弹微信扫码登录,机 ...
Qt个人项目总结 —— MySQL数据库查询与断言
3.Qt项目总结--数据库查询断言问题问题: 当我使用MySQL数据库的查询操作时, 如果查询的数据在数据库中不存在,那么Qt会直接被干崩溃但是?为什么呢?不应该是返回if语句中的结果吗,为什么会 ...
jQuery ajax 文件上传 Request Headers 缺少 boundary
原文地址: https://blog.jijian.link/2020-07-28/jquery-ajax-upload-file/ 一般上传方式 const file = document.getE ...
mysql基础中的基础函数
前段时间b站看sql基础语法,在此做一总结 1.基本函数 mysql中的函数基本可以分为单行函数和分组函数,单行函数用于处理单个的数据,分组函数则是传输一组值过去进行处理.单行函数有可分为字符函数,数 ...
mac地址查询
打开命令提示符窗口(cmd程序) 快捷键 win+r 打开运行窗口,输入 cmd 命令打开命令提示符窗口或者点击开始菜单,在搜索程序和文件输入框,输入 cmd(会找到进入dos命令的cmd程序) ...
基于SLAM系统建图仿真，完成定位仿真
博客地址:https://www.cnblogs.com/zylyehuo/ 基于SLAM系统完成建图仿真,详见之前的博客基于Gazebo搭建移动机器人,并结合SLAM系统完成建图仿真 - zyly ...
Docker使用手册--给你通用常用命令
卸载JDK rpm -qa | grep -i java rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps 安装JDK tar -zxvf jdk- ...
Ai满嘴顺口溜，想考研？浪费我几个小时
Trae + claude3.7 事情的经过是这样的: 我有个方法代码如下: /// <summary> /// 获取客户端列表 /// </summary> /// < ...

Opencv与Pillow图片操作差异对深度学习的影响

Opencv与Pillow图片操作差异对深度学习的影响的更多相关文章

随机推荐

热门专题