pytorch（09）transform模块(基础)

transforms

transforms运行机制

torchvision.transforms:常用的图像预处理方法

torchvision.datasets:常用数据及的dataset实现，mnist，cifar-10，imagenet等

torchvision.model:常用的模型与训练，AlexNet，VGG，ResNet，GoogLeNet等

torchvision：计算机视觉工具包

我们对图片进行预处理的图像增强，主要就是增加图片的泛化能力，丰富训练数据。

泛化能力（generalization ability）是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律，对具有同一规律的学习集以外的数据，经过训练的网络也能给出合适的输出，该能力称为泛化能力。

数据标准化——transform.normalize

transforms.Normalize(mean,std,inplace=False)

逐channel对图像进行标准化

output = (input - mean) / std

mean:各通道的均值
std:各通道的标准差
inplace:是否原地操作

数据标准化的目的：

在于标准化后能够使整体数据样本接近于0，在进行sigmoid激活函数时候能够发现收敛速度更快

transforms ——裁剪

crop 裁剪

transforms.CenterCrop,从图像中心裁剪图片，size(所需要的裁剪图片尺寸)

from PIL import Image

from torchvision import transforms

x_img = Image.open("paper.jpg").convert('RGB')

x_img = transforms.CenterCrop((88, 10))(x_img)

x_img.show()

RandomCrop

transforms.RandomCrop(size,padding=None,pad_if_needed=False,fill=0,padding_mode='constant')

size:尺寸
padding:设置填充大小

当为a时，上下左右均填充a个像素

当为(a,b)时，上下填充b个像素，左右填充a个像素

当为(a,b,c,d)时，左上右下分别填充a,b,c,d
pad_if_need:若图像小于设定size,则填充
padding_mode:填充模式，有四种：
1. constant:像素值由fill设定
2. edge:像素值由图像边缘像素决定
3. reflect:镜像填充，最后一个像素不镜像，eg:[1,2,3,4]->[3,2,1,2,3,4,3,2]
4. symmetric:镜像填充，最后一个像素镜像，eg:[1,2,3,4]->[2,1,1,2,3,4,4,3]
fill:constant时，设置填充的像素值

flag = True

# flag = False

if flag:

    x_img = Image.open("face.jpg").convert('RGB')

    x_img = transforms.RandomCrop((900,200), padding=100, fill=(255,0,0))(x_img) # 如果裁剪像素大于原始，则需要进行pad_if_needed

    x_img.show()

RandomResizedCrop

随机大小、长宽比裁剪图片

RandomResizedCrop(size,scale=(0.08,1.0),ratio=(3/4,4,3),interpolation)

scale:随机裁剪面积比例，默认(0.08, 1)
ratio:随机长宽比，默认(3/4,4/3)
interpolation:插值方法

PIL.Image.NEAREST

PIL.Image.BILINEAR

PIL.Image.BICUBIC

flag = True

# flag = False

if flag:

    x_img = Image.open("paper.jpg").convert('RGB')

    x_img = transforms.RandomResizedCrop((400,200),scale=(0.5,1.0),

                                         ratio=(3./4,4./3),

                                         interpolation=0)(x_img)

    x_img.show()

FiveCrop

# ===================04 FiveCrop=================

flag =True

# flag = False

if flag:

    x_img = Image.open("face.jpg").convert('RGB')

    x_img1, x_img2, x_img3, x_img4, x_img5 = transforms.FiveCrop((300,300))(x_img)

    x_img2.show()

TenCrop

在图像的上下左右以及中心裁剪出尺寸为size的5张图片，TenCrop对这5张图片进行水平或者垂直镜像获得10张图片

size:所需裁剪图片尺寸
vertical_flip:是否垂直翻转

# ===================05 TenCrop=================

flag =True

# flag = False

if flag:

    x_img = Image.open("face.jpg").convert('RGB')

    x_img1, x_img2, x_img3, x_img4, x_img5 \

        ,x_img6 ,x_img7,x_img8,x_img9,x_img10= transforms.TenCrop((300,300),vertical_flip=True)(x_img)

    x_img7.show()

transforms——翻转、旋转

transforms flip
1. RandomHorizontalFlip
2. RandomVerticalFilp

# ===================06 Flip=================

flag = True

# flag = False

if flag:

    x_img = Image.open("face.jpg")

    x_imgd = transforms.RandomVerticalFlip(p=1)(x_img)

    plt.imshow(x_imgd)

    plt.show()

RandomRoatation

随机旋转图片

RandomRotation(degress, resample=False, expand=False, center=None)

degress:旋转角度

为a时，在(-a,a)之间选择旋转角度

为(a,b)时，在(a,b)之间选择旋转角度
resample:重采样方法
expand:是否扩大图片，保持原图信息

# ===================07 Rotation==============

flag = True

# flag = False

if flag:

    x_img = Image.open("face.jpg")

    x_imgd = transforms.RandomRotation(60, resample=Image.BILINEAR, expand=True, center=(40,80))(x_img)

    x_imgd.show()

pytorch（09）transform模块(基础)的更多相关文章

[源码解析] PyTorch 分布式(4)------分布式应用基础概念
[源码解析] PyTorch 分布式(4)------分布式应用基础概念目录 [源码解析] PyTorch 分布式(4)------分布式应用基础概念 0x00 摘要 0x01 基本概念 0x02 ...
03爬虫-requests模块基础(1)
requests模块基础什么是requests模块 requests模块是python中原生基于网络模拟浏览器发送请求模块.功能强大,用法简洁高效. 为什么要是用requests模块用以前的url ...
【MM系列】SAP MM模块-基础配置第一篇
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[MM系列]SAP MM模块-基础配置第一篇 ...
python常识系列08-->logging模块基础入门
前言努力从今天开始,成功从"零"开始. 一.logging模块是什么? 是Python内置的标准模块,主要用于输出运行日志二.日志是什么? 日志是代码的必要组成部分记录日志能 ...
09 基于模块wsgiref版web框架
09 基于模块wsgiref版web框架模块引入真实开发中的python web程序,一般会分为两部分: 服务器程序:负责对socket服务器进行封装,并在请求到来时,对请求的各种数据 ...
pytorch（10）transform模块(进阶)
图像变换 Pad 对图片边缘进行填充 transforms.Pad(padding,fill=0,padding_mode='constant') padding:设置填充大小,(a,b,c,d)左上 ...
【笔记】PyTorch快速入门：基础部分合集
PyTorch快速入门 Tensors Tensors贯穿PyTorch始终和多维数组很相似,一个特点是可以硬件加速 Tensors的初始化有很多方式直接给值 data = [[1,2],[3, ...
python 模块基础介绍
从逻辑上组织代码,将一些有联系,完成特定功能相关的代码组织在一起,这些自我包含并且有组织的代码片段就是模块,将其他模块中属性附加到你的模块的操作叫做导入. 那些一个或多个.py文件组成的代码集合就称为 ...
python模块基础之json，requeste，xml，configparser，logging，subprocess，shutil。
1.json模块 json 用于[字符串]和 [python基本数据类型] 间进行转换(可用于不同语言之前转换),json.loads,将字符串转成python的基本数据类型,json.dum ...

随机推荐

Educational DP Contest E - Knapsack 2 (01背包进阶版)
题意:有\(n\)个物品,第\(i\)个物品价值\(v_{i}\),体积为\(w_{i}\),你有容量为\(W\)的背包,求能放物品的最大价值. 题解:经典01背包,但是物品的最大体积给到了\(10^ ...
Docker架构分解
Docker总架构分解Docker对使用者来讲是一个C/S模式的架构,而Docker的后端是一个非常松耦合的架构,模块各司其职,并有机组合,支撑Docker的运行. 用户是使用Docker Clien ...
kubeadm---高可用安装
1.修改主机名如何使用hostnamectl set-hostname name来为每台主机设置不同的机器名 #hostnamectl set-hostname k8s-master01 或者使用以 ...
linux内核编程入门--系统调用监控文件访问
参考的资料: hello world https://www.cnblogs.com/bitor/p/9608725.html linux内核监控模块--系统调用的截获 https://www. ...
IP的地址的划分
IP地址的划分是计算机网络中很重要的一个知识点,曾经考过三级,但是长时间不用就会忘掉,现在重新将IP的地址划分整理一遍. 首先IP地址的编址方法经历了三个阶段:分类的IP地址.子网的划分.构成超网我 ...
springboot demo（二）web开发demo
如入门般建立项目,引入依赖: <dependencies> <dependency> <groupId>org.springframework.boot</g ...
hihoCoder Challenge 3
#1065 : 全图传送时间限制:30000ms 单点时限:3000ms 内存限制:256MB 描述先知法里奥是 Dota 系列中的一个英雄.机动性强,推塔能力一流,打钱速度快,传送技能使先知可以 ...
Sentry 中文版
Sentry 中文版汉化 https://sentry.io/settings/account/details/ 打开用户设置 User settings 语言选择中文 Simplified Chi ...
手把手搭建一套基于 Sentry 的异常监控系统
手把手搭建一套基于 Sentry 的异常监控系统 Sentry 开源版 DevOps refs https://github.com/getsentry/sentry sentry-anomaly-m ...
Keep Fitness
Keep Fitness 健身 keep health 训练流程 Part 1 热身 5-10分钟 Part 2 肌肉力量训练 30分钟大肌群包括:胸.背.腿.臀: 小肌群包括:肩.二头肌.三头肌. ...

pytorch（09）transform模块(基础)

transforms

transforms ——裁剪

transforms——翻转、旋转

pytorch（09）transform模块(基础)的更多相关文章

随机推荐

热门专题