transforms

  1. transforms运行机制

    torchvision.transforms:常用的图像预处理方法

    torchvision.datasets:常用数据及的dataset实现,mnist,cifar-10,imagenet等

    torchvision.model:常用的模型与训练,AlexNet,VGG,ResNet,GoogLeNet等

    torchvision:计算机视觉工具包

我们对图片进行预处理的图像增强,主要就是增加图片的泛化能力,丰富训练数据。

泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。

  1. 数据标准化——transform.normalize

    transforms.Normalize(mean,std,inplace=False)

    逐channel对图像进行标准化

    output = (input - mean) / std
  • mean:各通道的均值
  • std:各通道的标准差
  • inplace:是否原地操作

    数据标准化的目的:

    在于标准化后能够使整体数据样本接近于0,在进行sigmoid激活函数时候能够发现收敛速度更快

transforms ——裁剪

  1. crop 裁剪

    transforms.CenterCrop,从图像中心裁剪图片,size(所需要的裁剪图片尺寸)
from PIL import Image
from torchvision import transforms
x_img = Image.open("paper.jpg").convert('RGB')
x_img = transforms.CenterCrop((88, 10))(x_img)
x_img.show()
  1. RandomCrop

    transforms.RandomCrop(size,padding=None,pad_if_needed=False,fill=0,padding_mode='constant')
  • size:尺寸
  • padding:设置填充大小

    当为a时,上下左右均填充a个像素

    当为(a,b)时,上下填充b个像素,左右填充a个像素

    当为(a,b,c,d)时,左上右下分别填充a,b,c,d
  • pad_if_need:若图像小于设定size,则填充
  • padding_mode:填充模式,有四种:
    1. constant:像素值由fill设定
    2. edge:像素值由图像边缘像素决定
    3. reflect:镜像填充,最后一个像素不镜像,eg:[1,2,3,4]->[3,2,1,2,3,4,3,2]
    4. symmetric:镜像填充,最后一个像素镜像,eg:[1,2,3,4]->[2,1,1,2,3,4,4,3]
  • fill:constant时,设置填充的像素值
flag = True
# flag = False
if flag:
x_img = Image.open("face.jpg").convert('RGB')
x_img = transforms.RandomCrop((900,200), padding=100, fill=(255,0,0))(x_img) # 如果裁剪像素大于原始,则需要进行pad_if_needed
x_img.show()
  1. RandomResizedCrop

    随机大小、长宽比裁剪图片

    RandomResizedCrop(size,scale=(0.08,1.0),ratio=(3/4,4,3),interpolation)
  • scale:随机裁剪面积比例,默认(0.08, 1)
  • ratio:随机长宽比,默认(3/4,4/3)
  • interpolation:插值方法

    PIL.Image.NEAREST

    PIL.Image.BILINEAR

    PIL.Image.BICUBIC
flag = True
# flag = False
if flag:
x_img = Image.open("paper.jpg").convert('RGB')
x_img = transforms.RandomResizedCrop((400,200),scale=(0.5,1.0),
ratio=(3./4,4./3),
interpolation=0)(x_img)
x_img.show()
  1. FiveCrop
# ===================04 FiveCrop=================
flag =True
# flag = False
if flag:
x_img = Image.open("face.jpg").convert('RGB')
x_img1, x_img2, x_img3, x_img4, x_img5 = transforms.FiveCrop((300,300))(x_img)
x_img2.show()
  1. TenCrop

    在图像的上下左右以及中心裁剪出尺寸为size的5张图片,TenCrop对这5张图片进行水平或者垂直镜像获得10张图片
  • size:所需裁剪图片尺寸
  • vertical_flip:是否垂直翻转
# ===================05 TenCrop=================
flag =True
# flag = False
if flag:
x_img = Image.open("face.jpg").convert('RGB')
x_img1, x_img2, x_img3, x_img4, x_img5 \
,x_img6 ,x_img7,x_img8,x_img9,x_img10= transforms.TenCrop((300,300),vertical_flip=True)(x_img)
x_img7.show()

transforms——翻转、旋转

  1. transforms flip

    1. RandomHorizontalFlip
    2. RandomVerticalFilp
# ===================06 Flip=================
flag = True
# flag = False
if flag:
x_img = Image.open("face.jpg")
x_imgd = transforms.RandomVerticalFlip(p=1)(x_img)
plt.imshow(x_imgd)
plt.show()
  1. RandomRoatation

    随机旋转图片

    RandomRotation(degress, resample=False, expand=False, center=None)
  • degress:旋转角度

    为a时,在(-a,a)之间选择旋转角度

    为(a,b)时,在(a,b)之间选择旋转角度
  • resample:重采样方法
  • expand:是否扩大图片,保持原图信息
# ===================07 Rotation==============
flag = True
# flag = False
if flag:
x_img = Image.open("face.jpg")
x_imgd = transforms.RandomRotation(60, resample=Image.BILINEAR, expand=True, center=(40,80))(x_img)
x_imgd.show()

pytorch(09)transform模块(基础)的更多相关文章

  1. [源码解析] PyTorch 分布式(4)------分布式应用基础概念

    [源码解析] PyTorch 分布式(4)------分布式应用基础概念 目录 [源码解析] PyTorch 分布式(4)------分布式应用基础概念 0x00 摘要 0x01 基本概念 0x02 ...

  2. 03爬虫-requests模块基础(1)

    requests模块基础 什么是requests模块 requests模块是python中原生基于网络模拟浏览器发送请求模块.功能强大,用法简洁高效. 为什么要是用requests模块 用以前的url ...

  3. 【MM系列】SAP MM模块-基础配置第一篇

    公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[MM系列]SAP MM模块-基础配置第一篇   ...

  4. python常识系列08-->logging模块基础入门

    前言 努力从今天开始,成功从"零"开始. 一.logging模块是什么? 是Python内置的标准模块,主要用于输出运行日志 二.日志是什么? 日志是代码的必要组成部分 记录日志能 ...

  5. 09 基于模块wsgiref版web框架

    09 基于模块wsgiref版web框架 模块引入 真实开发中的python web程序,一般会分为两部分:       服务器程序:负责对socket服务器进行封装,并在请求到来时,对请求的各种数据 ...

  6. pytorch(10)transform模块(进阶)

    图像变换 Pad 对图片边缘进行填充 transforms.Pad(padding,fill=0,padding_mode='constant') padding:设置填充大小,(a,b,c,d)左上 ...

  7. 【笔记】PyTorch快速入门:基础部分合集

    PyTorch快速入门 Tensors Tensors贯穿PyTorch始终 和多维数组很相似,一个特点是可以硬件加速 Tensors的初始化 有很多方式 直接给值 data = [[1,2],[3, ...

  8. python 模块基础介绍

    从逻辑上组织代码,将一些有联系,完成特定功能相关的代码组织在一起,这些自我包含并且有组织的代码片段就是模块,将其他模块中属性附加到你的模块的操作叫做导入. 那些一个或多个.py文件组成的代码集合就称为 ...

  9. python模块基础之json,requeste,xml,configparser,logging,subprocess,shutil。

    1.json模块 json     用于[字符串]和 [python基本数据类型] 间进行转换(可用于不同语言之前转换),json.loads,将字符串转成python的基本数据类型,json.dum ...

随机推荐

  1. hdu4920Matrix multiplication (矩阵,bitset)

    Problem Description Given two matrices A and B of size n×n, find the product of them. bobo hates big ...

  2. poj2926Requirements (曼哈顿距离)

    Description An undergraduate student, realizing that he needs to do research to improve his chances ...

  3. A. Little Elephant and Interval

    The Little Elephant very much loves sums on intervals. This time he has a pair of integers l and r ( ...

  4. CodeForces - 220B 离散化+莫队算法

    莫队算法链接:传送门 题意: 有n个数,m个区间.问区间内有多少个x,x满足x的个数等于x的值的个数(如果x是3,区间内要存在3个3). 题解: 因为a[i]太大,所以要离散化一下,但是不能用map容 ...

  5. ApiPost V5 升级指南

    同旧版本相比,ApiPost V5 (以下简称V5)重新规划了底层架构,大大降低了内存使用率:并加入了大量新功能,用户体验也有了全新的提升.但是同旧版相比,很多使用方式有所不同,本文重点讲解以下用户升 ...

  6. Zabbix 监控网站

    官网教学步骤 配置 Web 监控 创建 Web 场景 配置 Web 场景 配置 Web 监控步骤 一共划分为 5 个步骤: 监测访问登录页面 模拟登录功能 # sid 变量的值 regex:name= ...

  7. Kubernets二进制安装(13)之部署Flannel

    Flannel简介 ​ Flannel是CoreDNS团队针对Kubernetes设计的一个网络规划服务,简单来说,它的功能是让集群中的不同节点主机创建的Docker容器都具有全集群唯一的虚拟IP地址 ...

  8. CentOS7安装配置 NFS

    一.NFS 简介 NFS(Network File System)即网络文件系统,它允许网络中的计算机之间通过TCP/IP网络共享资源.在NFS的应用中,本地NFS的客户端应用可以透明地读写位于远端N ...

  9. Gitlab 快速部署及日常维护 (二)

    一.概述 上一篇我们将Gitlab的安装部署和初始化设置部分全部讲解完成了,接下来我们介绍Gitlab在日常工作中常遇见的问题进行梳理说明. 二.Gitlab的安装和维护过程中常见问题 1.Gitla ...

  10. Leetcode(257)-二叉树的所有路径

    给定一个二叉树,返回所有从根节点到叶子节点的路径. 说明: 叶子节点是指没有子节点的节点. 示例: 输入: 1 / \ 2 3 \ 5 输出: ["1->2->5", ...