Transform的作用

把图片经过Transforms的一些函数之后就会对图片进行一些变化。比如，resize就是改变其大小，totensor就是把图片PIL或者numpy类型转化为Tensor类型。

Transforms的结构及和用法

totensor的使用

Transforms下的toTensor是一个对象，我们需要先实例化一个对象之后再通过这个实例化的对象进行调用。

from torchvision import transforms

tensor_class = transforms.ToTensor()

img_tensor = tensor_class(img_PIL)

为什么使用transforms转化为Tensor类型

因为tensor类型包装了我们神经网络中所需要的一些参数，而PIL或者numpy类型是没有的。

ToTensor实例代码



from PIL import Image

from torchvision.transforms import transforms

from torch.utils.tensorboard import SummaryWriter

img_PIL = Image.open("Dataset/hymenoptera_data/train/ants/0013035.jpg")

# print(img_PIL)

tensor_class = transforms.ToTensor()

img_tensor = tensor_class(img_PIL)

writer = SummaryWriter('logs')

writer.add_image('tensor-test',img_tensor,1,)

# print(img_tensor)

writer.close()

效果如下

常用的Transforms

Transforms的使用主要就是使用其中的一些常见的类比如ToTensor（），Resize（），使用这些类的时候主要是注意其输入和输出，作用。最主要的是输入和输出。下图是transforms中的类，可以使用pycharm中的structure功能查看一个py文件中的函数和类。AIT+7快捷键

compose类

他的作用就是将transforms中的几个类结合使用。比如

transforms.Compose([transforms.CenterCrop(10),transforms.ToTensor()])

意思就是先进行CenterCrop再进行Totensor操作，要注意前一个类的输出符合后一个类的输入。

举例：

trans_Compose = transforms.Compose([transforms.Resize(216),transforms.ToTensor()])

img_PIL_to_resize_to_tensor = trans_Compose(img_PIL)

print(type(img_PIL_to_resize_to_tensor))

效果输出：

Normalize类

transforms.Normalize 是一个在深度学习库 PyTorch 中广泛使用的图像预处理函数，属于 torchvision.transforms 模块。该函数主要用于对输入数据（尤其是图像数据）进行标准化处理，以便提升模型训练的效率和效果。标准化处理的具体操作是对数据的每个通道（对于RGB图像即红、绿、蓝三个通道）执行如下操作：

output[channel] = (input[channel] - mean[channel]) / std[channel]

。通过这种方式，数据会被调整到均值为0、标准差为1的分布，这样的处理有助于消除不同通道间尺度不一致的问题，并使得模型学习过程更加稳定。

在实际应用中，transforms.Normalize 需要两个参数：mean 和 std，它们分别是每个通道的均值和标准差的列表。例如，对于典型的ImageNet数据集，常用的参数值为 mean=[0.485, 0.456, 0.406] 和 std=[0.229, 0.224, 0.225]。

需要注意的是，在应用 transforms.Normalize 之前，数据往往需要被转换成 PyTorch 的 Tensor 格式且其值通常位于[0, 1]或[-1, 1]区间内，这通常通过 transforms.ToTensor() 或其他预处理步骤完成。

from PIL import Image

from torchvision.transforms import transforms

from torch.utils.tensorboard import SummaryWriter

img_PIL = Image.open("Dataset/hymenoptera_data/train/ants/0013035.jpg")

# print(img_PIL)

#Totensor

tensor_class = transforms.ToTensor()

img_tensor = tensor_class(img_PIL)

#Nor

print(img_tensor[0][0][0])

trans_Nor = transforms.Normalize([1,2,0.5],[1,0.5,0.5])

img_Normal = trans_Nor(img_tensor)

print(img_Normal[0][0][0])

#

writer = SummaryWriter('logs')

writer.add_image('Totensor',img_tensor,1,)

writer.add_image('Normal',img_Normal,2)

# print(img_tensor)

writer.close()

效果如下：

Resize

改变图片大小，输入要么是（H，W）或者是一个整数，如果是（H,W）那么照片就是固定这个比例，如果是整数，那么就按照最小边来处理。通常适用于预处理那些尺寸不一的图像，使其适配模型所需的固定输入尺寸，同时保持图像内容的自然外观。

from PIL import Image

from torchvision.transforms import transforms

from torch.utils.tensorboard import SummaryWriter

img_PIL = Image.open("Dataset/hymenoptera_data/train/ants/0013035.jpg")

# print(img_PIL)

#Totensor

tensor_class = transforms.ToTensor()

img_tensor = tensor_class(img_PIL)

#Nor

print(img_tensor[0][0][0])

trans_Nor = transforms.Normalize([1,2,0.5],[1,0.5,0.5])

img_Normal = trans_Nor(img_tensor)

print(img_Normal[0][0][0])

#Resize

trans_Resize = transforms.Resize((100,300))

img_resize = trans_Resize(img_tensor)

# print(img_resize.shape)

#

writer = SummaryWriter('logs')

writer.add_image('Totensor',img_tensor,1,)

writer.add_image('Normal',img_Normal,2)

writer.add_image('resize',img_resize,3)

# print(img_tensor)

writer.close()

效果如下：

对于其他类的使用，多看官方文档，不会就翻译或者问chatgpt

Transforms的使用的更多相关文章

Intro to CSS 3D transforms
原文地址:Intro to CSS 3D transforms,本文只是翻译了其中的一部分,省去了作者写文章的原因浏览器兼容部分(已经过时) Perspective 元素需要设置需要设置perspec ...
OpenCASCADE Coordinate Transforms
OpenCASCADE Coordinate Transforms eryar@163.com Abstract. The purpose of the OpenGL graphics process ...
IE10开始支持CSS3 Transitions, Transforms 和 Animations
这是一个好消息,微软公开说明IE10预览版已经支持CSS3属性 Transitions, Transforms 和 Animations,你可以直接写transitions,而不是加个恶心的前缀-ms ...
CSS3 笔记四（Transforms/Transition/Animations）
CSS3 2D Transforms Methods translate() rotate() scale() skewX() skewY() matrix() 1> translate() T ...
前端开发教程：使用 CSS3 Transforms 构建圆形导航
在本教程中我将告诉你如何使用 CSS 变换来创建圆形导航.教程逐一讲解实现这个样式将要涉及一些基本的数学知识并配合 CSS 变换来创建这些样式.不过不用担心,这里用到的数学知识真的是很简单的.教程使用 ...
Codrops 优秀教程：CSS 3D Transforms 实现书本效果
这个使用 CSS 3D Transforms 实现创意书本效果的来自 Codrops 网站.你可以看到两种类型的书设计:精装书和平装书.这两个效果都可以很容易地使用 CSS 修改.赶紧体验一下吧. ...
CSS3 transforms 3D翻开
R T L B <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w ...
CSS3 Transitions, Transforms和Animation使用简介与应用展示
CSS3 Transitions, Transforms和Animation使用简介与应用展示 by zhangxinxu from http://www.zhangxinxu.com本文地址:htt ...
图形变幻矩阵 Transforms
https://developer.apple.com/library/mac/documentation/GraphicsImaging/Conceptual/drawingwithquartz2d ...
Cocos2D:变换(transforms)在图形编程中扮演的角色
大熊猫猪·侯佩原创或翻译作品.欢迎转载,转载请注明出处. 如果觉得写的不好请多提意见,如果觉得不错请多多支持点赞.谢谢! hopy ;) 免责申明:本博客提供的所有翻译文章原稿均来自互联网,仅供学习交 ...

随机推荐

SpringMVC面试题及答案
SpringMvc 的控制器是不是单例模式,如果是,有什么问题,怎么解决? 问题:单例模式,在多线程访问时有线程安全问题解决方法:不要用同步,在控制器里面不能写字段 SpringMvc 中控制器的注 ...
CF414B
这道题dp状态表示需要一点思维,而且会卡到时间复杂度之前题主用的是试除法,时间复杂度为n^2.5,然后被卡了,但是换一种写法就是对的 #include <iostream> #inclu ...
基于表单登录的cookies登录
1.基于表单登录的cookies登录 In [ ]: import requests import matplotlib.pyplot as plt from http.cookiejar impor ...
【算法】在vue3的ts代码中分组group聚合源数据列表
有一个IList<any>()对象列表, 示例数据为[{id:'1',fieldName:'field1',value:'1'},{id:'1',fieldName:'field2',va ...
基于微信小程序的校园维修管理系统-开题报告参考
\n文末获取源码联系感兴趣的可以先收藏起来,大家在毕设选题,项目以及论文编写等相关问题都可以给我加好友咨询一.课题研究的目的和意义** 本研究开发基于微信小程序的物品维修系统,它不仅能实现专业的维 ...
第八节 JMeter基础-高级登录【数据库数据驱动】
声明:本文所记录的仅本次操作学习到的知识点,其中商城IP错误,请自行更改. 背景:获取数据库用户表中的数据进行登录接口测试.思路: 引用jar包[测试计划]. 设置数据库的连接信息,取变量名db1-- ...
ABC354
A link 模拟整个过程即可. 点击查看代码 #include<bits/stdc++.h> #define int long long using namespace std; sig ...
SEO初学指南之关键词研究(2) - 搜索意图分析
Hi,我是听风.这篇文章我们深入探讨下关键词研究中最重要的一点:搜索意图. 虽然这在本系列教程的第一篇中提到过搜索意图,但是我还是想再写一篇文章来帮助你们了解什么是搜索意图以及如何再关键词研究中使用它 ...
c# 多线程环境下控制对共享资源访问的办法
Monitor: 定义:Monitor 是 C# 中最基本的同步机制,通过 Enter 和 Exit 方法来控制对共享资源的访问.它提供了排他锁的功能,确保在任何时刻只有一个线程可以访问共享资源. 优 ...
图书《数据资产管理核心技术与应用》核心章节节选-3.1.2. 从Spark 执行计划中获取数据血缘
本文节选自清华大学出版社出版的图书<数据资产管理核心技术与应用>,作者为张永清等著. 从Spark 执行计划中获取数据血缘因为数据处理任务会涉及到数据的转换和处理,所以从数据任务中解析血 ...

Transforms的使用