0702-计算机视觉工具包torchvision

一、torchvision 概述
二、通过 torchvision 加载模型
三、通过 torchvision 加载并处理数据集
四、通过 torchvision 拼接并保存图片

pytorch完整教程目录：https://www.cnblogs.com/nickchen121/p/14662511.html

一、torchvision 概述

计算机视觉是深度学习中最重要的一类应用，为了方便研究者使用，torch 专门开发了一个视觉工具包 torchvision，这个包独立于 torch，需要使用 pip install torchvision 进行安装。

之前的我们已经使用过它的部分功能，在这里我们在做一个系统的介绍，它主要包含以下三个功能：

models：提供深度学习中各种经典网络的网络结构以及训练好的模型，包括 Alex-Net、VGG 系列、ResNet 系列、Inception 系列等
datasets：提供常用的数据集加载，设计上都是集成 torch.utils.data.Dataset，主要包括 MNIST、CIFAR10/100、ImageNet、COCO 等
transforms：提供常用的数据预处理操作，主要包括对 Tensor 以及 PIL Image 对象的操作

二、通过 torchvision 加载模型

from torchvision import models

from torch import nn

# 加载预训练好的模型，如果不存在会下载

# 预训练好的模型保存在 ~/.torch/modes/ 下面

resnet34 = models.resnet34(pretrained=True, num_classes=1000)

# 修改最后的全连接层为 10 分类问题（默认是 ImageNet 上的 1000 分类）

resnet34.fc = nn.Linear(512, 10)

三、通过 torchvision 加载并处理数据集

from torchvision import datasets

from torchvision import transforms as T

# 指定数据集路径为 data，如果数据集不存在则进行下载

# 通过 train=False 获取测试集

normalize = T.Normalize(mean=[0.4, 0.4, 0.4], std=[0.2, 0.2, 0.2])

transform = T.Compose([

    T.RandomResizedCrop(224),

    T.RandomHorizontalFlip(),

    T.ToTensor(),  # 把图片转成 Tensor，归一化至 [0,1]

    T.Lambda(lambda x: x.repeat(3, 1, 1)),  # 把图片转为 3 通道的

    normalize,

])

dataset = datasets.MNIST('data/',

                         download=True,

                         train=False,

                         transform=transform)

Transforms 中涵盖了大部分对 Tensor 和 PIL Image 的常用处理，这个转换通常分为两步：

第一步：构建转换操作，例如 transf = transforms.Normalize(mean=x, std=y)
第二步：执行转换操作，例如 otuput = transf(inp)

import torch as t

# 构建随机噪声，图片如下图所示

to_pil = T.ToPILImage()

to_pil(t.rand(3, 64, 64))

四、通过 torchvision 拼接并保存图片

torchvision 还提供了两个常用的函数：

make_grid，它能把多张图片拼接在一个网格中
save_img，它能把 Tensor 保存成图片

len(dataset)

from torch.utils.data import DataLoader

dataloader = DataLoader(dataset, shuffle=True, batch_size=16)

from torchvision.utils import make_grid, save_image

dataiter = iter(dataloader)

dataiter

img = make_grid(next(dataiter)[0], 4)  # 拼接成 4*4 网格图片，并且会转成 3 通道，如下图所示

to_img = T.ToPILImage()

to_img(img)

save_image(img, 'a.png')

from PIL import Image

Image.open('a.png')

0702-计算机视觉工具包torchvision的更多相关文章

深度学习框架PyTorch一书的学习-第五章-常用工具模块
https://github.com/chenyuntc/pytorch-book/blob/v1.0/chapter5-常用工具/chapter5.ipynb 希望大家直接到上面的网址去查看代码,下 ...
【深度学习框架】使用PyTorch进行数据处理
在深度学习中,数据的处理对于神经网络的训练来说十分重要,良好的数据(包括图像.文本.语音等)处理不仅可以加速模型的训练,同时也直接关系到模型的效果.本文以处理图像数据为例,记录一些使用PyTorc ...
[PyTorch 学习笔记] 2.2 图片预处理 transforms 模块机制
PyTorch 的数据增强我们在安装PyTorch时,还安装了torchvision,这是一个计算机视觉工具包.有 3 个主要的模块: torchvision.transforms: 里面包括常用的 ...
pytorch（09）transform模块(基础)
transforms transforms运行机制 torchvision.transforms:常用的图像预处理方法 torchvision.datasets:常用数据及的dataset实现,mni ...
【分享】2017 开源中国新增开源项目排行榜 TOP 100
2017 年开源中国社区新增开源项目排行榜 TOP 100 新鲜出炉! 这份榜单根据 2017 年开源中国社区新收录的开源项目的关注度和活跃度整理而来,这份最受关注的 100 款开源项目榜单在一定程度 ...
深度学习框架PyTorch一书的学习-第四章-神经网络工具箱nn
参考https://github.com/chenyuntc/pytorch-book/tree/v1.0 希望大家直接到上面的网址去查看代码,下面是本人的笔记本章介绍的nn模块是构建与autogr ...
Faster R-CNN：详解目标检测的实现过程
本文详细解释了 Faster R-CNN 的网络架构和工作流,一步步带领读者理解目标检测的工作原理,作者本人也提供了 Luminoth 实现,供大家参考. Luminoth 实现:https:// ...
深度学习论文翻译解析（四）：Faster R-CNN: Down the rabbit hole of modern object detection
论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Ton ...
[PyTorch 学习笔记] 3.1 模型创建步骤与 nn.Module
本章代码:https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson3/module_containers.py 这篇文章来看下 ...

随机推荐

微信支付/支付宝支付/银联支付，对比加总结(Java服务端)
今天来讲讲支付. 工作到现在,接入过好几个项目的支付,其中涉及到了微信支付.支付宝支付.银联支付. 三种支付的对接感受其实整体上大同小异.都遵循同一个流程: 1).商户APP向商户服务器请求生成订单 ...
资源授权？对OAuth2.0的一次重新认识的过程
什么是OAuth? OAuth一个开放的授权标准,允许用户在不提供关键信息(如账号,密码)给第三方应用的前提下,让第三方应用去访问用户在某网站上的资源(如头像,用户昵称等). OAuth分为OAuth ...
TcaplusDB服务体系揭秘
导言 TcaplusDB是腾讯出品的分布式NoSQL数据库,存储和调度的代码完全自研.具备缓存+落地融合架构.PB级存储.毫秒级时延.无损水平扩展和复杂数据结构等特性.同时具备丰富的生态.便捷的迁移. ...
死磕hyperledger fabric源码|Order节点概述
死磕hyperledger fabric源码|Order节点概述文章及代码:https://github.com/blockchainGuide/ 分支:v1.1.0 前言及源码目录 Orderer ...
第44天学习打卡（JUC 线程和进程并发和并行 Lock锁生产者和消费者问题如何判断锁（8锁问题）集合类不安全）
什么是JUC 1.java.util工具包包分类业务:普通的线程代码 Thread Runnable 没有返回值.效率相比Callable相对较低 2.线程和进程进程:一个程序.QQ.exe, ...
this指针、引用、顶层和底层const关系
1.首先顶层const和底层const是围绕指针*p的说法.底层:const int *p,const不是修饰指针p,指针所指的值不能改变:顶层:int *const p,const修饰指针p,指针本 ...
pytorch（05）计算图
张量的一系列操作,增多,导致可能出现多个操作之间的串行并行,协同不同的底层之间的协作,避免操作的冗余.计算图就是为了解决这些问题产生的. 计算图与动态图机制 1. 计算图计算图用来描述运算的有向无环 ...
2020年12月-第01阶段-前端基础-认识WEB
认识WEB 1.认识网页网页主要由文字.图像和超链接等元素构成.当然,除了这些元素,网页中还可以包含音频.视频以及Flash等. 思考: 网页是如何形成的呢? 总结网页有图片.链接.文字等元素组成 ...
Fcitx5 上线 FreeBSD
Fcitx5 上线 FreeBSD textproc/fcitx5textproc/fcitx5-qttextproc/fcitx5-gtktextproc/fcitx5-configtoolchin ...
练习1—参数传递、递归调用（Java）
1.方法参数的值传递机制 1.说明方法:必须由其所在类或对象调用才有意义.若方法含有参数: 形参:方法声明时的参数: 实参:方法调用时实际传给形参的参数值 Java的实参值如何传入方法:Java里方 ...

0702-计算机视觉工具包torchvision

0702-计算机视觉工具包torchvision

一、torchvision 概述

二、通过 torchvision 加载模型

三、通过 torchvision 加载并处理数据集

四、通过 torchvision 拼接并保存图片

0702-计算机视觉工具包torchvision的更多相关文章

随机推荐

热门专题