图片 Augmentation整理
Augmentation
原图:

Flipping 翻转


Grayscale

Equalize 均衡直方图

Posterize 减少颜色通道位数

Cropping

Rotation

Translation

Noise injection


Hue 色调

Brightness

Saturation

Contrast

Erasing 抹去

Augmix

代码
config.json:
{
"Crop": {
"size": [100, 200]
},
"Rotate": {
"degrees": 20
},
"Translate": {
"translate": [0.3, 0.3]
},
"Scale": {
"scale": [0.7, 1.3]
},
"Shear": {
"shear": [10, 100, 10, 100]
},
"Hflip": {},
"Vflip": {},
"Equalize": {
"mask": null
},
"Posterize": {
"bits" : 2
},
"Grayscale": {
"num_output_channels": 1
},
"Normalnoise": {
"loc": 0.0,
"scale": 0.1
},
"Uniformnoise": {
"alpha": 0.2
},
"Contrast": {
"contrast": 0.8
},
"Brightness": {
"brightness": 0.7
},
"Saturation": {
"saturation": 0.7
},
"Hue": {
"hue": 0.5
},
"Erase": {
"value": 100
}
}
"""
ops.py
"""
import torch
import torchvision.transforms.functional as F
import PIL.ImageOps
import random
from torchvision import transforms
import scipy.stats
from collections.abc import Iterable
def special(cls, name, *args, **kwargs):
class Newclass(cls):
def __init__(self, *newargs, **newkwargs):
newargs += args
newkwargs.update(kwargs)
super(Newclass, self).__init__(*newargs, **newkwargs)
Newclass.__name__ = name
return Newclass
class Hflip:
"""
水平翻转
"""
def __call__(self, img):
return F.hflip(img)
class Vflip:
"""
上下翻转
"""
def __call__(self, img):
return F.vflip(img)
class Equalize:
"""
均衡图像直方图
"""
def __init__(self, mask):
self.mask = mask
def __call__(self, img):
return PIL.ImageOps.equalize(img, self.mask)
class Posterize:
"""
减少每个颜色通道的位数
"""
def __init__(self, bits):
self.bits = bits
def __call__(self, img):
return PIL.ImageOps.posterize(img, self.bits)
class Grayscale:
def __init__(self, num_output_channels=1):
self.num_output_channels = num_output_channels
def __call__(self, img):
return F.to_grayscale(img, self.num_output_channels)
class Normalnoise:
def __init__(self, loc, scale):
self.loc = loc
self.scale = scale
def __call__(self, img):
img = F.to_tensor(img)
img += (torch.randn_like(img) + self.loc) * self.scale
img = torch.clamp(img, 0., 1.)
return F.to_pil_image(img)
class Uniformnoise:
def __init__(self, alpha):
if alpha < 0 or alpha > 1:
raise ValueError("alpha should be in [0, 1]...")
self.alpha = alpha
def __call__(self, img):
img = F.to_tensor(img)
img += torch.rand_like(img) * self.alpha
img = torch.clamp(img, 0., 1.)
return F.to_pil_image(img)
class Erase:
def __init__(self, value):
self.value = value
def __call__(self, img):
img = F.to_tensor(img)
H, W = img.size()[-2:]
lui = torch.randint(0, H, (1,)).item()
luj = torch.randint(0, W, (1,)).item()
rbi = torch.randint(lui, H, (1,)).item()
rbj = torch.randint(luj, W, (1,)).item()
h = rbj - luj
w = rbi - lui
return F.to_pil_image(F.erase(img, lui, luj, h, w, 0))
class Perspective:
def __init__(self, startpoints, endpoints, interpolation=3):
self.startpoints = startpoints
self.endpoints = endpoints
self.interpolation = interpolation
def __call__(self, img):
return F.perspective(img, self.startpoints,
self.endpoints, self.interpolation)
Translate = special(transforms.RandomAffine, "Translate", degrees = 0)
Scale = special(transforms.RandomAffine, "Scale", degrees = 0)
Shear = special(transforms.RandomAffine, "Shear", degrees=0)
Rotate = special(transforms.RandomAffine, "Rotate")
Brightness = special(transforms.ColorJitter, "Brightness")
Contrast = special(transforms.ColorJitter, "Contrast")
Saturation = special(transforms.ColorJitter, "Saturation")
Hue = special(transforms.ColorJitter, "Hue")
Crop = transforms.RandomCrop
class Augmix:
def __init__(self, ops, k=3, alpha=1, beta=1):
self.ops = ops
self.k = k
if isinstance(alpha, Iterable):
self.alpha = alpha
else:
self.alpha = [alpha] * k
self.beta = beta
def get_params(self):
op1, op2, op3 = random.sample(self.ops, 3)
op12 = transforms.Compose([op1, op2])
op123 = transforms.Compose([op1, op2, op3])
return random.sample([op1, op12, op123], 1)[0]
def __call__(self, img):
weights = scipy.stats.dirichlet.rvs(self.alpha)[0]
img_tensor = F.to_tensor(img)
xaug = torch.zeros_like(img_tensor)
for i in range(self.k):
opschain = self.get_params()
temp = weights[i] * F.to_tensor(opschain(img))
xaug += temp
m = scipy.stats.beta.rvs(self.beta, self.beta, size=1)[0]
new_img = m * img_tensor + (1 - m) * xaug
return F.to_pil_image(new_img)
图片 Augmentation整理的更多相关文章
- GIF/PNG/JPG和WEBP/base64/apng图片优点和缺点整理
GIF/PNG/JPG/WEBP/APNG都是属于位图(位图 ,务必区别于矢量图): GIF/PNG和JPG这三种格式的图片被广泛应用在现今的互联网中,gif曾在过去互联网初期慢速的情况下几乎是做到了 ...
- Base64 字符串转图片 问题整理汇总
前言 最近碰到了一些base64字符串转图片的开发任务,开始觉得没啥难度,但随着开发的进展还是发现有些东西需要记录下. Base64 转二进制 这个在net有现有方法调用: Convert.FromB ...
- GIF/PNG/JPG和WEBP/base64/apng图片优点和缺点整理(转)
如何获取图片对应的base64字符串呢? 1:使用代码获取: 运行下面代码 var reader = new FileReader(), htmlImage; reader.onload = func ...
- python 指定日期图片文件删除
手机使用python操作图片文件 起因 前几天去国图拍了一本书,一本心理学方面的书,也许你问我为什么不去买一本,或者去网上找pdf. 其实吧,关于心理学方面的书可以说在市面上一抓就是一堆,至于拍这本书 ...
- 基础学习笔记之opencv(6):实现将图片生成视频
基础学习笔记之opencv(6):实现将图片生成视频 在做实验的过程中.难免会读视频中的图片用来处理,相反将处理好的图片又整理输出为一个视频文件也是非经常常使用的. 以下就来讲讲基于opencv的C+ ...
- 个人永久性免费-Excel催化剂功能第54波-批量图片导出,调整大小等
图片作为一种数据存在,较一般的存放在Excel单元格或其他形式存在的文本数据,对其管理更为不易,特别是仅有Excel原生的简单的插入图片功能时,Excel催化剂已全面覆盖图片数据的使用场景,无论是图片 ...
- 了解JS压缩图片,这一篇就够了
前言 公司的移动端业务需要在用户上传图片是由前端压缩图片大小,再上传到服务器,这样可以减少移动端上行流量,减少用户上传等待时长,优化用户体验. 插播一下,本文案例已整理成插件,已上传npm ,可通过 ...
- Google 云计算中的 GFS 体系结构
google 公司的很多业务具有数据量巨大的特点,为此,google 公司研发了云计算技术.google 云计 算结构中的 google 文件系统是其云计算技术中的三大法宝之一.本文主要介 ...
- 使用MVVM-Sidekick开发Universal App(二)
上一篇文章已经建立了基本的实体类,并且搞定了多语言的问题,以后在app里用字符串的时候就可以从资源文件中取了.现在继续进行. 一.添加一个页面 CurrencyExchanger首页是一个货币兑换的列 ...
随机推荐
- 在idea的java开发中字符串length()方法获取长度与赋值不符的问题
最近在开发中用到length()方法获取中文字符串的长度,发现获得的长度与实际不符.比如个String类型赋值为"中",但获取长度却是2. 这让我百思不得其解,后来突然想起来我在研 ...
- Spark集群环境搭建——Hadoop集群环境搭建
Spark其实是Hadoop生态圈的一部分,需要用到Hadoop的HDFS.YARN等组件. 为了方便我们的使用,Spark官方已经为我们将Hadoop与scala组件集成到spark里的安装包,解压 ...
- spring boot 之监听器ApplicationListener
监听器ApplicationListener 就是spring的监听器,能够用来监听事件,典型的观察者模式.ApplicationListener和ContextRefreshedEvent一般都是成 ...
- 【Go】【Basic】MacOS上搭建GO开发环境
1. GO下载 1.1. 下载地址:https://www.golangtc.com/download (需要科学上网) 1.1.1. PKG安装: 下载这个包:go1.9.2.darwin-amd6 ...
- AFNetworking 网络错误提示data转换字符串
AFN在进行网络交互时,有时候会碰到返回502.500.404的时候.后台的总需要你配合他查出问题所在.但是AFN在返回数据序列化时解析错误只会转成NSData类型的数据,如果直接扔给后台Data的数 ...
- 【C#】【假条生成系统】【单位剖析】如何判断在文本框输入了几个人名?
我们规定,人名和人名之间使用顿号隔开 那么, 1个人,就是0个顿号 2个人,就是1个顿号 3个人,就是2个顿号 -- 所以我们可以判断文本框中顿号的出现次数. 出现0次,则为1人,出1次,则为两人. ...
- HCL华三模拟器静态路由实验
(copy自我的其他博客网站) 拓扑如下: 实验目的:通过给A.B.C三台路由器配置静态路由,使PC1可以ping通PC2. 实验环境:Windows10 (21H1),HCL(V3.0.1) 实验步 ...
- MySQL如何把varchar类型字段转换成int类型进行倒叙排序
SELECT * FROM sheet2 t1 WHERE t1.`金额`+'0' ORDER BY t1.`金额` DESC;
- 『学了就忘』Linux系统管理 — 83、Linux中进程的查看(top命令)
目录 1.top命令介绍 2.top命令示例 3.top命令输出项解释 4.top命令常用的实例 1.top命令介绍 top命令是用来动态显示系统中进程的命令. [root@localhost ~]# ...
- JuiceFS 缓存策略详解
对于一个由对象存储和数据库组合驱动的文件系统,缓存是本地客户端与远端服务之间高效交互的重要纽带.读写的数据可以提前或者异步载入缓存,再由客户端在后台与远端服务交互执行异步上传或预取数据.相比直接与远端 ...