『计算机视觉』imgaug图像增强库中部分API简介

介绍一下官方demo中用到的几个变换，工程README.md已经给出了API简介，个人觉得不好理解，特此单独记录一下：

import numpy as np

import imgaug as ia

import imgaug.augmenters as iaa

# random example images

images = np.random.randint(0, 255, (16, 128, 128, 3), dtype=np.uint8)

# Sometimes(0.5, ...) applies the given augmenter in 50% of all cases,

# e.g. Sometimes(0.5, GaussianBlur(0.3)) would blur roughly every second image.

sometimes = lambda aug: iaa.Sometimes(0.5, aug)

# Define our sequence of augmentation steps that will be applied to every image

# All augmenters with per_channel=0.5 will sample one value _per image_

# in 50% of all cases. In all other cases they will sample new values

# _per channel_.

seq = iaa.Sequential(

    [

        # apply the following augmenters to most images

        iaa.Fliplr(0.5), # horizontally flip 50% of all images

        iaa.Flipud(0.2), # vertically flip 20% of all images

        # crop images by -5% to 10% of their height/width

        sometimes(iaa.CropAndPad(

            percent=(-0.05, 0.1),

            pad_mode=ia.ALL,

            pad_cval=(0, 255)

        )),

        sometimes(iaa.Affine(

            scale={"x": (0.8, 1.2), "y": (0.8, 1.2)}, # scale images to 80-120% of their size, individually per axis

            translate_percent={"x": (-0.2, 0.2), "y": (-0.2, 0.2)}, # translate by -20 to +20 percent (per axis)

            rotate=(-45, 45), # rotate by -45 to +45 degrees

            shear=(-16, 16), # shear by -16 to +16 degrees

            order=[0, 1], # use nearest neighbour or bilinear interpolation (fast)

            cval=(0, 255), # if mode is constant, use a cval between 0 and 255

            mode=ia.ALL # use any of scikit-image's warping modes (see 2nd image from the top for examples)

        )),

        # execute 0 to 5 of the following (less important) augmenters per image

        # don't execute all of them, as that would often be way too strong

        iaa.SomeOf((0, 5),

            [

                sometimes(iaa.Superpixels(p_replace=(0, 1.0), n_segments=(20, 200))), # convert images into their superpixel representation

                iaa.OneOf([

                    iaa.GaussianBlur((0, 3.0)), # blur images with a sigma between 0 and 3.0

                    iaa.AverageBlur(k=(2, 7)), # blur image using local means with kernel sizes between 2 and 7

                    iaa.MedianBlur(k=(3, 11)), # blur image using local medians with kernel sizes between 2 and 7

                ]),

                iaa.Sharpen(alpha=(0, 1.0), lightness=(0.75, 1.5)), # sharpen images

                iaa.Emboss(alpha=(0, 1.0), strength=(0, 2.0)), # emboss images

                # search either for all edges or for directed edges,

                # blend the result with the original image using a blobby mask

                iaa.SimplexNoiseAlpha(iaa.OneOf([

                    iaa.EdgeDetect(alpha=(0.5, 1.0)),

                    iaa.DirectedEdgeDetect(alpha=(0.5, 1.0), direction=(0.0, 1.0)),

                ])),

                iaa.AdditiveGaussianNoise(loc=0, scale=(0.0, 0.05*255), per_channel=0.5), # add gaussian noise to images

                iaa.OneOf([

                    iaa.Dropout((0.01, 0.1), per_channel=0.5), # randomly remove up to 10% of the pixels

                    iaa.CoarseDropout((0.03, 0.15), size_percent=(0.02, 0.05), per_channel=0.2),

                ]),

                iaa.Invert(0.05, per_channel=True), # invert color channels

                iaa.Add((-10, 10), per_channel=0.5), # change brightness of images (by -10 to 10 of original value)

                iaa.AddToHueAndSaturation((-20, 20)), # change hue and saturation

                # either change the brightness of the whole image (sometimes

                # per channel) or change the brightness of subareas

                iaa.OneOf([

                    iaa.Multiply((0.5, 1.5), per_channel=0.5),

                    iaa.FrequencyNoiseAlpha(

                        exponent=(-4, 0),

                        first=iaa.Multiply((0.5, 1.5), per_channel=True),

                        second=iaa.ContrastNormalization((0.5, 2.0))

                    )

                ]),

                iaa.ContrastNormalization((0.5, 2.0), per_channel=0.5), # improve or worsen the contrast

                iaa.Grayscale(alpha=(0.0, 1.0)),

                sometimes(iaa.ElasticTransformation(alpha=(0.5, 3.5), sigma=0.25)), # move pixels locally around (with random strengths)

                sometimes(iaa.PiecewiseAffine(scale=(0.01, 0.05))), # sometimes move parts of the image around

                sometimes(iaa.PerspectiveTransform(scale=(0.01, 0.1)))

            ],

            random_order=True

        )

    ],

    random_order=True

)

images_aug = seq.augment_images(images)

Superpixels：生成随机数量的超像素区域，对原图进行替换，直观效果是原图部分区域变得模糊

各种blur：模糊，对应几种滤波操作

sharp：字面意思，锐化

emboss：压印浮凸字体(或图案); 凹凸印

EdgeDetect：边缘检测

DirectedEdgeDetect：边缘检测，只检测某些方向的，直观来看和上面的比检测出来的数目会少很多

DropOut：随机丢弃像素

CoarseDropout：随机丢弃某位置某通道像素

Invert：有一定几率将batch中的图片像素取反（或者特定通道取反）

Add：像素值成比例增加/减小（特指亮度）

AddToHueAndSaturation：增加色相、饱和度

Multiply：每个像素随机乘一个数（各不相图），造成局部变亮、局部变暗

ContrastNormalization：调整对比度，0.5表示和128的差值部分会处以2降低对比度

FrequencyNoiseAlpha：参数需要两个增强函数，本函数会混合两个增强函数增强后的结果

Grayscale：灰度图和原图的混合（1意味着全灰度）

『计算机视觉』imgaug图像增强库中部分API简介的更多相关文章

『计算机视觉』Mask-RCNN_训练网络其三：训练Model
Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mask-RCNN_推断网络其一:总览『计算机视觉』M ...
『计算机视觉』Mask-RCNN_从服装关键点检测看KeyPoints分支
下图Github地址:Mask_RCNN Mask_RCNN_KeyPoints『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mas ...
『计算机视觉』Mask-RCNN_训练网络其二：train网络结构&损失函数
Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mask-RCNN_推断网络其一:总览『计算机视觉』M ...
『计算机视觉』Mask-RCNN_训练网络其一：数据集与Dataset类
Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mask-RCNN_推断网络其一:总览『计算机视觉』M ...
『计算机视觉』Mask-RCNN_锚框生成
Github地址:Mask_RCNN 『计算机视觉』Mask-RCNN_论文学习『计算机视觉』Mask-RCNN_项目文档翻译『计算机视觉』Mask-RCNN_推断网络其一:总览『计算机视觉』M ...
『计算机视觉』Mask-RCNN_推断网络终篇：使用detect方法进行推断
一.detect和build 前面多节中我们花了大量笔墨介绍build方法的inference分支,这节我们看看它是如何被调用的. 在dimo.ipynb中,涉及model的操作我们简单进行一下汇总, ...
『计算机视觉』Mask-RCNN_推断网络其六：Mask生成
一.Mask生成概览上一节的末尾,我们已经获取了待检测图片的分类回归信息,我们将回归信息(即待检测目标的边框信息)单独提取出来,结合金字塔特征mrcnn_feature_maps,进行Mask生成工 ...
『计算机视觉』Mask-RCNN_推断网络其四：FPN和ROIAlign的耦合
一.模块概述上节的最后,我们进行了如下操作获取了有限的proposal, # [IMAGES_PER_GPU, num_rois, (y1, x1, y2, x2)] # IMAGES_PER_GP ...
『计算机视觉』Mask-RCNN_推断网络其三：RPN锚框处理和Proposal生成
一.RPN锚框信息生成上文的最后,我们生成了用于计算锚框信息的特征(源代码在inference模式中不进行锚框生成,而是外部生成好feed进网络,training模式下在向前传播时直接生成锚框,不过 ...

随机推荐

VIJOS-P1423 最佳路线
VIJOS-P1423 最佳路线 JDOJ 1507 https://neooj.com/oldoj/problem.php?id=1507 Description 年久失修的赛道令国际汽联十分不满. ...
shell 脚本 for，while，case 语句详解及案例
################for循环语句的结构#############使用for循环语句时,需要指定一个变量及可能的取值列表,针对每个不同的取值重复执行相同的命令序列,直到变量值用完退出循环. ...
luoguP4213 【模板】杜教筛（Sum）杜教筛
链接 luogu 思路为了做hdu来学杜教筛. 杜教筛模板题. 卡常数,我加了register居然跑到不到800ms. 太深了. 代码 // luogu-judger-enable-o2 #incl ...
Philosopher（set 线段树合并）
直接维护乘积是肯定不可行的, 精度会爆炸, 于是我们来维护对数的和, 最后来计算最高位即可那么转换成区间求和, 区间排序区间排序的方式可以采用线段树维护最大递增块来解决,外层用set来维护线段树的 ...
Linux性能优化实战学习笔记：第四十二讲
一.上节回顾上一节,我们学习了 NAT 的原理,明白了如何在 Linux 中管理 NAT 规则.先来简单复习一下. NAT 技术能够重写 IP 数据包的源 IP 或目的 IP,所以普遍用来解决公网 ...
Linux网络编程综合运用之MiniFtp实现(一)
春节过后,万物复苏,在这元宵佳节的前一天,决定继续开启新年的学习计划,生命在于运动,提高源于学习,在经过漫长的Linux网络编程学习后,接下来会以一个综合的小项目来将所学的知识点综合运用,首先是对项目 ...
申请Github学生包(用学生证就行，免教育邮箱)
GitHub教育包的福利: 大名鼎鼎的JetBrains给学生教师的免费个人许可 https://education.github.com/pack/redeem/jetbrains 有Github学 ...
oracle-报错 RMAN-03002,RMAN-06172
RMAN> restore standby controlfile from "/data/oracle/contral.ctl"; Starting restore at ...
动手学深度学习1- pytorch初学
pytorch 初学 Tensors 创建空的tensor 创建随机的一个随机数矩阵创建0元素的矩阵直接从已经数据创建tensor 创建新的矩阵计算操作加法操作转化形状 tensor 与nu ...
Beta冲刺(6/7)——2019.5.28
作业描述课程软件工程1916|W(福州大学) 团队名称修!咻咻! 作业要求项目Beta冲刺(团队) 团队目标切实可行的计算机协会维修预约平台开发工具 Eclipse 团队信息队员学号队 ...

『计算机视觉』imgaug图像增强库中部分API简介

『计算机视觉』imgaug图像增强库中部分API简介的更多相关文章

随机推荐

热门专题