opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转

面试问到了，让手撕数据增强，图片+标签。这里整理一下，直接上代码。

import math

import cv2

import numpy as np

def pan(img, anns, size=(50, 100)):

    '''

    :param img: np.ndarray[h,w,c]

    :param anns: np.ndarray[n,4]

    :param size: list[shift_x, shift_y]

    '''

    shift_x, shift_y = size

    h, w, _ = img.shape

    M = np.array([[1, 0, shift_x], [0, 1, shift_y]], dtype=np.float32)  # 平移矩阵

    img_change = cv2.warpAffine(img, M, (w, h))

    anns_change = anns + np.array([shift_x, shift_y, shift_x, shift_y])

    return img_change, anns_change

def flip(img, anns, flip_code=0):

    # flip_code: 1:水平翻转, 0:垂直翻转, -1:水平垂直翻转

    h, w, _ = img.shape

    img_change = cv2.flip(img, flipCode=flip_code)

    anns_change = anns.copy()

    if flip_code == 1:

        anns_change[:, 0], anns_change[:, 2] = w - anns_change[:, 2], w - anns_change[:, 0]

    elif flip_code == 0:

        anns_change[:, 1], anns_change[:, 3] = h - anns_change[:, 3], h - anns_change[:, 1]

    else:

        anns_change[:, 0], anns_change[:, 2] = w - anns_change[:, 2], w - anns_change[:, 0]

        anns_change[:, 1], anns_change[:, 3] = h - anns_change[:, 3], h - anns_change[:, 1]

    anns_change = np.int32(anns_change)

    return img_change, anns_change

def resize(img, anns, scale=(2, 1)):

    h, w, _ = img.shape

    scale_x, scale_y = scale

    anns_change = anns.copy()

    M = np.array([[scale_x, 0, 0], [0, scale_y, 0]], dtype=np.float32)  # 缩放矩阵

    img_change = cv2.warpAffine(img, M, (int(w * scale_x), int(h * scale_y)))

    anns_change[:, 0], anns_change[:, 2] = anns_change[:, 0] * scale_x, anns_change[:, 2] * scale_x

    anns_change[:, 1], anns_change[:, 3] = anns_change[:, 1] * scale_y, anns_change[:, 3] * scale_y

    anns_change = np.int32(anns_change)

    return img_change, anns_change

def rotate(img, anns, center=(0, 0), angle=-45, scale=1):

    # scale为缩放比例，默认为1，也就是不缩放。 图像旋转+缩放，bboxes对不上，暂时不知道怎么解决。有人知道的话，请评论区告诉我，感谢。

    angle_pi = -angle * math.pi / 180.0  # 弧度

    h, w, _ = img.shape

    M = cv2.getRotationMatrix2D(center, angle, scale)

    img_change = cv2.warpAffine(img, M, (w, h))

    anns_change = anns.copy() * scale

    x1, y1, x2, y2 = anns_change[:, 0], anns_change[:, 1], anns_change[:, 2], anns_change[:, 3]

    x3, y3, x4, y4 = x1, y2, x2, y1

    x1_ = (x1 - center[0]) * math.cos(angle_pi) - (y1 - center[1]) * math.sin(angle_pi) + center[0]

    y1_ = (x1 - center[0]) * math.sin(angle_pi) + (y1 - center[1]) * math.cos(angle_pi) + center[1]

    x2_ = (x2 - center[0]) * math.cos(angle_pi) - (y2 - center[1]) * math.sin(angle_pi) + center[0]

    y2_ = (x2 - center[0]) * math.sin(angle_pi) + (y2 - center[1]) * math.cos(angle_pi) + center[1]

    x3_ = (x3 - center[0]) * math.cos(angle_pi) - (y3 - center[1]) * math.sin(angle_pi) + center[0]

    y3_ = (x3 - center[0]) * math.sin(angle_pi) + (y3 - center[1]) * math.cos(angle_pi) + center[1]

    x4_ = (x4 - center[0]) * math.cos(angle_pi) - (y4 - center[1]) * math.sin(angle_pi) + center[0]

    y4_ = (x4 - center[0]) * math.sin(angle_pi) + (y4 - center[1]) * math.cos(angle_pi) + center[1]

    xs, ys = np.array([x1_, x2_, x3_, x4_]), np.array([y1_, y2_, y3_, y4_])

    xmin, xmax = np.amin(xs, axis=0), np.amax(xs, axis=0)

    ymin, ymax = np.amin(ys, axis=0), np.amax(ys, axis=0)

    anns_change = np.array(list(zip(xmin, ymin, xmax, ymax)))  # 4个[2] ---》 [2, 4]

    anns_change = np.int32(anns_change)

    return img_change, anns_change

if __name__ == '__main__':

    img = cv2.imread("head.jpg")		# 测试图片

    anns = np.array([[180, 100, 250, 150], [340, 100, 380, 150]])	# 测试bbox

    for i in anns:

        cv2.rectangle(img, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("origin", img)

    # 移动

    img1, anns1 = pan(img, anns)

    for i in anns1:

        cv2.rectangle(img1, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("pan", img1)

    # 翻转

    img2, anns2 = flip(img, anns)

    for i in anns2:

        cv2.rectangle(img2, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("flip", img2)

    # 缩放

    img3, anns3 = resize(img, anns)

    for i in anns3:

        cv2.rectangle(img3, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("resize", img3)

    # 旋转，anns4是下面可视化中蓝色框

    img4, anns4 = rotate(img, anns, center=(img.shape[1] // 2, img.shape[0] // 2))  # 中心旋转

    # img4, anns4 = rotate(img, anns)                                               # 左上角旋转

    for i in anns4:

        cv2.rectangle(img4, (i[0], i[1]), (i[2], i[3]), (255, 0, 0), 2)

    cv2.imshow("rotate", img4)

    cv2.waitKey(0)

结果展示：

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转的更多相关文章

数据增强（每10度进行旋转，进行一次增强，然后对每张图片进行扩充10张patch，最后得到原始图片数*37*10数量的图片）
# -*- coding: utf-8 -*-"""Fourmi Editor This is a temporary script file.""& ...
Java图片缩略图裁剪水印缩放旋转压缩转格式-Thumbnailator图像处理
前言 java开发中经常遇到对图片的处理,JDK中也提供了对应的工具类,不过处理起来很麻烦,Thumbnailator是一个优秀的图片处理的开源Java类库,处理效果远比Java API的好,从API ...
【C#/WPF】Image图片的Transform变换：平移、缩放、旋转
WPF中图像控件Image的变换属性Transform: 平移缩放旋转即要想实现图片的平移.缩放.旋转,是修改它所在的Image控件的Transform变换属性. 下面在XAML中定义了Imag ...
Python库 - Albumentations 图片数据增强库
Python图像处理库 - Albumentations,可用于深度学习中网络训练时的图片数据增强. Albumentations 图像数据增强库特点: 基于高度优化的 OpenCV 库实现图像快速数 ...
(转)如何用TensorLayer做目标检测的数据增强
数据增强在机器学习中的作用不言而喻.和图片分类的数据增强不同,训练目标检测模型的数据增强在对图像做处理时,还需要对图片中每个目标的坐标做相应的处理.此外,位移.裁剪等操作还有可能使得一些目标在处理后只 ...
图像数据增强 (Data Augmentation in Computer Vision)
1.1 简介深层神经网络一般都需要大量的训练数据才能获得比较理想的结果.在数据量有限的情况下,可以通过数据增强(Data Augmentation)来增加训练样本的多样性, 提高模型鲁棒性,避免过拟 ...
Deep Learning -- 数据增强
数据增强在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强,数据增强,常用的方式,就是旋转图像,剪切图像,改变图像色差,扭曲图像特 ...
【Tool】Augmentor和imgaug——python图像数据增强库
Augmentor和imgaug--python图像数据增强库 Tags: ComputerVision Python 介绍两个图像增强库:Augmentor和imgaug,Augmentor使用比较 ...
data argumentation 数据增强汇总
几何变换 flip:水平翻转,也叫镜像:垂直翻转 rotation:图片旋转一定的角度,这个可以通过opencv来操作,各个框架也有自己的算子 crop:随机裁剪,比如说,在ImageNet中可以将输 ...
YoloV4当中的Mosaic数据增强方法（附代码详细讲解）码农的后花园
上一期中讲解了图像分类和目标检测中的数据增强的区别和联系,这期讲解数据增强的进阶版- yolov4中的Mosaic数据增强方法以及CutMix. 前言 Yolov4的mosaic数据增强参考了CutM ...

随机推荐

树形dp套路
我们知道dp也就是动态规划的思想就是先解决小问题,通过不断的解决小问题,最终解决大问题.那么能够应用树形dp套路的题目都应该符合一个条件,那就是通过解决每个子树的小问题,最终解决整棵树的大问题. 套路 ...
vscode ctrl + d 删除当前行更改快捷键
vscode 删除当前行更改快捷键
import.meta.globEager('./src/components/**/*.vue'); 遍历文件
main.js const importAll = (modules) => { Object.keys(modules).forEach((key) => { const compone ...
多线程系列(十九) -Future使用详解
一.摘要在前几篇线程系列文章中,我们介绍了线程池的相关技术,任务执行类只需要实现Runnable接口,然后交给线程池,就可以轻松的实现异步执行多个任务的目标,提升程序的执行效率,比如如下异步执行任务 ...
Github下载release附件变相提速方法
最近找到了个油猴插件,下载2M/s,推荐大家使用Github 镜像访问,加速下载描述 github上面有许多开源的软件,作者们都打包发布为release版本,我们可以下载打包好的软件,但是,由于国内 ...
安装swagger过程及遇到问题
参考:欢迎点击原文:https://www.cnblogs.com/liconglong/p/11477401.html(主要) https://blog.csdn.net/liangjiabao55 ...
微信小程序开发：异步处理接入的生成式图像卡通化
书接上文,我们完成了对接阿里云人像动漫化接口,现已完成的界面是这样的: 就是效果看着一般,看看效果: 然后我就在阿里云api市场转悠,就想看看还有没有什么其他奇奇怪怪的api,结果就发现了这个: ap ...
ElasticSearch 准实时原理
Elasticsearch 是一个基于 Lucene 库的搜索引擎.它提供了一个准实时的.分布式.支持多租户的全文搜索引擎. ----维基百科那么问题来了,为啥 Elasticsearch 不是实时 ...
三维模型3DTile格式轻量化在数据存储的重要性分析
三维模型3DTile格式轻量化在数据存储的重要性分析三维模型3DTile格式轻量化在数据存储中占有重要地位.随着科技的不断发展,尤其是空间信息科技的进步,人们对于三维地理空间数据的需求日益增长.然而 ...
Linux快速入门(八)效率工具(SSH)
环境 (1)Kali(源主机),IP:10.211.55.4/24 (2)Ubuntu(目标主机),IP:10.211.55.5/24 SSH OpenSSH用于在远程系统上安全的运行Shell,假设 ...

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转的更多相关文章

随机推荐

热门专题