opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转

面试问到了，让手撕数据增强，图片+标签。这里整理一下，直接上代码。

import math

import cv2

import numpy as np

def pan(img, anns, size=(50, 100)):

    '''

    :param img: np.ndarray[h,w,c]

    :param anns: np.ndarray[n,4]

    :param size: list[shift_x, shift_y]

    '''

    shift_x, shift_y = size

    h, w, _ = img.shape

    M = np.array([[1, 0, shift_x], [0, 1, shift_y]], dtype=np.float32)  # 平移矩阵

    img_change = cv2.warpAffine(img, M, (w, h))

    anns_change = anns + np.array([shift_x, shift_y, shift_x, shift_y])

    return img_change, anns_change

def flip(img, anns, flip_code=0):

    # flip_code: 1:水平翻转, 0:垂直翻转, -1:水平垂直翻转

    h, w, _ = img.shape

    img_change = cv2.flip(img, flipCode=flip_code)

    anns_change = anns.copy()

    if flip_code == 1:

        anns_change[:, 0], anns_change[:, 2] = w - anns_change[:, 2], w - anns_change[:, 0]

    elif flip_code == 0:

        anns_change[:, 1], anns_change[:, 3] = h - anns_change[:, 3], h - anns_change[:, 1]

    else:

        anns_change[:, 0], anns_change[:, 2] = w - anns_change[:, 2], w - anns_change[:, 0]

        anns_change[:, 1], anns_change[:, 3] = h - anns_change[:, 3], h - anns_change[:, 1]

    anns_change = np.int32(anns_change)

    return img_change, anns_change

def resize(img, anns, scale=(2, 1)):

    h, w, _ = img.shape

    scale_x, scale_y = scale

    anns_change = anns.copy()

    M = np.array([[scale_x, 0, 0], [0, scale_y, 0]], dtype=np.float32)  # 缩放矩阵

    img_change = cv2.warpAffine(img, M, (int(w * scale_x), int(h * scale_y)))

    anns_change[:, 0], anns_change[:, 2] = anns_change[:, 0] * scale_x, anns_change[:, 2] * scale_x

    anns_change[:, 1], anns_change[:, 3] = anns_change[:, 1] * scale_y, anns_change[:, 3] * scale_y

    anns_change = np.int32(anns_change)

    return img_change, anns_change

def rotate(img, anns, center=(0, 0), angle=-45, scale=1):

    # scale为缩放比例，默认为1，也就是不缩放。 图像旋转+缩放，bboxes对不上，暂时不知道怎么解决。有人知道的话，请评论区告诉我，感谢。

    angle_pi = -angle * math.pi / 180.0  # 弧度

    h, w, _ = img.shape

    M = cv2.getRotationMatrix2D(center, angle, scale)

    img_change = cv2.warpAffine(img, M, (w, h))

    anns_change = anns.copy() * scale

    x1, y1, x2, y2 = anns_change[:, 0], anns_change[:, 1], anns_change[:, 2], anns_change[:, 3]

    x3, y3, x4, y4 = x1, y2, x2, y1

    x1_ = (x1 - center[0]) * math.cos(angle_pi) - (y1 - center[1]) * math.sin(angle_pi) + center[0]

    y1_ = (x1 - center[0]) * math.sin(angle_pi) + (y1 - center[1]) * math.cos(angle_pi) + center[1]

    x2_ = (x2 - center[0]) * math.cos(angle_pi) - (y2 - center[1]) * math.sin(angle_pi) + center[0]

    y2_ = (x2 - center[0]) * math.sin(angle_pi) + (y2 - center[1]) * math.cos(angle_pi) + center[1]

    x3_ = (x3 - center[0]) * math.cos(angle_pi) - (y3 - center[1]) * math.sin(angle_pi) + center[0]

    y3_ = (x3 - center[0]) * math.sin(angle_pi) + (y3 - center[1]) * math.cos(angle_pi) + center[1]

    x4_ = (x4 - center[0]) * math.cos(angle_pi) - (y4 - center[1]) * math.sin(angle_pi) + center[0]

    y4_ = (x4 - center[0]) * math.sin(angle_pi) + (y4 - center[1]) * math.cos(angle_pi) + center[1]

    xs, ys = np.array([x1_, x2_, x3_, x4_]), np.array([y1_, y2_, y3_, y4_])

    xmin, xmax = np.amin(xs, axis=0), np.amax(xs, axis=0)

    ymin, ymax = np.amin(ys, axis=0), np.amax(ys, axis=0)

    anns_change = np.array(list(zip(xmin, ymin, xmax, ymax)))  # 4个[2] ---》 [2, 4]

    anns_change = np.int32(anns_change)

    return img_change, anns_change

if __name__ == '__main__':

    img = cv2.imread("head.jpg")		# 测试图片

    anns = np.array([[180, 100, 250, 150], [340, 100, 380, 150]])	# 测试bbox

    for i in anns:

        cv2.rectangle(img, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("origin", img)

    # 移动

    img1, anns1 = pan(img, anns)

    for i in anns1:

        cv2.rectangle(img1, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("pan", img1)

    # 翻转

    img2, anns2 = flip(img, anns)

    for i in anns2:

        cv2.rectangle(img2, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("flip", img2)

    # 缩放

    img3, anns3 = resize(img, anns)

    for i in anns3:

        cv2.rectangle(img3, (i[0], i[1]), (i[2], i[3]), (0, 0, 255), 2)

    cv2.imshow("resize", img3)

    # 旋转，anns4是下面可视化中蓝色框

    img4, anns4 = rotate(img, anns, center=(img.shape[1] // 2, img.shape[0] // 2))  # 中心旋转

    # img4, anns4 = rotate(img, anns)                                               # 左上角旋转

    for i in anns4:

        cv2.rectangle(img4, (i[0], i[1]), (i[2], i[3]), (255, 0, 0), 2)

    cv2.imshow("rotate", img4)

    cv2.waitKey(0)

结果展示：

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转的更多相关文章

数据增强（每10度进行旋转，进行一次增强，然后对每张图片进行扩充10张patch，最后得到原始图片数*37*10数量的图片）
# -*- coding: utf-8 -*-"""Fourmi Editor This is a temporary script file.""& ...
Java图片缩略图裁剪水印缩放旋转压缩转格式-Thumbnailator图像处理
前言 java开发中经常遇到对图片的处理,JDK中也提供了对应的工具类,不过处理起来很麻烦,Thumbnailator是一个优秀的图片处理的开源Java类库,处理效果远比Java API的好,从API ...
【C#/WPF】Image图片的Transform变换：平移、缩放、旋转
WPF中图像控件Image的变换属性Transform: 平移缩放旋转即要想实现图片的平移.缩放.旋转,是修改它所在的Image控件的Transform变换属性. 下面在XAML中定义了Imag ...
Python库 - Albumentations 图片数据增强库
Python图像处理库 - Albumentations,可用于深度学习中网络训练时的图片数据增强. Albumentations 图像数据增强库特点: 基于高度优化的 OpenCV 库实现图像快速数 ...
(转)如何用TensorLayer做目标检测的数据增强
数据增强在机器学习中的作用不言而喻.和图片分类的数据增强不同,训练目标检测模型的数据增强在对图像做处理时,还需要对图片中每个目标的坐标做相应的处理.此外,位移.裁剪等操作还有可能使得一些目标在处理后只 ...
图像数据增强 (Data Augmentation in Computer Vision)
1.1 简介深层神经网络一般都需要大量的训练数据才能获得比较理想的结果.在数据量有限的情况下,可以通过数据增强(Data Augmentation)来增加训练样本的多样性, 提高模型鲁棒性,避免过拟 ...
Deep Learning -- 数据增强
数据增强在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强,数据增强,常用的方式,就是旋转图像,剪切图像,改变图像色差,扭曲图像特 ...
【Tool】Augmentor和imgaug——python图像数据增强库
Augmentor和imgaug--python图像数据增强库 Tags: ComputerVision Python 介绍两个图像增强库:Augmentor和imgaug,Augmentor使用比较 ...
data argumentation 数据增强汇总
几何变换 flip:水平翻转,也叫镜像:垂直翻转 rotation:图片旋转一定的角度,这个可以通过opencv来操作,各个框架也有自己的算子 crop:随机裁剪,比如说,在ImageNet中可以将输 ...
YoloV4当中的Mosaic数据增强方法（附代码详细讲解）码农的后花园
上一期中讲解了图像分类和目标检测中的数据增强的区别和联系,这期讲解数据增强的进阶版- yolov4中的Mosaic数据增强方法以及CutMix. 前言 Yolov4的mosaic数据增强参考了CutM ...

随机推荐

Mysql数据库未添加索引引发的生产事故
最近开发的新功能主要是首页的红点提示功能,某个用户登录系统app,然后进入某一个功能模块, 在该功能下面有很多地方可以操作,新功能就是根据用户信息查询当月是否存在新的数据.总共有四五个地方如果出现增 ...
hire 聘用受雇租金单词记忆
hire 基本解释 vt. 聘用:录用:雇用:租用 vi. 受雇:得到工作 n. 租金:酬金,工钱:[非正式用语] 被雇佣的人:销售部的两个新雇员来自Proto-Germanic*hurjan,租, ...
manjaro安装/卸载gnome/kde桌面环境
安装gnome桌面环境步骤 1. 在运行以下教程之前,请确保我们的系统是最新的: sudo pacman -Syu 步骤 2. 在 Manjaro 20 上安装 GNOME 桌面. 现在我们通过执行 ...
在运行程序是出现sh: 行 1: cls: 未找到命令
在运行程序是出现sh: 行 1: cls: 未找到命令原因是system("cls");--这是在程序中调用系统命令,但是linux识别不了.功能是清除当前的终端显示数据.找到l ...
python3 Crypto模块实例解析
一模块简介 1.简介 python的Crypto模块是安全hash函数(例如SHA256 和RIPEMD160)以及各种主流的加解密算法的((AES, DES, RSA, ElGamal等)的集合. ...
用免费GPU部署自己的stable-diffusion-学习笔记
最近由于工作需要,开始学习AI+大模型,零基础,听从同事的推荐报名参加了一个免费学习团队,本文是整理的一些学习笔记. 课程是趋动云提供支持的,在注册时赠送了足够学习使用的188算力.项目在趋动云上可以 ...
java之Timer类使用方法小例子
直接上代码: package com.iamzken.test; import java.util.Timer; import java.util.TimerTask; public class Te ...
CloudXR技术如何运用于农业？
随着科技的不断发展和应用的深入,农业领域也在逐渐引入新技术来优化生产效率和成本.改进管理和监控等.云化XR(CloudXR)作为一种融合了云计算.虚拟现实(VR)和增强现实(AR)等技术的解决方案,也 ...
C#调用C++ （使用C++/CLI）
简介 C++/CLI(C++ Common Language Infrastructure)是一种允许在 .NET 平台上创建托管代码(managed code)和非托管代码(unmanaged co ...
【K8S】Docker向私有仓库拉取/推送镜像报错（http: server gave HTTP response to HTTPS client）
这里,我们搭建的Harbor仓库的地址为 http://192.168.175.101:1180. 报错信息如下所示. [root@binghe101 ~]# docker login 192.168 ...

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转

opencv实现数据增强（图片+标签）平移，翻转，缩放，旋转的更多相关文章

随机推荐

热门专题