深度学习 | 训练网络trick—

1.mixup原理介绍

mixup 论文地址

mixup是一种非常规的数据增强方法，一个和数据无关的简单数据增强原则，其以线性插值的方式来构建新的训练样本和标签。最终对标签的处理如下公式所示，这很简单但对于增强策略来说又很不一般。

，两个数据对是原始数据集中的训练样本对（训练样本和其对应的标签）。其中是一个服从B分布的参数,

。Beta分布的概率密度函数如下图所示，其中

因此，α 是一个超参数，随着α的增大，网络的训练误差就会增加，而其泛化能力会随之增强。而当 α→∞ 时，模型就会退化成最原始的训练策略。

2.mixup的代码实现

如下代码所示，实现mixup数据增强很简单，其实我个人认为这就是一种抑制过拟合的策略，增加了一些扰动，从而提升了模型的泛化能力。

def get_batch(x, y, step, batch_size, alpha=0.2):

    """

    get batch data

    :param x: training data

    :param y: one-hot label

    :param step: step

    :param batch_size: batch size

    :param alpha: hyper-parameter α, default as 0.2

    :return:

    """

    candidates_data, candidates_label = x, y

    offset = (step * batch_size) % (candidates_data.shape[0] - batch_size)

    # get batch data

    train_features_batch = candidates_data[offset:(offset + batch_size)]

    train_labels_batch = candidates_label[offset:(offset + batch_size)]

    # 最原始的训练方式

    if alpha == 0:

        return train_features_batch, train_labels_batch

    # mixup增强后的训练方式

    if alpha > 0:

        weight = np.random.beta(alpha, alpha, batch_size)

        x_weight = weight.reshape(batch_size, 1, 1, 1)

        y_weight = weight.reshape(batch_size, 1)

        index = np.random.permutation(batch_size)

        x1, x2 = train_features_batch, train_features_batch[index]

        x = x1 * x_weight + x2 * (1 - x_weight)

        y1, y2 = train_labels_batch, train_labels_batch[index]

        y = y1 * y_weight + y2 * (1 - y_weight)

        return x, y

3.mixup增强效果展示

import matplotlib.pyplot as plt

import matplotlib.image as Image

import numpy as np

im1 = Image.imread(r"C:\Users\Daisy\Desktop\1\xyjy.png")

im2 = Image.imread(r"C:\Users\Daisy\Desktop\1\xyjy2.png")

for i in range(1,10):

    lam= i*0.1

    im_mixup = (im1*lam+im2*(1-lam))

    plt.subplot(3,3,i)

    plt.imshow(im_mixup)

plt.show()

————————————————————

后来又发现一篇好文：https://www.zhihu.com/question/308572298?sort=created

深度学习 | 训练网络trick——mixup的更多相关文章

中文译文：Minerva-一种可扩展的高效的深度学习训练平台（Minerva - A Scalable and Highly Efficient Training Platform for Deep Learning）
Minerva:一个可扩展的高效的深度学习训练平台 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2015-12-1 声明 ...
TensorRT深度学习训练和部署图示
TensorRT深度学习训练和部署 NVIDIA TensorRT是用于生产环境的高性能深度学习推理库.功率效率和响应速度是部署的深度学习应用程序的两个关键指标,因为它们直接影响用户体验和所提供服务的 ...
基于NVIDIA GPUs的深度学习训练新优化
基于NVIDIA GPUs的深度学习训练新优化 New Optimizations To Accelerate Deep Learning Training on NVIDIA GPUs 不同行业采用 ...
MLPerf结果证实至强® 可有效助力深度学习训练
MLPerf结果证实至强可有效助力深度学习训练核心与视觉计算事业部副总裁Wei Li通过博客回顾了英特尔这几年为提升深度学习性能所做的努力. 目前根据英特尔至强可扩展处理器的MLPerf结果显 ...
java web应用调用python深度学习训练的模型
之前参见了中国软件杯大赛,在大赛中用到了深度学习的相关算法,也训练了一些简单的模型.项目线上平台是用java编写的web应用程序,而深度学习使用的是python语言,这就涉及到了在java代码中调用p ...
深度学习训练过程中的学习率衰减策略及pytorch实现
学习率是深度学习中的一个重要超参数,选择合适的学习率能够帮助模型更好地收敛. 本文主要介绍深度学习训练过程中的6种学习率衰减策略以及相应的Pytorch实现. 1. StepLR 按固定的训练epoc ...
【Deeplearning】（转）深度学习知识网络
转自深度学习知识框架,小象牛逼! 图片来自小象学院公开课,下面直接解释几条线神经网络线性回归 (+ 非线性激励) → 神经网络有线性映射关系的数据,找到映射关系,非常简单,只能描述简单的映射关系 ...
一天搞懂深度学习-训练深度神经网络(DNN)的要点
前言这是<一天搞懂深度学习>的第二部分一.选择合适的损失函数典型的损失函数有平方误差损失函数和交叉熵损失函数. 交叉熵损失函数: 选择不同的损失函数会有不同的训练效果二.mini- ...
深度学习卷积网络中反卷积/转置卷积的理解 transposed conv/deconv
搞明白了卷积网络中所谓deconv到底是个什么东西后,不写下来怕又忘记,根据参考资料,加上我自己的理解,记录在这篇博客里. 先来规范表达为了方便理解,本文出现的举例情况都是2D矩阵卷积,卷积输入和核 ...

随机推荐

shaderlab - 9chapter-阴影
原理相机和光源重合,相机能看到的表面,形成的深度图--叫做,阴影纹理(shadowMap). 传统的,用base和add更新深度信息,但是,此处需求是深度信息而已,掺杂了光的计算了,所以,unity ...
Spring的学习与实战(续)
@ 目录背景 JavaMailSender Spring集成邮件发送功能 1. 添加maven依赖 2. 添加Spring邮件配置 3. 创建邮件管理Bean并注入Spring应用上下文 4. 修改 ...
从零开始学Electron笔记（六）
在之前的文章我们介绍了一下Electron如何通过链接打开浏览器和嵌入网页,接下来我们继续说一下Electron中的对话框 Dialog和消息通知 Notification. 在之前的文章中其实我们是 ...
工作3年java面试题整理(自用)
基础题目 1.Java线程的状态一. 线程状态类型:1. 新建状态(New):新创建了一个线程对象.2. 就绪状态(Runnable):线程对象创建后,其他线程调用了该对象的start()方法.该 ...
软件测试工程师入门——Linux【使用说明书】
先来说一下linux是什么? linux 是一个开源.免费的操作系统,其稳定性.安全性.处理多并发已经得到业界的认可,目前很多中性,大型甚至是巨型项目都在使用linux. linux 内核:redha ...
vue : async / await 的应用
比如有组数据是很多页面都要用的,我想把它写在一个js文件里作为公共方法. public.js import axios from 'axios'; axios.defaults.headers.pos ...
Spring当中循环依赖很少有人讲，今天一起来学习！
网上关于Spring循环依赖的博客太多了,有很多都分析的很深入,写的很用心,甚至还画了时序图.流程图帮助读者理解,我看了后,感觉自己是懂了,但是闭上眼睛,总觉得还没有完全理解,总觉得还有一两个坎过不去 ...
vue学习 `${HH}-${mm}-${dd}` 按键修饰符
vue 有一种拼接字符串的规范写法 //键盘 Tab 键上边的键英文输入状态然后采用类似EL表达式${变量}return `${}:${}:${}` //有时候我们经常在输入完密码之后,按回车E ...
缓存利器、Lua模块下的共享内存
上一节讲到了worker进程的共享内存,它利用丰富的指令使数据的缓存操作变得非常简单,但它也存在一些缺点. 1．worker进程之间会有锁竞争,在高并发的情况下会增加性能开销.2．只支持Lua布尔值. ...
linux虚拟机正常安装完成后获取不到IP的解决办法-网卡
通常正常情况下安装完linux虚拟机,只需要使用桥接并修改配置文件/etc/sysconfig/network-scripts/ifcfg-eth0,将如下参数值改为如下: ONBOOT=yes NM ...

深度学习 | 训练网络trick——mixup

1.mixup原理介绍

2.mixup的代码实现

3.mixup增强效果展示

深度学习 | 训练网络trick——mixup的更多相关文章

随机推荐

热门专题