数据的批标准化

本篇主要讲述什么是标准化，为什么要标准化，以及如何进行标准化(添加BN层)。

1.什么是标准化

　　传统机器学习中标准化也叫做归一化。

　　一般是将数据映射到指定的范围，用于去除不同维度数据的量纲以及量纲单位(说白了就是让数据尽可能处于某个范围内)。

　　数据标准化让机器学习模型看到的不同样本彼此之间更加相似，这有助于模型的学习与对新数据的泛化。

　　常见的数据标准化形式：

　标准化：

　　　　将数据减去其平均值使其中心值为0，然后将数据除以其标准差使其标准差为1。

　　归一化：

　　　　将数据减去最小值除以最大时，使取值范围压缩到0~1之间。

　　批标准化：

　　Batch Normalization(BN)，批标准化

　　和普通的数据标准化类似，是将分散的数据统一的一种做法，也是优化神经网络的一种方法。

　　不仅在数据输入之前对数据做标准化，在网络模型的每一次变换之后都应该考虑数据的标准化。

　　即使在训练过程中，均值和方差随着时间发生变化，它也可以适应性的将数据标准化。

2.为什么要做批标准化

　批标准化解决的问题是梯度消失与梯度爆炸。

　　批标准化是一种训练优化方法。

　　梯度消失与梯度爆炸：

　　对于激活函数，之前一直使用Sigmoid函数，其函数图像成一个S型，如下所示，它会使得输出在[0, 1]之间：

$S(x) = \frac{1}{1+e^{-x}} = \frac{e^x}{e^x+1}$

　　如果我们输入的数据在0附近左右均匀分布，x的变化就会引起y的正常变化，就是一个正常的梯度变化。

　　但是，当数据全部非常大，或者非常小的时候，x上的变化几乎不会引起y的变化，训练的速度就会非常缓慢，且效果差，这种情况就称为梯度消失。同理，在其他的激活函数中，也会出现数据范围导致的梯度异常激增，x上的微小变化就会导致y的剧烈变化，从而影响训练效果，这种情况称之为梯度爆炸。

　　批标准化的好处：

　　数据预处理可以加速收敛，同理，在神经网络中使用批标准化也可以加速收敛，而且还有更多的优点。

　　1.具有正则化的效果(抑制过拟合)。

　　2.提高模型泛化能力。

　　3.允许更高的学习率从而加速收敛。

　　4.批标准化有助于梯度的传播，因此能够使用更深的网络进行训练。对于特别深的神经网络，只有包含多个Batch Normalization(BN)层才能进行训练。

3.tensorflow实现批标准化

　　Batch Normalization通常在卷积层或者全连接层之后使用(原始论文中一般是应用于卷积层或全连接层之后，在激活函数之前。但是，实际上放在激活函数之后效果可能更好)。

　　使用tf.keras.layers.Batchnormalization()来实现。

　　tf.keras.layers.Batchnormalization()不仅可以处理训练数据的均值和方差，也可以在预测时，根据训练数据均值和方差的期望值对测试数据进行处理。

　　代码：　

1 model.add(tf.keras.layers.Conv2D(64, (3, 3)))

2 model.add(tf.keras.layers.BatchNormalization())

3 model.add(tf.keras.layers.Activation('relu'))

4 #两种BN层插入方式

5 model.add(tf.keras.layers.Conv2D(64, (3, 3), activation = 'relu'))

6 model.add(tf.keras.layers.BatchNormalization())

Tensorflow学习笔记No.6的更多相关文章

Tensorflow学习笔记2：About Session, Graph, Operation and Tensor
简介上一篇笔记:Tensorflow学习笔记1:Get Started 我们谈到Tensorflow是基于图(Graph)的计算系统.而图的节点则是由操作(Operation)来构成的,而图的各个节 ...
Tensorflow学习笔记2019.01.22
tensorflow学习笔记2 edit by Strangewx 2019.01.04 4.1 机器学习基础 4.1.1 一般结构: 初始化模型参数:通常随机赋值,简单模型赋值0 训练数据:一般打乱 ...
Tensorflow学习笔记2019.01.03
tensorflow学习笔记: 3.2 Tensorflow中定义数据流图张量知识矩阵的一个超集. 超集:如果一个集合S2中的每一个元素都在集合S1中,且集合S1中可能包含S2中没有的元素,则集合S ...
TensorFlow学习笔记之--[compute_gradients和apply_gradients原理浅析]
I optimizer.minimize(loss, var_list) 我们都知道,TensorFlow为我们提供了丰富的优化函数,例如GradientDescentOptimizer.这个方法会自 ...
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识
深度学习-tensorflow学习笔记(1)-MNIST手写字体识别预备知识在tf第一个例子的时候需要很多预备知识. tf基本知识香农熵交叉熵代价函数cross-entropy 卷积神经网络 s ...
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了这里直接上代码 # -*- ...
tensorflow学习笔记(4)-学习率
tensorflow学习笔记(4)-学习率首先学习率如下图所以在实际运用中我们会使用指数衰减的学习率在tf中有这样一个函数 tf.train.exponential_decay(learning ...
tensorflow学习笔记(3)前置数学知识
tensorflow学习笔记(3)前置数学知识首先是神经元的模型接下来是激励函数神经网络的复杂度计算层数:隐藏层+输出层总参数=总的w+b 下图为2层如下图 w为3*4+4个 b为4* ...
tensorflow学习笔记(2)-反向传播
tensorflow学习笔记(2)-反向传播反向传播是为了训练模型参数,在所有参数上使用梯度下降,让NN模型在的损失函数最小损失函数:学过机器学习logistic回归都知道损失函数-就是预测值和真 ...
tensorflow学习笔记(1)-基本语法和前向传播
tensorflow学习笔记(1) (1)tf中的图图中就是一个计算图,一个计算过程. 图中的constant是个常量计 ...

随机推荐

shader变体
unity shader 变种(多重编译 multi_compile) https://www.jianshu.com/p/f34d896dde5d Unity Shader - Making mul ...
[HGAME] Week1 Web WriteUp
一 .Cosmos的博客打开题目之后,首页直接给了我们提示: 版本管理工具常用的有git和svn两种,这里提示了GitHub,考虑Git信息泄露,先访问/.git/目录考虑用Githack获取泄露信 ...
烂大街的 Spring 循环依赖问题，你觉得自己会了吗
文章已收录在 GitHub JavaKeeper ,N 线互联网开发.面试必备技能兵器谱,笔记自取. 微信搜「 JavaKeeper 」程序员成长充电站,互联网技术武道场.无套路领取 500+ 本电子 ...
Python实践项目2
#南昌理工学院人工智能学院实验室WORKSHOP实践项目 import time import random SCRIPT_NPC_SCHOOL_SISTER = ['你好!', '你好!', '你是 ...
nginx -s reload 导致的错误
C:\pleiades\nginx-1.16.1_3\nginx-1.16.1>nginx -s reload nginx: [error] CreateFile() "C:\plei ...
一个极简Jsp工程下载
下载地址:https://files.cnblogs.com/files/xiandedanteng/SimpleJspWebApp20191227.zip 要得到war文件,右键点项目->Ex ...
【Java】一句话获得你的IP地址
System.out.println(java.net.InetAddress.getLocalHost().getHostAddress());
vue父子组件状态同步的最佳方式
哈喽!大家好!我是木瓜太香,一位老牌儿前端工程师,平时我们在使用 vue 开发的时候,可能会遇到需要父组件与子组件某个状态需要同步的情况,通常这个是因为我们封装组件的时候有一个相同的状态外面要用,里面 ...
LAMP环境之编译安装httpd服务
“Apache HTTP Server”是开源软件项目的杰出代表,它基于标准的 HTTP 网络协议提供网页浏览服务. 在配置 Apache 网站服务之前,需要正确安装好 httpd 服务器软件.htt ...
Linux：安装禅道
一.准备工作禅道安装包ZenTaoPMS.8.1.3.zbox_64.gz,上传至服务器:rz命令解压到指定目录 tar -zxvf ZenTaoPMS.8.1.3.zbox_64.gz -C ...

Tensorflow学习笔记No.6

数据的批标准化

1.什么是标准化

常见的数据标准化形式：

批标准化：

2.为什么要做批标准化

梯度消失与梯度爆炸：

批标准化的好处：

3.tensorflow实现批标准化

Tensorflow学习笔记No.6的更多相关文章

随机推荐

热门专题

　　常见的数据标准化形式：

　　批标准化：

　　梯度消失与梯度爆炸：

　　批标准化的好处：