BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

https://blog.csdn.net/liuxiao214/article/details/81037416

http://www.dataguru.cn/article-13032-1.html

1. BatchNormalization

实现时，对axis = 0维度求均值和方差 -> 对一个batch求均值和方差

(Tensorflow代码)

 def Batchnorm_simple_for_train(x, gamma, beta, bn_param):

 """

 param:x    : 输入数据，设shape(B,L)

 param:gama : 缩放因子  γ

 param:beta : 平移因子  β

 param:bn_param   : batchnorm所需要的一些参数

     eps      : 接近0的数，防止分母出现0

     momentum : 动量参数，一般为0.9， 0.99， 0.999

     running_mean ：滑动平均的方式计算新的均值，训练时计算，为测试数据做准备

     running_var  : 滑动平均的方式计算新的方差，训练时计算，为测试数据做准备

 """

     running_mean = bn_param['running_mean']  #shape = [B]

     running_var = bn_param['running_var']    #shape = [B]

     results = 0. # 建立一个新的变量

     x_mean=x.mean(axis=0)  # 计算x的均值

     x_var=x.var(axis=0)    # 计算方差

     x_normalized=(x-x_mean)/np.sqrt(x_var+eps)       # 归一化

     results = gamma * x_normalized + beta            # 缩放平移

     running_mean = momentum * running_mean + (1 - momentum) * x_mean

     running_var = momentum * running_var + (1 - momentum) * x_var

     #记录新的值

     bn_param['running_mean'] = running_mean

     bn_param['running_var'] = running_var 

     return results , bn_param

2. LayerNormaliztion

实现时，对axis = 1维度求均值和方差 -> 对一个样例的所有features的值求均值和方差

(Pytorch 代码，来自The Annotated Transformer)

 class LayerNorm(nn.Module):

     "Construct a layernorm module (See citation for details)."

     def __init__(self, features, eps=1e-6):

         super(LayerNorm, self).__init__()

         self.a_2 = nn.Parameter(torch.ones(features))

         self.b_2 = nn.Parameter(torch.zeros(features))

         self.eps = eps

     def forward(self, x):

         mean = x.mean(-1, keepdim=True)

         std = x.std(-1, keepdim=True)

         return self.a_2 * (x - mean) / (std + self.eps) + self.b_2

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结的更多相关文章

深度学习中的Normalization模型
Batch Normalization(简称 BN)自从提出之后,因为效果特别好,很快被作为深度学习的标准工具应用在了各种场合.BN 大法虽然好,但是也存在一些局限和问题,诸如当 BatchSize ...
[优化]深度学习中的 Normalization 模型
来源:https://www.chainnews.com/articles/504060702149.htm 机器之心专栏作者:张俊林 Batch Normalization (简称 BN)自从提出 ...
BatchNormalization的使用
# import BatchNormalization from keras.layers.normalization import BatchNormalization # instantiate ...
BatchNormalization批量归一化
动机: 防止隐层分布多次改变,BN让每个隐层节点的激活输入分布缩小到-1和1之间. 好处: 缩小输入空间,从而降低调参难度:防止梯度爆炸/消失,从而加速网络收敛. BN计算公式: keras.laye ...
batch-normalization为什么效果好
batch-normalization为什么效果好深度学习中 Batch Normalization为什么效果好? - 龙鹏-言有三的回答 - 知乎 https://www.zhihu.com/qu ...
torch_12_dataset和dataLoader，Batchnormalization解读
参考博客https://blog.csdn.net/qq_36556893/article/details/86505934 深度学习入门之pytorch https://github.com/L1a ...
Inception系列之Batch-Normalization
训练深度神经网络非常复杂,因为在训练过程中,随着先前各层的参数发生变化,各层输入的分布也会发生变化,图层输入分布的变化带来了一个问题,因为图层需要不断适应新的分布,因此训练变得复杂,随着网络变得更深, ...
keras BatchNormalization 之坑
任务简述:最近做一个图像分类的任务, 一开始拿vgg跑一个baseline,输出看起来很正常: 随后,我尝试其他的一些经典的模型架构,比如resnet50, xception,但训练输出显示明显异常: ...
深度学习中 --- 解决过拟合问题（dropout, batchnormalization）
过拟合,在Tom M.Mitchell的<Machine Learning>中是如何定义的:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比 ...

随机推荐

C++练习 | 文件流应用（1）
#include <iostream> #include <cmath> #include <cstring> #include <string> #i ...
JavaScript更改css样式
来源:https://www.w3school.com.cn/js/js_htmldom_css.asp 1, document.getElementById(id).style.property = ...
idea 去除重复代码提醒
103、Swarm如何管理存储数据？（Swarm10）
参考https://www.cnblogs.com/CloudMan6/p/8000906.html Service 的容器副本会 scale up/down ,会 failover,会在不同的主 ...
debezium关于cdc的使用(下)
博文原址:debezium关于cdc的使用(下) 简介 debezium在debezium关于cdc的使用(上)中有做介绍.具体可以跳到上文查看.本篇主要讲述使用kafka connector方式来同 ...
第十五篇 JS 移入移出事件模拟一个二级菜单
JS 移入移出事件模拟一个二级菜单老师演示一个特别简单二级菜单,同学们除了学习JS,还要注意它的元素和CSS样式. 这节课介绍的是JS鼠标移入.移出事件:onmouseover是移入事件,on ...
TensorFlow入门——hello
上一节说了TensorFlow的安装,这一节说一下测试的问题新建一个Python文件,输入 import tensorflow as tf hello = tf .constant (’Hello, ...
点击切换JS
$(function(){ var tabnav = $("#tab-nav ul li"); tabnav.click(function(){ $(this).addClass( ...
php 多肽实例
多态定义:只关心一个接口或者基类,而不关心一个对象的具体类.(同一类型,不同结果) 这里两个例子: 第一个,我们发现,基类定义了标准,子类进行了自我规则的实现.这是多态的一个要求.同时,这是满足重写: ...
nginx服务学习第一章
一.ubuntu系统安装nginx服务 # apt-get install nginx 二.nginx.config配置文件详解配置文件结构: 全局块(全局变量) events{ } http{ h ...

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结

1. BatchNormalization

2. LayerNormaliztion

BatchNormalization、LayerNormalization、InstanceNorm、GroupNorm、SwitchableNorm总结的更多相关文章

随机推荐

热门专题