deep_learning_Function_bath

关于归一化的讲解的博客——【深度学习】Batch Normalization（批归一化）

tensorflow实现代码在这个博客——【超分辨率】TensorFlow中批归一化的实现——tf.layers.batch_normalization()函数

tf.nn.batch_normalization()函数用于执行批归一化。

# 用于最中执行batch normalization的函数
tf.nn.batch_normalization(
    x,
    mean,
    variance,
    offset,
    scale,
    variance_epsilon,
    name=None
)
1
2
3
4
5
6
7
8
9
10
参数：

x是input输入样本

mean是样本均值

variance是样本方差

offset是样本偏移(相加一个转化值)

scale是缩放（默认为1）

variance_epsilon是为了避免分母为0，添加的一个极小值

输出的计算公式为：
y=scale∗(x−mean)/var+offset y = scale * (x - mean) / var + offset
y=scale∗(x−mean)/var+offset

这里安利一个简单讲述batch normalization的文章，还有相应的代码，通俗易懂。

tensorflow-BatchNormalization（tf.nn.moments及tf.nn.batch_normalization）
————————————————
原文链接：https://blog.csdn.net/TeFuirnever/article/details/88911995

批标准化

批标准化（batch normalization，BN）一般用在激活函数之前，使结果x=Wx+bx=Wx+b 各个维度均值为0，方差为1。通过规范化让激活函数分布在线性区间，让每一层的输入有一个稳定的分布会有利于网络的训练。
优点：
加大探索步长，加快收敛速度。
更容易跳出局部极小。
破坏原来的数据分布，一定程度上防止过拟合。
解决收敛速度慢和梯度爆炸。
tensorflow相应API

mean, variance = tf.nn.moments(x, axes, name=None, keep_dims=False)
计算统计矩，mean 是一阶矩即均值，variance 则是二阶中心矩即方差，axes=[0]表示按列计算；
tf.nn.batch_normalization(x, mean, variance, offset, scale, variance_epsilon, name=None)
tf.nn.batch_norm_with_global_normalization(x, mean, variance, beta, gamma, variance_epsilon, scale_after_normalization, name=None)；
tf.nn.moments 计算返回的 mean 和 variance 作为 tf.nn.batch_normalization 参数调用；
tensorflow及python实现

import tensorflow as tf

W = tf.constant([[-2.,12.,6.],[3.,2.,8.]], )

mean,var = tf.nn.moments(W, axes = [0])

with tf.Session() as sess:

    sess.run(tf.global_variables_initializer())

    resultMean = sess.run(mean)

    print(resultMean)

    resultVar = sess.run(var)

    print(resultVar)

[ 0.5  7.   7. ]

[  6.25  25.     1.  ]

计算每个列的均值及方差。

size = 3

scale = tf.Variable(tf.ones([size]))

shift = tf.Variable(tf.zeros([size]))

epsilon = 0.001

W = tf.nn.batch_normalization(W, mean, var, shift, scale, epsilon)

#参考下图BN的公式，相当于进行如下计算

#W = (W - mean) / tf.sqrt(var + 0.001)

#W = W * scale + shift

with tf.Session() as sess:

    #必须要加这句不然执行多次sess会报错

    sess.run(tf.global_variables_initializer())

    resultW = sess.run(W)

    print(resultW)

#观察初始W第二列 12>2 返回BN的W值第二列第二行是负的，其余两列相反

[[-0.99992001  0.99997997 -0.99950027]

 [ 0.99991995 -0.99997997  0.99950027]]

Bug
Attempting to use uninitialized value Variable_8：

#运行sess.run之前必须要加这句不然执行多次sess会报错

sess.run(tf.global_variables_initializer())

参考
深度学习Deep Learning（05）：Batch Normalization(BN)批标准化
谈谈Tensorflow的Batch Normalization
tensorflow 的 Batch Normalization 实现（tf.nn.moments、tf.nn.batch_normalization）
————————————————
原文链接：https://blog.csdn.net/eclipsesy/article/details/77597965

tensorflow 在实现 Batch Normalization（各个网络层输出的归一化）时，主要用到以下两个 api：

tf.nn.moments(x, axes, name=None, keep_dims=False) ⇒ mean, variance：
统计矩，mean 是一阶矩，variance 则是二阶中心矩
tf.nn.batch_normalization(x, mean, variance, offset, scale, variance_epsilon, name=None)
https://www.tensorflow.org/api_docs/python/tf/nn/batch_normalization
γ⋅x−μσ+β \gamma\cdot\frac{x-\mu}{\sigma}+\beta

γ 表示 scale 缩放因子，β \betaβ 表示偏移量；
tf.nn.batch_norm_with_global_normalization(t, m, v, beta, gamma, variance_epsilon, scale_after_normalization, name=None)
由函数接口可知，tf.nn.moments 计算返回的 mean 和 variance 作为 tf.nn.batch_normalization 参数进一步调用；
1. tf.nn.moments，矩
tf.nn.moments 返回的 mean 表示一阶矩，variance 则是二阶中心矩；
如我们需计算的 tensor 的 shape 为一个四元组 [batch_size, height, width, kernels]，一个示例程序如下：

import tensorflow as tf

shape = [128, 32, 32, 64]

a = tf.Variable(tf.random_normal(shape))        # a：activations

axis = list(range(len(shape)-1))                # len(x.get_shape())

a_mean, a_var = tf.nn.moments(a, axis)

这里我们仅给出 a_mean, a_var 的维度信息，

sess = tf.Session()

sess.run(tf.global_variables_initalizer())

sess.run(a_mean).shape        # (64, )

sess.run(a_var).shape        # (64, )    ⇒ 也即是以 kernels 为单位，batch 中的全部样本的均值与方差

2. demo

def batch_norm(x):

    epsilon = 1e-3

    batch_mean, batch_var = tf.nn.moments(x, [0])

    return tf.nn.batch_normalization(x, batch_mean, batch_var,

                    offset=None, scale=None,

                    variance_epsilon=epsilon)

references

<a href=“http://www.jianshu.com/p/0312e04e4e83”, target="_blank">谈谈Tensorflow的Batch Normalization
————————————————
原文链接：https://blog.csdn.net/lanchunhui/article/details/70792458

deep_learning_Function_bath_normalization()的更多相关文章

随机推荐

DDNS是动态域名解析的意思
目前大部分家庭使用PPPOE拨号方式上网,每次上网获得的IP都是随机变换的,但是家里的网络监控.智能设备需要通过网络访问,每次使用都需要先知道IP非常麻烦. 有了DDNS动态域名解析,我们只要到花生壳 ...
ASP.Net Core承载外部程序集
故事背景一般情况下ASP.Net Core项目配置可以直接在appsetting.json中添加,也可以在项目中添加新的配置文件.但如果想和其他项目一起实现配置文件通用呢?我们可以用绝对定位去访 ...
（转）MongoDB 分片集群技术
1.1 MongoDB复制集简介一组Mongodb复制集,就是一组mongod进程,这些进程维护同一个数据集合.复制集提供了数据冗余和高等级的可靠性,这是生产部署的基础. 1.1.1 复制集的目的 ...
Excel不同版本差异性
apache poi-3.16.jar /* ==================================================================== Licensed ...
用xcode打包完成,出现的Archive界面怎么打开？
要出现这个界面只需在xcode界面进入windows 的下拉菜单Organizer
【HANA系列】【第三篇】SAP HANA XS的JavaScript安全事项
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[HANA系列][第三篇]SAP HANA XS ...
JVM配置参数解析
1.参数说明(部分,待完善) -Xms128M:JVM初始分配的堆内存 -Xmx256M:JVM最大允许分配的堆内存,按需分配 -XX:PermSize=64M: JVM初始分配的非堆内存 -XX:M ...
FTP简单搭建（二）
六.配套设置 1.基于用户名的上传和下载创建用户 useradd alex echo redhat |passwd --stdin alex 指定用户登录的路径可不设置,不设置则为用户家目录 mk ...
NOIp2015D1T3 斗地主【暴搜】
题目传送门刚开始读到题目的时候,非常懵逼,非常崩溃,写着写着呢,也有点崩溃,细节有点多. 这个做法呢,只能过掉官方数据,洛谷上好像有加强版,只能得$86$分,就没有管了. 大概说一下思路: 暴力搜索 ...
【Python开发】Url中文字符时记得转码edcode("utf-8")
在url中使用中文其实是一个坏习惯,会带来一系列的转码问题, 我更喜欢英文译名或者id来标识某个uri.但是现实往往是残酷的, 特别是在我们调用别人服务时候,有时候被逼无奈使用中文URL. Pytho ...

deep_learning_Function_bath_normalization()

deep_learning_Function_bath_normalization()的更多相关文章

随机推荐

热门专题