神经网络初始化：xavier，kaiming、ortho正交初始化在CNN网络中的使用

xavier、ortho是神经网络中常用的权重初始化方法，在全连接中这两种权重初始化的方法比较好理解，但是在CNN的卷积网络中的具体实现却不好理解了。

在CNN网络中xavier的初始化可以参看：

【转载】 xavier，kaiming初始化中的fan_in,fan_out在卷积神经网络是什么意思

也就是说在CNN中avier的初始化的所用的参数取值为：

fan_in指 kernel_height x kernel_width x in_channel 。

fan_out指 kernel_height x kernel_width x
out_channel 。

那么在CNN网络中正交初始化是如何实现的呢？

使用TensorFlow查看文档：

tf.orthogonal_initializer

在CNN网络中主要参看：

给出baselines强化学习算法库的orthogonal_initializer实现：

def ortho_init(scale=1.0):

    def _ortho_init(shape, dtype, partition_info=None):

        # lasagne ortho init for tf

        shape = tuple(shape)

        if len(shape) == 2:

            flat_shape = shape

        elif len(shape) == 4:  # assumes NHWC

            flat_shape = (np.prod(shape[:-1]), shape[-1])

        else:

            raise NotImplementedError

        a = np.random.normal(0.0, 1.0, flat_shape)

        u, _, v = np.linalg.svd(a, full_matrices=False)

        q = u if u.shape == flat_shape else v  # pick the one with the correct shape

        q = q.reshape(shape)

        return (scale * q[:shape[0], :shape[1]]).astype(np.float32)

    return _ortho_init

适配CNN网络的代码为：

elif len(shape) == 4:  # assumes NHWC

    flat_shape = (np.prod(shape[:-1]), shape[-1])

=================================================

补充资料：

https://blog.csdn.net/yhwangk/article/details/116280492

-------------------------------------------------

初始化方法的原始论文：

https://arxiv.org/pdf/1312.6120.pdf

神经网络初始化：xavier，kaiming、ortho正交初始化在CNN网络中的使用的更多相关文章

权值初始化 - Xavier和MSRA方法
设计好神经网络结构以及loss function 后,训练神经网络的步骤如下: 初始化权值参数选择一个合适的梯度下降算法(例如:Adam,RMSprop等) 重复下面的迭代过程: 输入的正向传播计 ...
神经网络训练技巧：训练参数初始化、Drop out及Batch Normalization
参数初始化: xavier初始化: https://blog.csdn.net/VictoriaW/article/details/73000632 条件:优秀的初始化应该使得各层的激活值和梯度的方差 ...
C++:用成员初始化列表对数据成员初始化
1.在声明类时,对数据成员的初始化工作一般在构造函数中用赋值语句进行. 例如: class Complex{ private: double real; double imag; public: Co ...
内存管理初始化（五）kmem_cache_init 初始化slab分配器(上)
看了下kmem_cache_init,涉及到不同MIGRATE间的buddy system的迁移,kmem_cache的构建,slab分配器头的构建.buddy system的伙伴拆分. 对于SMP系 ...
Java类的初始化与实例对象的初始化
Java对象初始化详解 2013/04/10 · 开发 · 1 评论· java 分享到:43 与<YII框架>不得不说的故事—扩展篇 sass进阶篇 Spring事务管理 Android ...
C++使用初始化列表的方式来初始化字段
几个月之前,接触Android recovery源代码的时候,看ScreenRecoveryUI类的时候,那时候C++基础还不是特别好,一直不明白以下的初始化方式: 下面这个是Recovery的一个构 ...
Java类成员变量、普通成员变量、初始化块、构造方法的初始化和执行顺序
结论:执行的大致顺序如下, (1) 在一个不存在继承的类中:初始化static变量,执行static初始化块-->初始化普通成员变量(如果有赋值语句),执行普通初始化块-->构造方法 (2 ...
tensorflow实现一个神经网络简单CNN网络
本例子用到了minst数据库,通过训练CNN网络,实现手写数字的预测. 首先先把数据集读取到程序中(MNIST数据集大约12MB,如果没在文件夹中找到就会自动下载): mnist = input_da ...
MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 在前两篇文章MINIST深度学习识别:python全连接神经网络和pytorch LeNet CNN网 ...
思考卷积神经网络（CNN）中各种意义
原文:https://blog.csdn.net/aimreant/article/details/53145063 思考卷积神经网络(CNN)中各种意义只是知道CNN是不够,我们需要对其进行解剖, ...

随机推荐

work04
第一题: 分析以下需求,并用代码实现(每个小需求都需要封装成方法) 1.求两个数据之和(整数小数),在main方法中打印出来 2.判断两个数据是否相等(整数小数),在控制台上打印出来 3.获取两个 ...
uniapp 使用z-paging 分页组件写在头部插槽内的单选按钮无法点击
这个问题是因为组件层级太低 <z-paging ref="paging" v-model="dataList" @query="queryLis ...
UBI 文件系统的支持与有关文件系统的image的制作
背景 UBI文件系统是一种较新类型的文件系统. 内核支持 Symbol: MTD_UBI [=y] Type : tristate Prompt: Enable UBI - Unsorted bloc ...
java 编程思想--个人总结
从应用开始思考----思考解题思路--将思路分解成一步一步的步骤-----根据每一步的步骤思考如何用代码实现-- -- 不要心急,可以一块一块来完成-- 最后再思考如何用代码实现每两块之间的连接--- ...
MyBatis学习篇
什么是MyBatis (1)Mybatis是一个半ORM(对象关系映射)框架,它内部封装了JDBC,开发时只需要关注SQL语句本身,不需要花费精力去处理加载驱动.创建连接.创建statement等繁杂 ...
如何让 3D 数字孪生场景闪闪发光
今日图扑软件功能分享:我们将探讨 HT 系统如何通过分组管理灯光.裁切体和流光,以提高场景光影效果的精准度和整体可控性. HT 中的灯光.裁切体.流光是会影响它所在区域一定范围内的其他节点的表现,如 ...
推荐几款个人喜欢的IDEA开发工具主题【更舒适的开发】
IDEA,全称 IntelliJ IDEA ,是Java语言的集成开发环境,IDEA在业界被公认为是最好的 java 开发工具之一,尤其在智能代码助手.代码自动提示.重构.J2EE支持. Ant . ...
解决方案 | vbnet的msgbox 窗口最前置，topmost属性设置
For that you can use the TopMost Property of MsgBox (Number 262144) MsgBox("Hello there", ...
在Django中，多数据操作，你可以编写测试来查询另一个数据库服务器中的数据，并将结果导入当前Django项目的数据库表中
在Django中,你可以编写测试来查询另一个数据库服务器中的数据,并将结果导入当前Django项目的数据库表中.下面是一个简单的示例: 假设你有一个Django应用程序,名为myapp,并且你希望从另 ...
[oeasy]python0010_怎么用命令行保存文件
编写 py 文件回忆上次内容上次真的输出了程序员的浪漫 Hello world! print函数可以输出字符串但是 print这个词别拼错就连大小写也别能错错了就改也没事 ...

神经网络初始化：xavier，kaiming、ortho正交初始化在CNN网络中的使用

【转载】 xavier，kaiming初始化中的fan_in,fan_out在卷积神经网络是什么意思

神经网络初始化：xavier，kaiming、ortho正交初始化在CNN网络中的使用的更多相关文章

随机推荐

热门专题