init.uniform / unit.normal
均匀分布
nn.init.uniform(tensor,a=0,b=1)
tensor -n维的torch.Tensor
a 均匀分布的下界,默认值为0
b 均匀分布的上界,默认值为1 正态分布
torcn.nn.init.normal(tensor,mean=0,std=1)
tensor n维的torch.Tensor
mean 正太分布的均值
std 正太分布的标准差
import torch
import torch.nn as nn import warnings
warnings.filterwarnings("ignore") w=torch.Tensor(3,5) # x_uniform=nn.init.uniform(tensor=w,a=2,b=6)
x_uniform=nn.init.uniform(tensor=w)
print("x_uniform",x_uniform) # x_normal=nn.init.normal(tensor=w,mean=10,std=2)
x_normal=nn.init.normal(tensor=w)
print("x_normal",x_normal) #xavier_uniform=nn.init.xavier_uniform(tensor=w,gain=1)
xavier_uniform=nn.init.xavier_uniform(tensor=w,gain=nn.init.calculate_gain('relu'))
print("xavier_uniform",xavier_uniform) #xavier_normal=nn.init.xavier_normal(tensor=w,gain=1)
xavier_normal=nn.init.xavier_normal(tensor=w,gain=nn.init.calculate_gain('relu'))
print("xavier_normal",xavier_normal) '''
x_uniform tensor([[0.2816, 0.4711, 0.8996, 0.7330, 0.5513],
[0.5623, 0.0418, 0.7624, 0.5373, 0.6279],
[0.1240, 0.9987, 0.3897, 0.9821, 0.1776]])
x_normal tensor([[-0.8959, 0.4796, -1.3757, -1.1037, 2.0843],
[ 0.0715, 0.4563, 1.2856, -0.9393, 0.1773],
[-0.9491, 0.0170, -0.8944, 0.7141, 1.3373]])
xavier_uniform tensor([[ 0.7476, -0.5736, -0.1695, 0.5489, -0.0284],
[ 1.0224, -0.8135, 0.1688, 0.3294, 0.4330],
[-1.1458, -0.4438, 0.5714, -0.9706, -1.0764]])
xavier_normal tensor([[ 0.3797, 0.4196, 1.0782, 0.0434, 0.6576],
[-0.2319, -0.1747, -0.9296, -0.8965, 0.3372],
[ 0.0703, 0.6307, -0.0976, 0.4038, -0.6067]]) '''
init.uniform / unit.normal的更多相关文章
- pytorch系列 -- 9 pytorch nn.init 中实现的初始化函数 uniform, normal, const, Xavier, He initialization
本文内容:1. Xavier 初始化2. nn.init 中各种初始化函数3. He 初始化 torch.init https://pytorch.org/docs/stable/nn.html#to ...
- nginx unit的初探
安装介绍: https://www.oschina.net/p/nginx-unit 可以看到,unit还是很强大的,居然特么都支持go 还有python 在/etc/yum.repos.d/unit ...
- 学习笔记TF037:实现强化学习策略网络
强化学习(Reinforcement Learing),机器学习重要分支,解决连续决策问题.强化学习问题三概念,环境状态(Environment State).行动(Action).奖励(Reward ...
- C++ Style Languages: C++, Objective-C, Java, C#
Hyperpolyglot.org From Hyperpolyglot.org C++ Style Languages: C++, Objective-C, Java, C# a side-by-s ...
- <<Differential Geometry of Curves and Surfaces>>笔记
<Differential Geometry of Curves and Surfaces> by Manfredo P. do Carmo real line Rinterval I== ...
- 基于pytorch的CNN、LSTM神经网络模型调参小结
(Demo) 这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN.LSTM.BiLSTM.GRU以及CNN与LSTM.BiLSTM的结合还有多层多通道CNN.LSTM. ...
- Keras框架简介
Keras是基于Theano的一个深度学习框架,它的设计参考了Torch,用Python语言编写,是一个高度模块化的神经网络库,支持GPU和CPU.使用文档在这:http://keras.io/,中文 ...
- <Differential Geometry of Curves and Surfaces>(by Manfredo P. do Carmo) Notes
<Differential Geometry of Curves and Surfaces> by Manfredo P. do Carmo real line Rinterval I== ...
- 详细解读简单的lstm的实例
http://blog.csdn.net/zjm750617105/article/details/51321889 本文是初学keras这两天来,自己仿照addition_rnn.py,写的一个实例 ...
随机推荐
- BCNF/3NF 数据库设计范式简介
数据库设计有1NF.2NF.3NF.BCNF.4NF.5NF.从左往右,越后面的数据库设计范式冗余度越低. 满足后一个设计范式也必定满足前一个设计范式. 1NF只要求每个属性是不可再分的,基本每个数据 ...
- nodejs之express中间件路由使用
1.express 中间件使用 /* * 中间件:就是匹配路由之前和匹配路由之后做的一系列操作 */ var express = require('express'); var app = new e ...
- Windows环境下Mysql 5.7读写分离之使用mysql-proxy练习篇
本文使用mysql-proxy软件,结合mysql读写分离,实现实战练习. 前期准备: 三台机器: 代理机,IP:192.168.3.33 mysql Master,IP:192.168.3.32 m ...
- 通过wscript运行的JS脚本,如何引入另一个JS文件
链接: https://helloacm.com/include-external-files-in-vbscriptjscript-wsh/ 代码示例: function Include(jsFil ...
- Spring-QUARTZ定时任务demo
Quartz定时任务demo下载: https://github.com/AliceSunCong/quartz 大致流程: **1.pom文件引入QUARTZ依赖** <dependency& ...
- C++随笔(1)——关于C++11中的线程创建,join和detach
主要是和之前的博文有关,之前在这里有一部分代码是通过创建新的进程来应对新的用户请求的,但是基本没怎么解释怎么用的,所以这里做点小笔记. join 首先引入的库: #include <thread ...
- Spring cloud 项目———酷派手机商城 (话术)1.0
酷派电商网站 描述: 随着电子商务的发展,网上购物正在趋于一种时尚,电子商务网站也逐渐成为企业顺应潮流的标配.大多数人知道可能在电子商务网站前端有查询,注册登录,购物车等等功能.可是您知道建设电子商 ...
- C++ 结构体重载运算符
听说这个东西有很多种写法什么的,来不及了(要退役了),先整一个之前用到的,可能用到的频率比较高的东西上来. struct node{ ll x,y; }; bool operator < (co ...
- 小记---------FLUM的三种配置方式:spooldir、exec、hadoop sink
FLUM概述 是一个分布式的数据收集系统,具有高可靠.高可用.事务管理.失败重启等功能,数据处理速度快,完全可以用于生产环境 核心:agent(是FLUM的一个代号,名字 ).age ...
- computer(树形dp || 树的直径)
Computer Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Su ...