L0 pytorch 构建简单网络

本文是L0, 目的是把pytorch构建感知器的程序,仔细剖析理解。

import torch
from torch import nn
torch.__version__
'1.3.0'

STEP 1 手工定义全连接层Linear

#torch.nn是专门为深度学习设计的模块。torch.nn的核心数据结构是Module
#它是一个抽象的概念,#既可以表示神经网络中的某个层(layer),
#也可以表示一个包含很多层的神经网络
#class Linear(nn.Module):
# def __init__(self,in_dim,out_dim):
# def forward(self,x): # 手工定义全连接层,写forward
class Linear(nn.Module):
def __init__(self,in_dim,out_dim):
super(Linear,self).__init__()
#调用nn.Moudule 的初始化函数,首先找到Linear的父类nn.Moudle
#然后把类Linear的对象self转换为类nn.Moudle的对象,然后“被转换”的类nn.Moudle对象调用自己的__init__函数
#也可以写成nn.Module.__init__(self) #在构造函数__init__中必须自己定义可学习的参数,并封装成Parameter
# parameter是一种特殊的Variable,但其默认需要求导(requires_grad = True)
self.w = nn.Parameter(torch.randn(in_dim,out_dim))
self.b = nn.Parameter(torch.randn(out_dim)) def forward(self ,x):
x=x.matmul(self.w) #使用Tensor.matmul 实现w*x矩阵相乘
y=x+self.b.expand_as(x) #即 y=wx + b 使用Tensor.expand_as 保证x 和b形状一致
print("调式点1:y的输出维度为",y.shape) #测试x的维度
return y

STEP2 测试Linear 层是否能正常工作

# 初始化 Linear层结构为 4*3
layer = Linear(4, 3)
# 测试喂数据,是否有输出,理解输入输出的维度
#from torch.autograd import Variable as V
#input = V(torch.randn(2, 4))
input = torch.randn(2,4)#输入为二行样本,每行4个特征
output = layer(input) #模型每次输入4个特征,输出3个值。
print(output) # 二行样本,输出2个3维的结果,因此y的输入维度为 torch.size([2,3])
调式点1:y的输出维度为 torch.Size([2, 3])
tensor([[-1.2798, -1.4936, 0.2399],
[-1.1742, 1.2190, -2.8469]], grad_fn=<AddBackward0>)

理解

input = torch.randn(2,4)

output = layer(input)

1) 定义layer对输入形状都有假设:输入的不是单行样本数据,而是一个batch。此处batch的大小为2

2)若想输入单行样本数据 必须调用unsqueeze(0)函数将数据伪装成batch_size=1的batch。

# 原数据2*4,为batch为2,每batch数据为4维
#通过unsqueeze 将2*4的数据伪装成 1*2*4的数据,batch变成1,每个batch数据变成2*4
input = torch.randn(2,4)
input.unsqueeze(0).size()
torch.Size([1, 2, 4])

# 测试目前网络的参数,理解参数的维度
for name, param in layer.named_parameters():
print(name)
print(param)
#w 维度为4*3 b的维度为1*3
w
Parameter containing:
tensor([[-0.3579, -0.6608, 0.1783],
[ 1.6277, -0.4486, -1.9849],
[ 0.9500, -0.1879, 1.7154],
[-0.5778, -0.2012, 1.5576]], requires_grad=True)
b
Parameter containing:
tensor([-0.9491, -0.1104, -1.2390], requires_grad=True)
for name, param in layer.named_parameters():
print(name, param.size())
w torch.Size([4, 3])
b torch.Size([3])

module中parameter的命名规范:

1)对于类似self.param_name = nn.Parameter(t.randn(3, 4)),命名为param_name

2)对于子Module中的parameter,会其名字之前加上当前Module的名字。

如对于self.sub_module = SubModel(),SubModel中有个parameter的名字叫做param_name,

那么二者拼接而成的parameter name 就是sub_module.param_name。

见后续采用Linear类进一步构建多层感知器的例子

STEP3 组建 二个全连接层的感知器

class Perceptron (nn.Module):
def __init__(self, in_features, hidden_features, out_features):
super(Perceptron,self).__init__() #或写成nn.Module.__init__(self)
# 利用 Linear subModel组建 layer 1 ,layer 2
self.layer1 = Linear(in_features, hidden_features)
self.layer2 = Linear(hidden_features, out_features) def forward(self, x):
x = self.layer1(x)
x = torch.sigmoid(x)
x = self.layer2(x)
y = torch.sigmoid(x)
return y per = Perceptron(3, 4, 1)
per
Perceptron(
(layer1): Linear()
(layer2): Linear()
)
# 测试网络参数
for name, param in per.named_parameters():
print("sub_module.param_name::",name, param.size())
sub_module.param_name:: layer1.w torch.Size([3, 4])
sub_module.param_name:: layer1.b torch.Size([4])
sub_module.param_name:: layer2.w torch.Size([4, 1])
sub_module.param_name:: layer2.b torch.Size([1])

1)Module中的可学习参数可以通过**named_parameters()**或者parameters()返回迭代器,前者会给每个parameter都附上名字,使其更具有辨识度。

2)Module能够自动检测到自己的Parameter,并将其作为学习参数。

# 测试网络输入,输出
data=torch.randn(4,3)
output=per(data)
output
调式点1:y的输出维度为 torch.Size([4, 4])
调式点1:y的输出维度为 torch.Size([4, 1]) tensor([[0.5478],
[0.6146],
[0.6252],
[0.8016]], grad_fn=<SigmoidBackward>)

STEP 4 利用nn.Sequential 快速搭建网络

从上面的例子,可以看出在forward()方法中必须理解网络结构,并根据网络层次的之间的关系完成网络组装。

当模型仅仅是简单的前馈网络时,可以采用nn.Sequentail()模块来快速搭建模块,而不必手动的在forward()方法手工构建。

class Seq_Perceptron (nn.Module):

    def __init__(self, in_features, hidden_features, out_features):
super(Seq_Perceptron ,self).__init__() #或写成nn.Module.__init__(self)
# 利用 Linear subModel组建 layer 1 ,layer 2
#self.layer1 = Linear(in_features, hidden_features)
#self.layer2 = Linear(hidden_features, out_features)
self.seq_layer = nn.Sequential(
nn.Linear(in_features,hidden_features),
nn.Sigmoid(),
nn.Linear(hidden_features,out_features),
nn.Sigmoid()
) def forward(self, x):
y = self.seq_layer(x)
return y
# 测试网络输入,输出
per = Seq_Perceptron(3, 4, 1)
data=torch.randn(4,3)
output=per(data)
output
tensor([[0.5853],
[0.6061],
[0.5967],
[0.6131]], grad_fn=<SigmoidBackward>)

L0 torch 构建网络初步的更多相关文章

  1. Docker 构建网络服务后本机不能访问

    Docker 构建网络服务后本机不能访问 起因 使用tornado构建了一个服务,测试都没有问题 使用docker构建镜像,使用docker run image_name启动服务 使用浏览器访问 12 ...

  2. Pytorch_01 Tensor,Autograd,构建网络

    Tensor Tensor是PyTorch中的重要数据结构,可认为是一个高维数组,Tensor与numpy的ndarrays类似,但Tensor可以使用GPU加速 import torch as t# ...

  3. 利用sfc文件构建网络渗透

      收集哈希 SCF(Shell命令文件)文件可用于执行一组有限的操作,例如显示Windows桌面或打开Windows资源管理器,这并不是什么新鲜事.然而,一个SCF文件可以用来访问一个特定的UNC路 ...

  4. keras 学习笔记:从头开始构建网络处理 mnist

    全文参考 < 基于 python 的深度学习实战> import numpy as np from keras.datasets import mnist from keras.model ...

  5. WGCNA构建基因共表达网络详细教程

    这篇文章更多的是对于混乱的中文资源的梳理,并补充了一些没有提到的重要参数,希望大家不会踩坑. 1. 简介 1.1 背景 WGCNA(weighted gene co-expression networ ...

  6. 数据挖掘入门系列教程(十二)之使用keras构建CNN网络识别CIFAR10

    简介 在上一篇博客:数据挖掘入门系列教程(十一点五)之CNN网络介绍中,介绍了CNN的工作原理和工作流程,在这一篇博客,将具体的使用代码来说明如何使用keras构建一个CNN网络来对CIFAR-10数 ...

  7. pytorch构建自己设计的层

    下面是如何自己构建一个层,分为包含自动反向求导和手动反向求导两种方式,后面会分别构建网络,对比一下结果对不对. -------------------------------------------- ...

  8. GAN初步——本质上就是在做优化,对于生成器传给辨别器的生成图片,生成器希望辨别器打上标签 1,体现在loss上!

    from:https://www.sohu.com/a/159976204_717210 GAN 从 2014 年诞生以来发展的是相当火热,比较著名的 GAN 的应用有 Pix2Pix.CycleGA ...

  9. Pytorch torch.optim优化器个性化使用

    一.简化前馈网络LeNet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 im ...

随机推荐

  1. [二分,multiset] 2019 Multi-University Training Contest 10 Welcome Party

    Welcome Party Time Limit: 4000/4000 MS (Java/Others)    Memory Limit: 524288/524288 K (Java/Others)T ...

  2. matplotlib命令与格式:参数配置文件与参数配置

    转自 https://my.oschina.net/swuly302/blog/94805 自定义matplotlib Created Saturday 08 December 2012 5.1 ma ...

  3. 关于利用python进行验证码识别的一些想法

    转载:@小五义http://www.cnblogs.com/xiaowuyi 用python加“验证码”为关键词在baidu里搜一下,可以找到很多关于验证码识别的文章.我大体看了一下,主要方法有几类: ...

  4. Serpent.AI - 游戏代理框架(Python)

    Serpent.AI - 游戏代理框架(Python) Serpent.AI是一个简单而强大的新颖框架,可帮助开发人员创建游戏代理.将您拥有的任何视频游戏变成一个成熟的实验的沙箱环境,所有这些都是熟悉 ...

  5. Crash

    一.Crash类型 crash 一般产生自 iOS 的微内核 Mach,然后在 BSD 层转换成 UNIX SIGABRT 信号,以标准 POSIX 信号的形式提供给用户.NSException 是使 ...

  6. AOJ 2214: Warp Hall(计数+dp)

    题目链接 题意 有一个 \(N × M\) 的二维平面, 平面上有 k 对虫洞, \(N, M ≤ 1e5, k ≤ 1e3\). 每对虫洞具有坐标 \(x_1, y_1, x_2, y_2\), 满 ...

  7. [noip2016]愤怒的小鸟<状压dp+暴搜>

    题目链接:https://vijos.org/p/2008 现在回过头去看去年的考试题,发现都不是太难,至少每道题都有头绪了... 这道题的数据范围是18,这么小,直接暴力呗,跑个暴搜就完了,时间也就 ...

  8. Effective Java要点笔记

    第一章: 创建和销毁对象 类可以通过静态工厂方法来提供客户端,而不是通过构造器 优点: 自定义工厂名称,提高可读性 可以工厂里搞单例 控制实例类是哪种子类 总之是更加灵活,可读性更高 缺点: 有可能会 ...

  9. Mob 之 短信验证集成 SMSSDK

    开相关发中总会遇到短信验证这些操作,这周没有来得及写新的东西,借此分享一篇以前学习短信验证的笔记,本文使用的是 Mob 提供的 SMSSDK . 下载 SMSSDK 官网下载地址:SMSSDK 集成 ...

  10. 使用golang理解mysql的两阶段提交

    使用golang理解mysql的两阶段提交 文章源于一个问题:如果我们现在有两个mysql实例,在我们要尽量简单地完成分布式事务,怎么处理? 场景重现 比如我们现在有两个数据库,mysql3306和m ...