L0 pytorch 构建简单网络

本文是L0, 目的是把pytorch构建感知器的程序，仔细剖析理解。

import torch

from torch import nn

torch.__version__

'1.3.0'

STEP 1 手工定义全连接层Linear

#torch.nn是专门为深度学习设计的模块。torch.nn的核心数据结构是Module

#它是一个抽象的概念，#既可以表示神经网络中的某个层(layer)，

#也可以表示一个包含很多层的神经网络

#class Linear(nn.Module):

#    def __init__(self,in_dim,out_dim):

#    def forward(self,x):

# 手工定义全连接层，写forward

class Linear(nn.Module):

    def __init__(self,in_dim,out_dim):

        super(Linear,self).__init__()

        #调用nn.Moudule 的初始化函数，首先找到Linear的父类nn.Moudle

        #然后把类Linear的对象self转换为类nn.Moudle的对象，然后“被转换”的类nn.Moudle对象调用自己的__init__函数

        #也可以写成nn.Module.__init__(self)

        #在构造函数__init__中必须自己定义可学习的参数，并封装成Parameter

        # parameter是一种特殊的Variable，但其默认需要求导（requires_grad = True）

        self.w = nn.Parameter(torch.randn(in_dim,out_dim))

        self.b = nn.Parameter(torch.randn(out_dim))

    def forward(self ,x):

        x=x.matmul(self.w) #使用Tensor.matmul 实现w*x矩阵相乘

        y=x+self.b.expand_as(x) #即 y=wx + b 使用Tensor.expand_as 保证x 和b形状一致

        print("调式点1：y的输出维度为",y.shape) #测试x的维度

        return y

STEP2 测试Linear 层是否能正常工作

# 初始化 Linear层结构为 4*3

layer = Linear(4, 3)

# 测试喂数据，是否有输出，理解输入输出的维度

#from torch.autograd import Variable as V

#input = V(torch.randn(2, 4))

input = torch.randn(2,4)#输入为二行样本，每行4个特征

output = layer(input)   #模型每次输入4个特征，输出3个值。

print(output) # 二行样本，输出2个3维的结果，因此y的输入维度为  torch.size([2,3])

调式点1：y的输出维度为 torch.Size([2, 3])

tensor([[-1.2798, -1.4936,  0.2399],

        [-1.1742,  1.2190, -2.8469]], grad_fn=<AddBackward0>)

理解

input = torch.randn(2,4)

output = layer(input)

1）定义layer对输入形状都有假设：输入的不是单行样本数据，而是一个batch。此处batch的大小为2

2）若想输入单行样本数据必须调用unsqueeze(0)函数将数据伪装成batch_size=1的batch。

# 原数据2*4，为batch为2，每batch数据为4维

#通过unsqueeze 将2*4的数据伪装成 1*2*4的数据，batch变成1，每个batch数据变成2*4

input = torch.randn(2,4)

input.unsqueeze(0).size()

torch.Size([1, 2, 4])

# 测试目前网络的参数，理解参数的维度

for name, param in layer.named_parameters():

    print(name)

    print(param)

    #w 维度为4*3 b的维度为1*3

w

Parameter containing:

tensor([[-0.3579, -0.6608,  0.1783],

        [ 1.6277, -0.4486, -1.9849],

        [ 0.9500, -0.1879,  1.7154],

        [-0.5778, -0.2012,  1.5576]], requires_grad=True)

b

Parameter containing:

tensor([-0.9491, -0.1104, -1.2390], requires_grad=True)

for name, param in layer.named_parameters():

    print(name, param.size())

w torch.Size([4, 3])

b torch.Size([3])

module中parameter的命名规范：

1)对于类似self.param_name = nn.Parameter(t.randn(3, 4))，命名为param_name

2)对于子Module中的parameter，会其名字之前加上当前Module的名字。

如对于self.sub_module = SubModel()，SubModel中有个parameter的名字叫做param_name，

那么二者拼接而成的parameter name 就是sub_module.param_name。

见后续采用Linear类进一步构建多层感知器的例子

STEP3 组建二个全连接层的感知器

class Perceptron (nn.Module):

    def __init__(self, in_features, hidden_features, out_features):

        super(Perceptron,self).__init__()  #或写成nn.Module.__init__(self)

        # 利用 Linear subModel组建 layer 1 ,layer 2

        self.layer1 = Linear(in_features, hidden_features)

        self.layer2 = Linear(hidden_features, out_features)

    def forward(self, x):

        x = self.layer1(x)

        x = torch.sigmoid(x)

        x = self.layer2(x)

        y = torch.sigmoid(x)

        return y

per = Perceptron(3, 4, 1)

per

Perceptron(

  (layer1): Linear()

  (layer2): Linear()

)

# 测试网络参数

for name, param in per.named_parameters():

    print("sub_module.param_name::",name, param.size())

sub_module.param_name:: layer1.w torch.Size([3, 4])

sub_module.param_name:: layer1.b torch.Size([4])

sub_module.param_name:: layer2.w torch.Size([4, 1])

sub_module.param_name:: layer2.b torch.Size([1])

1)Module中的可学习参数可以通过**named_parameters()**或者parameters()返回迭代器，前者会给每个parameter都附上名字，使其更具有辨识度。

2)Module能够自动检测到自己的Parameter，并将其作为学习参数。

# 测试网络输入，输出

data=torch.randn(4,3)

output=per(data)

output

调式点1：y的输出维度为 torch.Size([4, 4])

调式点1：y的输出维度为 torch.Size([4, 1])

tensor([[0.5478],

        [0.6146],

        [0.6252],

        [0.8016]], grad_fn=<SigmoidBackward>)

STEP 4 利用nn.Sequential 快速搭建网络

从上面的例子，可以看出在forward()方法中必须理解网络结构，并根据网络层次的之间的关系完成网络组装。

当模型仅仅是简单的前馈网络时，可以采用nn.Sequentail()模块来快速搭建模块，而不必手动的在forward()方法手工构建。

class Seq_Perceptron (nn.Module):

    def __init__(self, in_features, hidden_features, out_features):

        super(Seq_Perceptron ,self).__init__()  #或写成nn.Module.__init__(self)

        # 利用 Linear subModel组建 layer 1 ,layer 2

        #self.layer1 = Linear(in_features, hidden_features)

        #self.layer2 = Linear(hidden_features, out_features)

        self.seq_layer = nn.Sequential(

            nn.Linear(in_features,hidden_features),

            nn.Sigmoid(),

            nn.Linear(hidden_features,out_features),

            nn.Sigmoid()

            )

    def forward(self, x):

        y =  self.seq_layer(x)

        return y

# 测试网络输入，输出

per = Seq_Perceptron(3, 4, 1)

data=torch.randn(4,3)

output=per(data)

output

tensor([[0.5853],

        [0.6061],

        [0.5967],

        [0.6131]], grad_fn=<SigmoidBackward>)

L0 torch 构建网络初步的更多相关文章

Docker 构建网络服务后本机不能访问
Docker 构建网络服务后本机不能访问起因使用tornado构建了一个服务,测试都没有问题使用docker构建镜像,使用docker run image_name启动服务使用浏览器访问 12 ...
Pytorch_01 Tensor,Autograd，构建网络
Tensor Tensor是PyTorch中的重要数据结构,可认为是一个高维数组,Tensor与numpy的ndarrays类似,但Tensor可以使用GPU加速 import torch as t# ...
利用sfc文件构建网络渗透
收集哈希 SCF(Shell命令文件)文件可用于执行一组有限的操作,例如显示Windows桌面或打开Windows资源管理器,这并不是什么新鲜事.然而,一个SCF文件可以用来访问一个特定的UNC路 ...
keras 学习笔记：从头开始构建网络处理 mnist
全文参考 < 基于 python 的深度学习实战> import numpy as np from keras.datasets import mnist from keras.model ...
WGCNA构建基因共表达网络详细教程
这篇文章更多的是对于混乱的中文资源的梳理,并补充了一些没有提到的重要参数,希望大家不会踩坑. 1. 简介 1.1 背景 WGCNA(weighted gene co-expression networ ...
数据挖掘入门系列教程（十二）之使用keras构建CNN网络识别CIFAR10
简介在上一篇博客:数据挖掘入门系列教程(十一点五)之CNN网络介绍中,介绍了CNN的工作原理和工作流程,在这一篇博客,将具体的使用代码来说明如何使用keras构建一个CNN网络来对CIFAR-10数 ...
pytorch构建自己设计的层
下面是如何自己构建一个层,分为包含自动反向求导和手动反向求导两种方式,后面会分别构建网络,对比一下结果对不对. -------------------------------------------- ...
GAN初步——本质上就是在做优化，对于生成器传给辨别器的生成图片，生成器希望辨别器打上标签 1，体现在loss上！
from:https://www.sohu.com/a/159976204_717210 GAN 从 2014 年诞生以来发展的是相当火热,比较著名的 GAN 的应用有 Pix2Pix.CycleGA ...
Pytorch torch.optim优化器个性化使用
一.简化前馈网络LeNet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 im ...

随机推荐

CMDB资产采集方式
一:Agent方式原理:在每台服务器装上agent客户端程序,定时向数据库发送指定的资产信息. 优点:速度快. 缺点:服务器上需要多装一个软件 import subprocess import re ...
非常详细的 Linux C/C++ 学习路线总结！已拿腾讯offer
创作不易,点赞关注支持一下吧,我的更多原创技术分享,关注公众号「后端技术学堂」第一时间看! 最近在知乎经常被邀请回答类似如何学习C++和C++后台开发应该具体储备哪些基础技能的问题. 本身我从事的的C ...
C语言学生管理系统
想练习一下链表,所以就有了这个用C写的学生管理系统没有把它写入文件,才不是因为我懒哈哈哈,主要是为了练习链表的 #include<stdio.h> #include<stdlib. ...
数学-概率-New 21 Game
2020-02-10 13:24:26 问题描述: 问题求解: 第一次看到这个题目的时候想到的是之前做过的一条概率题,就是那个国际象棋,那条题目的做法是使用dp去对所有留在棋盘的种类进行计数,然后除以 ...
spring最核心思想--ioc控制反转
一核心概念控制反转:将bean的生成交给容器,程序可以从容器中获取指定的bean. 个人理解:此优势也是spring能够流行并成为java主流框架的主要原因,java是帮助java程序员以对象的方式 ...
python3.4连接mysql数据库的方法
python3.4连接mysql数据库的方法发布时间:2014-08-04编辑:www.jbxue.com 本文介绍了python3.4连接mysql数据库的方法,在python3.4中不能用mys ...
OpenCV-Python Canny边缘检测 | 十九
目标在本章中,我们将学习 Canny边缘检测的概念 OpenCV函数: cv.Canny() 理论 Canny Edge Detection是一种流行的边缘检测算法.它由John F. Canny发 ...
【LeetCode】15.三数之和
题目描述 1. 三数之和给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有满足条件且不重复的三元组. 注意: ...
如何测试Linux命令运行时间？
良许在工作中,写过一个 Shell 脚本,这个脚本可以从 4 个 NTP 服务器轮流获取时间,然后将最可靠的时间设置为系统时间. 因为我们对于时间的要求比较高,需要在短时间内就获取到正确的时间.所以我 ...
python文件封装成*.exe
python文件封装成*.exe文件(单文件和多文件) 环境:win10 64位 python3.7 原文: https://www.cnblogs.com/jackzz/p/9431923.html ...

L0 torch 构建网络初步