pytorch和tensorflow的爱恨情仇之定义可训练的参数

pytorch和tensorflow的爱恨情仇之基本数据类型

pytorch和tensorflow的爱恨情仇之张量

pytorch版本：1.6.0

tensorflow版本：1.15.0

之前我们就已经了解了pytorch和tensorflow中的变量，本节我们深入了解可训练的参数-变量

接下来我们将使用sklearn自带的iris数据集来慢慢品味。

1、pytorch

（1）第一种方式，不使用nn.Module或nn.Sequntial()来建立模型的情况下自定义参数；

加载数据集并转换为tensot：

import torch

import torch.nn.functional as F

import numpy as np

from sklearn.datasets import load_iris

iris = load_iris()

data=iris.data

target = iris.target

data = torch.from_numpy(data).float()  #(150,4)

target = torch.from_numpy(target).long()  #(150,3)

batch_size=data.shape[0]  #设置batchsize的大小就是所有数据

dataset = torch.utils.data.TensorDataset(data, target)      # 设置数据集

train_iter = torch.utils.data.DataLoader(dataset, batch_size, shuffle=True) # 设置获取数据方式

自己定义好要训练的参数：

classes = 3

input = 4

hidden = 10

w_0 = torch.tensor(np.random.normal(0, 0.01, (input, hidden)), dtype=torch.float)

b_0 = torch.zeros(hidden, dtype=torch.float)

w_1 = torch.tensor(np.random.normal(0, 0.01, (hidden, classes)), dtype=torch.float)

b_1 = torch.zeros(classes, dtype=torch.float)

我们可以在定义参数的时候指定requires_grad=True使其为可训练的参数，也可以使用如下方式：

params = [w_0, b_0, w_1, b_1]

for param in params:

    param.requires_grad_(requires_grad=True)

定义学习率、优化器、损失函数、网络

lr = 5

optimizer = None

criterion = torch.nn.CrossEntropyLoss()

epoch = 1000

def sgd(params, lr, batch_size):

    for param in params:

        param.data -= lr * param.grad / batch_size # 注意这里更改param时用的param.data  

def net(x):

    h = torch.matmul(x,w_0)+b_0

    h = F.relu(h)

    output = torch.matmul(h,w_1)+b_1

    #output = F.softmax(output,dim=1)

    return output

为了更加清楚参数训练的过程，这里我们不使用pytorch自带的，而是我们自己定义的随机梯度下降。

定义训练主函数：

def train(net,params,lr,train_iter):

    for i in range(1,epoch+1):

        for x,y in train_iter:

            output = net(x)

            loss = criterion(output,y)

            # 梯度清零

            if optimizer is not None:

                optimizer.zero_grad()

            elif params is not None and params[0].grad is not None:

                for param in params:

                    param.grad.data.zero_()

            loss.backward()

            if optimizer is None:

                sgd(params, lr, batch_size)

            else:

                optimizer.step()  # “softmax回归的简洁实现”一节将用到

            acc = (output.argmax(dim=1) == y).sum().item() / data.shape[0]

            print("epoch:{:03d} loss:{:.4f} acc:{:.4f}".format(i,loss.item(),acc))

train(net=net,params=params,lr=lr,train_iter=train_iter)

从这里我们也可以看到optimizer.zero_grad()和optimizer.step()的作用了，以上便是我们自定义训练参数的完整过程了，看下结果：

epoch:994 loss:0.0928 acc:0.9800

epoch:995 loss:0.0927 acc:0.9800

epoch:996 loss:0.0926 acc:0.9800

epoch:997 loss:0.0926 acc:0.9800

epoch:998 loss:0.0925 acc:0.9800

epoch:999 loss:0.0925 acc:0.9800

epoch:1000 loss:0.0924 acc:0.9800

（2）使用nn.Sequential()来构建模型，进行参数初始化：

导入相应的包并加载数据集：

import torch

import torch.nn as nn

import torch.nn.init as init

import torch.nn.functional as F

import numpy as np

from sklearn.datasets import load_iris

iris = load_iris()

data=iris.data

target = iris.target

转换为pytorch数据格式：

data = torch.from_numpy(data).float()

target = torch.from_numpy(target).long()

batch_size=data.shape[0]

dataset = torch.utils.data.TensorDataset(data, target)      # 设置数据集

train_iter = torch.utils.data.DataLoader(dataset, batch_size, shuffle=True) # 设置获取数据方式

定义相关超参数：

classes = 3

input = 4

hidden = 10

lr = 4

optimizer = None

定义网络：

net = nn.Sequential(

    nn.Linear(input,hidden),

    nn.ReLU(),

    nn.Linear(hidden,classes),

)

参数初始化：

for name,param in net.named_parameters(): #使用model.named_parameters()可以获得相应层的名字的参数以及具体值

    if "weight" in name:

        init.normal_(param, mean=0, std=0.01)

    if "bias" in name:

        init.zeros_(param)

自定义随机梯度下降优化器：

def sgd(params, lr, batch_size):

    for param in params:

        param.data -= lr * param.grad / batch_size # 注意这里更改param时用的param.data

训练主循环：

epoch = 1000

criterion = torch.nn.CrossEntropyLoss()

def train(net,lr,train_iter):

    for i in range(1,epoch+1):

        for x,y in train_iter:

            output = net(x)

            loss = criterion(output,y)

            # 梯度清零

            if optimizer is not None:

                optimizer.zero_grad()

            elif net.parameters() is not None:

                for param in net.parameters():

                    if param.grad is not None:

                        param.grad.data.zero_()

            loss.backward()

            if optimizer is None:

                sgd(net.parameters(), lr, batch_size)

            else:

                optimizer.step()  # “softmax回归的简洁实现”一节将用到

            acc = (output.argmax(dim=1) == y).sum().item() / data.shape[0]

            print("epoch:{:03d} loss:{:.4f} acc:{:.4f}".format(i,loss.item(),acc))

    return

train(net=net,lr=lr,train_iter=train_iter)

结果：

（3）使用pytorch自带的优化器

我们只需要将opyimizer设置为以下即可：

optimizer = torch.optim.SGD(net.parameters(), lr=0.05)

需要注意的是学习率这里需要设置的比较小一点，和上面设置的有所不同，结果如下：

（4）使用nn.Module来构建网络，自定义参数并进行初始化

我们只需要修改以下地方即可：

class Net(nn.Module):

    def __init__(self,input,hidden,classes):

        super(Net, self).__init__()

        self.input = input

        self.hidden = hidden

        self.classes = classes

        self.w0 = nn.Parameter(torch.Tensor(self.input,self.hidden))

        self.b0 = nn.Parameter(torch.Tensor(self.hidden))

        self.w1 = nn.Parameter(torch.Tensor(self.hidden,self.classes))

        self.b1 = nn.Parameter(torch.Tensor(self.classes))

        self.reset_parameters()

    def reset_parameters(self):

        nn.init.normal_(self.w0)

        nn.init.constant_(self.b0,0)

        nn.init.normal_(self.w1)

        nn.init.constant_(self.b1,0)

    def forward(self,x):

        out = torch.matmul(x,self.w0)+self.b0

        out = F.relu(out)

        out = torch.matmul(out,self.w1)+self.b1

        return out

net = Net(input,hidden,classes)

optimizer = torch.optim.SGD(net.parameters(), lr=0.05)

结果：

（4）使用nn.Module()构建网路，并使用各层中的参数并进行初始化

class Net(nn.Module):

    def __init__(self,input,hidden,classes):

        super(Net, self).__init__()

        self.input = input

        self.hidden = hidden

        self.classes = classes

        self.fc1 = nn.Linear(self.input,self.hidden)

        self.fc2 = nn.Linear(self.hidden,self.classes)

        for m in self.modules():

            if isinstance(m, nn.Linear):

                nn.init.normal_(m.weight,0,0.01)

                nn.init.constant_(m.bias, 0)      

    def forward(self,x):

        out = self.fc1(x)

        out = F.relu(out)

        out = self.fc2(out)

        return out

net = Net(input,hidden,classes)

optimizer = torch.optim.SGD(net.parameters(), lr=0.05)

结果：

PyTorch 中参数的默认初始化在各个层的 reset_parameters() 方法

我们看下官方的Linear层的实现：

官方Linear层：

class Linear(Module):

    def __init__(self, in_features, out_features, bias=True):

        super(Linear, self).__init__()

        self.in_features = in_features

        self.out_features = out_features

        self.weight = Parameter(torch.Tensor(out_features, in_features))

        if bias:

            self.bias = Parameter(torch.Tensor(out_features))

        else:

            self.register_parameter('bias', None)

        self.reset_parameters()

    def reset_parameters(self):

        stdv = 1. / math.sqrt(self.weight.size(1))

        self.weight.data.uniform_(-stdv, stdv)

        if self.bias is not None:

            self.bias.data.uniform_(-stdv, stdv)

    def forward(self, input):

        return F.linear(input, self.weight, self.bias)

    def extra_repr(self):

        return 'in_features={}, out_features={}, bias={}'.format(

            self.in_features, self.out_features, self.bias is not None

        )

（5）最后我们来看下从网络中获取参数名字和参数值的一些例子

我们以这个网络为例：

class Net(nn.Module):

    def __init__(self,input,hidden,classes):

        super(Net, self).__init__()

        self.input = input

        self.hidden = hidden

        self.classes = classes

        self.fc1 = nn.Linear(self.input,self.hidden)

        self.fc2 = nn.Linear(self.hidden,self.classes)

        for m in self.modules():

            if isinstance(m, nn.Linear):

                nn.init.normal_(m.weight,0,0.01)

                nn.init.constant_(m.bias, 0)      

    def forward(self,x):

        out = self.fc1(x)

        out = F.relu(out)

        out = self.fc2(out)

        return out

net = Net(input,hidden,classes)

首先是model.state_dict()：是一个参数字典，键是参数的名称，值是参数的值：

for name,value in net.state_dict().items():

    print(name,value)

接着是：model.parameters()：返回的是一个generator，我们之前也经常使用，通过param.data，param.data.grad来获取参数的值以及梯度

for param in net.parameters():

    print(param.data,param.grad)

接着是model.named_parameters()：返回的是一个具名参数，也就是包含了参数的名称

for name,param in net.named_parameters():

    print(name,param)

最后讲下的是self.modules()：一般是在网络初始化中使用，返回的是网络中的具体层，我们可以通过其对不同层进行参数初始化，比如nn.Conv2d、nn.Linear等；

参考：

https://www.cnblogs.com/KaifengGuan/p/12332072.html

https://www.geekschool.org/2020/08/02/13455.html

https://blog.csdn.net/weixin_44058333/article/details/92691656

（2）tensorflow

导入相应的包并加载数据：

import tensorflow as tf

import numpy as np

from sklearn.datasets import load_iris

from sklearn.preprocessing import OneHotEncoder

iris = load_iris()

data=iris.data

target = iris.target

将标签转换为onehot编码：

oneHotEncoder = OneHotEncoder(sparse=False)

onehot_target = oneHotEncoder.fit_transform(target.reshape(-1,1))

print(onehot_target)

定义超参数以及可训练的参数：

input=4

hidden=10

classes=3

w0=tf.Variable(tf.random.normal([input,hidden],stddev=0.01,seed=1))

b0=tf.Variable(tf.zeros([hidden]))

w1=tf.Variable(tf.random.normal([hidden,classes],stddev=0.01,seed=1))

b1=tf.Variable(tf.zeros([classes]))

定义计算图中的占位符：

x = tf.placeholder(tf.float32,shape=(None,input),name="x-input") #输入数据

y_ = tf.placeholder(tf.float32,shape=(None,classes),name="y-input") #真实标签

定义网络、损失函数和优化器：

def net(x):

    hid = tf.add(tf.matmul(x,w0),b0)

    hid = tf.nn.relu(hid)

    out = tf.add(tf.matmul(hid,w1),b1)

    out = tf.nn.softmax(out)

    return out

y = net(x)

cross_entropy = -tf.reduce_mean(y_*tf.log(tf.clip_by_value(y,1e-10,1.0)) \

                    + (1-y_)*tf.log(tf.clip_by_value(1-y,1e-10,1.0)))

optimizer=tf.compat.v1.train.GradientDescentOptimizer(learning_rate=0.05).minimize(cross_entropy)

训练循环：

epoch = 1000

with tf.compat.v1.Session() as sess: #建立会话

    init_op = tf.global_variables_initializer() #初始化参数

    sess.run(init_op)

    for epoch in range(1,epoch+1):

        sess.run(optimizer,feed_dict={x:data,y_:onehot_target}) #传入数据给优化器

        y_pred = sess.run(y,feed_dict={x:data}) #计算输出

        total_cross_entropy = sess.run(cross_entropy,feed_dict={y:y_pred,y_:onehot_target}) #计算交叉熵

        pred = tf.argmax(y_pred,axis = 1) # 取出行中最大值的索引，也就是取出其中概率最大的索引

        correct = tf.cast(tf.equal(pred,target),dtype=tf.int32) # 判断与测试集的标签是否相等并且转换bool为int型

        correct = tf.reduce_sum(correct) # 沿着指定维度的和，不指定axis则默认为所有元素的和

        acc = correct.eval() / data.shape[0]

        print("epoch:{} loss:{:.4f} acc:{:.4f}".format(epoch, total_cross_entropy,acc))

结果：

但感觉训练1000个epoch比pytorch慢好多。。

pytorch和tensorflow的爱恨情仇之定义可训练的参数的更多相关文章

pytorch和tensorflow的爱恨情仇之参数初始化
pytorch和tensorflow的爱恨情仇之基本数据类型 pytorch和tensorflow的爱恨情仇之张量 pytorch和tensorflow的爱恨情仇之定义可训练的参数 pytorch版本 ...
pytorch和tensorflow的爱恨情仇之基本数据类型
自己一直以来都是使用的pytorch,最近打算好好的看下tensorflow,新开一个系列:pytorch和tensorflow的爱恨情仇(相爱相杀...) 无论学习什么框架或者是什么编程语言,最基础 ...
pytorch和tensorflow的爱恨情仇之张量
pytorch和tensorflow的爱恨情仇之基本数据类型:https://www.cnblogs.com/xiximayou/p/13759451.html pytorch版本:1.6.0 ten ...
pytorch和tensorflow的爱恨情仇之一元线性回归例子（keras插足啦）
直接看代码: 一.tensorflow #tensorflow import tensorflow as tf import random import numpy as np x_data = np ...
Menu与ActionBar的爱恨情仇
最近在开发一款音乐播放器,在开发过程中遇到了一点小麻烦,通过android API搞清楚了Menu与ActionBar的爱恨情仇,写了个小Demo祭奠一下那些年我们陷进去的坑,有不对的地方请大神们批评 ...
web移动端fixed布局和input等表单的爱恨情仇 - 终极BUG，完美解决
[问题]移动端开发,ios下当fixed属性和输入框input(这里不限于input,只要可以调用移动端输入法的都包括,如:textarea.HTML5中contenteditable等),同时存在的 ...
注解：大话AOP与Android的爱恨情仇
转载:大话AOP与Android的爱恨情仇 1. AOP与OOP的区别平时我接触多的就是OOP(Object Oriented Programming面向对象).AOP(Aspect Oriente ...
除了love和hate，还能怎么表达那些年的“爱恨情仇”？
实用英语帮你全面提高英语水平关注童鞋们每次刷美剧的时候,相信都会被CP感满满的男女主角虐得体无完肤吧. 可是,一到我们自己表达爱意或者恨意的时候,却苦于词穷,只会用love, like, hat ...
对json的爱恨情仇
本文回想了对json的爱恨情仇. C++有风险,使用需慎重. 本文相关代码在:http://download.csdn.net/detail/baihacker/7862785 当中的測试数据不在里面 ...

随机推荐

快速解决Ubuntu/linux 环境下QT生成没有可执行文件（application/x-executable）
快速解决Ubuntu/linux 环境下QT生成没有可执行文件(application/x-executable)(转载) 问题描述与windows环境下不同,linux选择debug构建时并不 ...
openCV - 2. 矩阵的掩膜操作
获取图像像素指针.掩膜操作解释获取图像像素指针 CV_Assert(myImage.depth() == CV_8U); Mat.ptr<uchar>(int i=0) 获取像素矩阵的指 ...
【Pod Terminating原因追踪系列之三】让docker事件处理罢工的cancel状态码
本篇为Pod Terminating原因追踪系列的第三篇,前两篇分别介绍了两种可能导致Pod Terminating的原因.在处理现网问题时,Pod Terminating属于比较常见的问题,而本系列 ...
unity3d插入android有米广告
有米官网:http://www.youmi.net/register?r=MTI0MDg= 国内的广告,我觉得万普和有米还不错,我也只试了这两个,其他的都是看评价的,呵呵~~~首先我们去有米官网注册一 ...
面试【JAVA基础】JVM
1.内存模型 1.1.堆堆是所有线程共享的,主要存放对象实例和数组. 新生代和老年代的比例是1:2. 新生代中三个区域的比例是 8 : 1 : 1. 1.1.1.新生代对象分配在eden区中,当e ...
关于ASP.NET MVC的权限认证的一些总结
最近在学ASP.NET MVC的权限认证的一些东西,上网搜索了一阵,发现网上的方法大多数是以下几类: 一.FormsAuthentication.SetAuthCookie(admin.Name, f ...
H5游戏定制，4大优势助力企业曝光10W+
H5游戏定制,4大优势助力企业曝光10W+ 移动互联网已成为了人们生活的一部分,普通广告形式已很难吸引用户的眼球,企业要怎样才能将广告更广泛的传播给更多用户呢?根据TOM游戏多年从业经验,为大家分享以 ...
虚拟机：主机能ping通虚拟机，虚拟机不可以ping通主机
解决办法: 1.虚拟机可使用nat模式 2.虚拟机使用桥接模式,并且和主机再同一个ip段内 3.主机的防火墙关闭(不推荐使用,主机不安全) 4.主机中有个ICMPv4-In这个规则需要启用: 打开防火 ...
将虚拟机IP与主机IP设置在同一网段的方法
一.查看主机的网卡名称.IP地址.子网掩码二.设置VMware Workstation软件打开虚拟网络编辑器弹出对话框,选择"更改设置"按钮. 进入虚拟网络编辑器单选项选择 ...
Android组件化 + MVP + MVVM
前言组件化和插件化已经提出了很久了,到现在也是比较稳定的一种架构方案了,在三年前,组件化和插件提出来没多久,前公司就已经在项目中使用了,只是当时还只是菜鸟,没有资格参与到架构的建设中,只是在大佬搭好 ...

pytorch和tensorflow的爱恨情仇之定义可训练的参数

pytorch和tensorflow的爱恨情仇之定义可训练的参数的更多相关文章

随机推荐

热门专题