Pytorch 初识

文章目录

一个简单的回归网络的例子
再来一个例子
官方教程上图片识别的例子

import torch

import torch.nn as nn

import torch.nn.functional as F

import matplotlib.pyplot as plt #这个一直想学，还没学，代码从莫烦python那copy的

import torchvision

import torchvision.transforms as transforms

import numpy as np

很遗憾，看了半天还是没怎么学会，只能先记录俩个例子放在这里了。然后Pytorch就先告一段落吧。

一个简单的回归网络的例子

这个例子是对莫烦python那例子的一个修改（主要是自己玩了下，懒得弄回去了）

x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) # x data (tensor), shape=(100, 1)

y = 4 * x ** 3 + x ** 2 + 3 * x + 0.2*torch.rand(x.size())

class Net(torch.nn.Module):  # 继承 torch 的 Module

    def __init__(self):

        super(Net, self).__init__()     # 继承 __init__ 功能

        # 定义每层用什么样的形式

        self.hidden = nn.Linear(1, 7)   # 隐藏层线性输出

        #self.hidden2 = torch.nn.Linear(3, 7)

        self.predict = nn.Linear(7, 1)   # 输出层线性输出

        self.active = nn.Tanh()  # 这里的激活函数玩得挺多的，带ReLU的一般效果都不错，还有Softshrink 有正有负效果也很好啊

    def forward(self, x):   # 这同时也是 Module 中的 forward 功能

        # 正向传播输入值, 神经网络分析出输出值

        x = self.active(self.hidden(x))      # 激励函数(隐藏层的线性值)

        #x = self.active(self.hidden2(x))

        x = self.predict(x)             # 输出值

        return x

net = Net()

plt.ion()   # 画图

plt.show()

optimizer = torch.optim.SGD(net.parameters(), lr=0.1, momentum=0.9)  # 传入 net 的所有参数, 学习率

loss_func = nn.MSELoss()

for t in range(100):

    prediction = net(x)     # 喂给 net 训练数据 x, 输出预测值

    loss = loss_func(prediction, y)     # 计算两者的误差

    optimizer.zero_grad()

    loss.backward()

    optimizer.step()

    # 接着上面来

    if t % 20 == 0:

        # plot and show learning process

        plt.cla()

        plt.scatter(x.data.numpy(), y.data.numpy())

        plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)

        plt.text(0.5, 0, 'Loss=%.4f' % loss.data.numpy(), fontdict={'size': 20, 'color':  'red'})

        plt.pause(0.1)

有很多很有趣的现象，主要就是跟参数有关的东西：

self.hidden = nn.Linear(1, 100)

self.predict = nn.Linear(100, 1)

可能会出现下面的情况：

增加一个隐藏层也往往会这样。这个就是所谓的梯度爆炸？这类名字我也只是听过，到时候再深入吧，在此记一笔。

Tanh() 改为 Softshrink 就没问题了（因为Softshrink有正有负所以会有所抵消？）

再者：

x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1) * 3

一样会炸，所以要很小心才行啊（对了，调小学习率可以应付这种情况）。

没一会功夫，最大参数的值就突破天际了。

再来一个例子

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.fc1 = nn.Linear(3, 7)

        #self.fc2 = nn.Linear(7, 5)

        self.fc3 = nn.Linear(7, 1)

        self.active = nn.ReLU()

    def forward(self, x):

        x = self.active(self.fc1(x))

        #x = self.active(self.fc2(x))

        x = self.fc3(x)

        return x

net = Net()

print(net)

# y =  x1 ** 3 + x2 ** 2 + x3 + e

x = torch.rand(100, 3)

y = x[:,0] ** 3 + x[:,1] ** 2 + x[:, 2] + torch.randn(100) * 0.05

optimizer = torch.optim.SGD(net.parameters(), lr=0.005, momentum = 0.9)

loss_func = nn.MSELoss()

for t in range(200):

    pre = net(x)

    loss = loss_func(pre, y)

    optimizer.zero_grad()

    loss.backward()

    optimizer.step()

    #print('step: {0} | loss: {1}'.format(t, loss))

#结果很遗憾，最后都会趋于一个值，咋搞，弄不明白啊。

官方教程上图片识别的例子

图片是 3×32×323 \times 32 \times 323×32×32的

transform = transforms.Compose(   #转换格式

    [transforms.ToTensor(),

     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,  #训练样本

                                        download=False, transform=transform) #我下好了所以是False

trainloader = torch.utils.data.DataLoader(trainset, batch_size=4,

                                          shuffle=True, num_workers=0) #num_workers 好像是线程进程的处理，但是我用了这个会崩，就改成0  shuffle 打扰顺序， batch_size,一个数据分成几堆，批训练。

testset = torchvision.datasets.CIFAR10(root='./data', train=False,

                                       download=False, transform=transform)

testloader = torch.utils.data.DataLoader(testset, batch_size=4,

                                         shuffle=False, num_workers=0)

classes = ('plane', 'car', 'bird', 'cat',

           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

def imshow(img):

    img = img / 2 + 0.5     # unnormalize

    npimg = img.numpy()

    plt.imshow(np.transpose(npimg, (1, 2, 0)))

    plt.show()    

dataiter = iter(trainloader)

images, labels = dataiter.next()

imshow(torchvision.utils.make_grid(images))

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = nn.Conv2d(3, 6, 5)  # (3,6,5) in_channel:3,out_channel:6,kernel_size:5 * 5

	#说人话就是，输入的图片是3个通道的（RGB），卷积后的图片是6个通道的，就是6层的矩阵

        self.pool = nn.MaxPool2d(2, 2)  #池化

        self.conv2 = nn.Conv2d(6, 16, 5) #卷积

        self.fc1 = nn.Linear(16 * 5 * 5, 120)  #全连接层

        self.fc2 = nn.Linear(120, 84)

        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):

        x = self.pool(F.relu(self.conv1(x))) #图片大小转换：(3,32,32)->(6,28,28)->(6,14,14)

        x = self.pool(F.relu(self.conv2(x))) #图片大小转换: (6,14,14)->(16,10,10)->(16,5,5)

        x = x.view(-1, 16 * 5 * 5)  #这玩意儿是用来排列图像的 (16,5,5)是从上面得到的

        x = F.relu(self.fc1(x))

        x = F.relu(self.fc2(x))

        x = self.fc3(x)

        return x

net = Net()                    

criterion = nn.CrossEntropyLoss() #交叉熵

optimizer = torch.optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

for epoch in range(2):  # loop over the dataset multiple times 整体数据走2遍

    running_loss = 0.0

    for i, data in enumerate(trainloader, 0):

        # get the inputs

        inputs, labels = data

        # zero the parameter gradients

        optimizer.zero_grad()

        # forward + backward + optimize

        outputs = net(inputs)

        loss = criterion(outputs, labels)

        loss.backward()

        optimizer.step()

        # print statistics

        running_loss += loss.item()

        if i % 2000 == 1999:    # print every 2000 mini-batches

            print('[%d, %5d] loss: %.3f' %

                  (epoch + 1, i + 1, running_loss / 2000))

            running_loss = 0.0

print('Finished Training')                                                                                          

#测试数据

dataiter = iter(testloader)

images, labels = dataiter.next()

imshow(torchvision.utils.make_grid(images))

print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))

outputs = net(images)

_, predicted = torch.max(outputs, 1)

print('Predicted: ', ' '.join('%5s' % classes[predicted[j]]

                              for j in range(4)))

Pytorch 初识的更多相关文章

『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上
总结一下相关概念: torch.Tensor - 一个近似多维数组的数据结构 autograd.Variable - 改变Tensor并且记录下来操作的历史记录.和Tensor拥有相同的API,以及b ...
Pytorch笔记 (2) 初识Pytorch
一.人工神经网络库 Pytorch ———— 让计算机确定神经网络的结构 + 实现人工神经元 + 搭建人工神经网络 + 选择合适的权重 (1)确定人工神经网络的结构: 只需要告诉Pytorc ...
PyTorch学习笔记之初识word_embedding
import torch import torch.nn as nn from torch.autograd import Variable word2id = {'hello': 0, 'world ...
『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...
『PyTorch』第九弹_前馈网络简化写法
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下在前面的例子中,基本上都是将每一层的输出直接作为下一层的 ...
TensorFlow学习(1)-初识
初识TensorFlow 一.术语潜知深度学习:深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法. 深度学 ...
Android动画效果之初识Property Animation（属性动画）
前言: 前面两篇介绍了Android的Tween Animation(补间动画) Android动画效果之Tween Animation(补间动画).Frame Animation(逐帧动画)Andr ...
初识Hadoop
第一部分: 初识Hadoop 一. 谁说大象不能跳舞业务数据越来越多,用关系型数据库来存储和处理数据越来越感觉吃力,一个查询或者一个导出,要执行很长 ...

随机推荐

C#-继承（十一）
继承概念承用于创建可重用.扩展和修改在其他类中定义的行为的新类创建一个类的时候,不是要写全新的数据成员和成员函数,可以指定新的类继承一个已经存在的类的成员.已有的类称为基类,新的类称为派生类派生 ...
postgresql自定义类型并返回数组
转自 https://blog.csdn.net/victor_ww/article/details/44415895 create type custom_data_type as ( id int ...
DELL 服务器报CPU 1 has an internal error (IERR）
重启服务器,然后按F2 进入到bios中,选择system bios settings这个选项,然后选择system profiles 进入,在这个里面麻烦将 C1E 和Cstate这两个选项改为di ...
同步下的资源互斥：停运保护（Run-Down Protection）机制
背景近期在学习ProcessHacker的源码,Process Hacker是一个免费的.功能强大的"任务管理器",可用于监听系统资源的使用情况,调试软件以及检测恶意程序.使用中 ...
IDEA: Call Hierarchy
在日常开发中,查看某个方法.字段可能被用在哪些地方.这个是个很常见的操作. 例如,在使用Eclipse时,选择方法后,右键菜单里选择 show call hierarchy,即可查看有哪些地方调用了这 ...
注入攻击(SQL注入)
注入攻击是web安全领域中一种最为常见的攻击方式.注入攻击的本质,就是把用户输入的数据当做代码执行.这里有两个关键条件,第一是用户能够控制输入,第二个就是原本程序要执行的代码,将用户输入的数据进行了拼 ...
main主函数
public static void main(String[] args) { //虚拟机调用main函数,需要传个args的参数,传入的是new String[0] System.out.prin ...
附2 rabbitmq用户管理、角色管理与权限管理
本文摘自:http://my.oschina.net/hncscwc/blog/262246 1. 用户管理用户管理包括增加用户,删除用户,查看用户列表,修改用户密码. 相应的命令 (1) 新增一个 ...
IE在开发工具启动的情况下（打开F12）时 JS才能执行
在开发一个项目时遇到一个bug:在360急速浏览器的兼容模式下并且是线上环境时js无法执行(360急速浏览器的兼容模式下测试环境就ok), 打开f12以后刷新就没问题了,查了一下网上说的IE6/7是没 ...
E - Intervals 贪心
Chiaki has n intervals and the i-th of them is [li, ri]. She wants to delete some intervals so that ...