Tensorboard SummaryWriter()

import torch

import torch.nn as nn

import torch.nn.functional as F

import torchvision

import torchvision.transforms as transforms

import torch.optim as optim

from torch.utils.tensorboard import SummaryWriter

batch_size_list = [100, 1000, 10000]

lr_list = [.01, .001, .0001, .00001]

shuffle = [True,False]

def get_num_correct(preds, labels):

    return preds.argmax(dim=1).eq(labels).sum().item()

train_set = torchvision.datasets.FashionMNIST(

    root='./data/FashionMNIST',

    train=True,

    download=True,

    transform=transforms.Compose([transforms.ToTensor()])

)

# data_loader = torch.utils.data.DataLoader(train_set,batch_size=batch_size,shuffle=True)  # shuffle=True

class Network(nn.Module):

    def __init__(self):

        super().__init__()

        self.conv1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5)

        self.conv2 = nn.Conv2d(in_channels=6, out_channels=12, kernel_size=5)

        self.fc1 = nn.Linear(in_features=12 * 4 * 4, out_features=120)

        self.fc2 = nn.Linear(in_features=120, out_features=60)

        self.out = nn.Linear(in_features=60, out_features=10)

    def forward(self, t):

        # (1) input layer

        t = t

        # (2) hidden conv layer

        t = self.conv1(t)

        t = F.relu(t)

        t = F.max_pool2d(t, kernel_size=2, stride=2)

        # (3) hidden conv layer

        t = self.conv2(t)

        t = F.relu(t)

        t = F.max_pool2d(t, kernel_size=2, stride=2)

        # (4) hidden Linear layer

        t = t.reshape(-1, 12 * 4 * 4)  # -1表示对行没约束，反正是12*4*4列

        t = self.fc1(t)

        t = F.relu(t)

        # (5) hidden Linear layer

        t = self.fc2(t)

        t = F.relu(t)

        # (6) output layer

        t = self.out(t)

        # t=F.softmax(t,dim=1) #此处不使用softmax函数，因为在训练中我们使用了交叉熵损失函数，而在torch.nn函数类中，已经在其输入中隐式的

        # 执行了一个softmax操作，这里我们只返回最后一个线性变换的结果，也即是 return t，也即意味着我们的网络将使用softmax操作进行训练，但在

        # 训练完成后，将不需要额外的计算操纵。

        return t

network = Network()

for batch_size in batch_size_list:

    for lr in lr_list:

        network = Network()

        data_loader = torch.utils.data.DataLoader(

            train_set, batch_size=batch_size

        )

        optimizer = optim.Adam(

            network.parameters(), lr=lr

        )

        images, labels = next(iter(data_loader))

        grid = torchvision.utils.make_grid(images)

        comment=f' batch_size={batch_size} lr={lr}'

        tb = SummaryWriter(comment=comment)

        tb.add_image('images', grid)

        tb.add_graph(network, images)

        for epoch in range(5):

            total_loss = 0

            total_correct = 0

            for batch in data_loader:

                images, labels = batch # Get Batch

                preds = network(images) # Pass Batch

                loss = F.cross_entropy(preds, labels) # Calculate Loss

                optimizer.zero_grad() # Zero Gradients

                loss.backward() # Calculate Gradients

                optimizer.step() # Update Weights

                total_loss += loss.item() * batch_size#这里上述用的是mini-batch训练方法，一个batch得loss会被平均，所以乘以size得到总和

                total_correct += get_num_correct(preds, labels)

            tb.add_scalar(

                'Loss', total_loss, epoch

            )

            tb.add_scalar(

                'Number Correct', total_correct, epoch

            )

            tb.add_scalar(

                'Accuracy', total_correct / len(train_set), epoch

            )

            for name, param in network.named_parameters():

                tb.add_histogram(name, param, epoch)

                tb.add_histogram(f'{name}.grad', param.grad, epoch)

            print(

                "epoch", epoch

                ,"total_correct:", total_correct

                ,"loss:", total_loss

            )

        tb.close()

f'''

from itertools import product

parameters=dict(lr=[.01,.001],batch_size=[10,100,1000],shuffle=[True,False])

# for i,j in parameters.items():

#     print(i,j,sep='\t')

para_values=[value for value in parameters.values()]

for lr,batch_size,shuffle in product(*para_values):#这里的星号告诉乘积函数把列表中的每个值作为参数，而不是把列表本身作为参数来对待

    comment=f' batch_size={batch_size} lr={lr} shuffle={shuffle}'

    print(lr,batch_size,shuffle)

'''

Tensorboard SummaryWriter()的更多相关文章

（转）Darknet模型与Tensorflow模型相互转换
目前darknet框架下的模型训练都是在C环境下训练的,难免较为晦涩,如果能将模型转换到Tensorflow环境下完成模型的训练,在将训练好的权重转为Darknet可以识别的权重部署到实际应用中.这样 ...
Pytorch入门中 —— 搭建网络模型
本节内容参照小土堆的pytorch入门视频教程,主要通过查询文档的方式讲解如何搭建卷积神经网络.学习时要学会查询文档,这样会比直接搜索良莠不齐的博客更快.更可靠.讲解的内容主要是pytorch核心包中 ...
Pytorch入门下 —— 其他
本节内容参照小土堆的pytorch入门视频教程. 现有模型使用和修改 pytorch框架提供了很多现有模型,其中torchvision.models包中有很多关于视觉(图像)领域的模型,如下图: 下面 ...
Tensorflow学习笔记3：TensorBoard可视化学习
TensorBoard简介 Tensorflow发布包中提供了TensorBoard,用于展示Tensorflow任务在计算过程中的Graph.定量指标图以及附加数据.大致的效果如下所示, Tenso ...
TensorFlow深度学习笔记 Tensorboard入门
转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论官方教程: https://ww ...
TensorBoard 使用和问题解决
TensorBoard 使用和问题解决一.启动TensorBoard 1) python tensorflow/tensorboard/tensorboard.py --logdir=path/to ...
学习TensorFlow，TensorBoard可视化网络结构和参数
在学习深度网络框架的过程中,我们发现一个问题,就是如何输出各层网络参数,用于更好地理解,调试和优化网络?针对这个问题,TensorFlow开发了一个特别有用的可视化工具包:TensorBoard,既可 ...
Tensorboard可视化
# -*- coding: utf-8 -*-"""Created on Sun Nov 5 09:29:36 2017 @author: Admin"&quo ...
学习笔记CB013: TensorFlow、TensorBoard、seq2seq
tensorflow基于图结构深度学习框架,内部通过session实现图和计算内核交互. tensorflow基本数学运算用法. import tensorflow as tf sess = tf.S ...

随机推荐

sring框架的jdbc应用
xml配置 <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http: ...
struts token令牌机制
利用Struts同步令牌(Token)机制来解决Web应用中的重复提交问题.该方法的基本原理是:服务器端在处理到达的request之前,会将request中的Token值与保存在当前用户session ...
基于express框架的留言板实现步骤
这个留言板是基于express框架,和ejs模板引擎,首先需要在根目录安装express框架,然后安装ejs模块和body-parser(获取用户表单提交的数据):建立项目目录 message,然后依 ...
AcWing 1047. 糖果
题目链接题目描述: 由于在维护世界和平的事务中做出巨大贡献,Dzx被赠予糖果公司2010年5月23日当天无限量糖果免费优惠券. 在这一天,Dzx可以从糖果公司的 N 件产品中任意选择若干件带回家享用 ...
IOH和MCH(北桥芯片的变化)
IOH位置架构图示意图北桥芯片-MCH和北桥芯片-IOH区别 1.MCH是内存控制器中心的英文缩写,负责连接CPU,AGP总线和内存, 目前Intel的CPU已经把内存控制器(北桥芯片-MCH)总线 ...
eBPF Cilium实战(2) - 底层网络可观测性
在之前的平台中,对于组件之间的网络流向不具备直接的可观测性,用户组件间通信出现问题,只能通过传统命令行工具进行手动排查,而 cilium 的 Hubble 服务可以提供 UI 界面向用户展示实时的流量 ...
partTwo自动出题程序第一阶段
课堂测试1:像二柱子那样,花二十分钟写一个能自动生成30道小学四则运算题目的 "软件" 代码实现 import java.util.Random;//import java.uti ...
深度剖析text-align家族
大家好,我是半夏,一个刚刚开始写文的沙雕程序员.如果喜欢我的文章,可以关注点赞加我微信:frontendpicker,一起学习交流前端,成为更优秀的工程师-关注公众号:搞前端的半夏,了解更多前端知 ...
netty系列之:netty中的核心MessageToByte编码器
目录简介 MessageToByte框架简介 MessageToByteEncoder ByteToMessageDecoder ByteToMessageCodec 总结简介之前的文章中,我们 ...
使用 GO-CQHttp或mirai框架搭建QQ的机器人
我的博客 Go-CQHttp搭建QQ机器人官方文档在这-->ATRU官方文档 Go-CQHttp + Atri 使用Linux系统部署需求服务器一台/带有Linux的机器 Python环境 ...

Tensorboard SummaryWriter()

Tensorboard SummaryWriter()的更多相关文章

随机推荐

热门专题