使用TorchLens可视化一个简单的神经网络

TorchLens：可用于可视化任何PyTorch模型，一个包用于在一行代码中提取和映射PyTorch模型中每个张量运算的结果。TorchLens功能非常强大，如果能够熟练掌握，算是可视化PyTorch模型的一把利剑。本文通过TorchLens可视化一个简单神经网络，算是抛砖引玉吧。

一.定义一个简单神经网络

import torch

import torch.nn as nn

import torch.optim as optim

import torchlens as tl

import os

os.environ["PATH"] += os.pathsep + 'D:/Program Files/Graphviz/bin/'

# 定义神经网络类

class NeuralNetwork(nn.Module): # 继承nn.Module类

    def __init__(self, input_size, hidden_size, output_size):

        super(NeuralNetwork, self).__init__() # 调用父类的构造函数

        # 定义输入层到隐藏层的线性变换

        self.input_to_hidden = nn.Linear(input_size, hidden_size)

        # 定义隐藏层到输出层的线性变换

        self.hidden_to_output = nn.Linear(hidden_size, output_size)

        # 定义激活函数

        self.sigmoid = nn.Sigmoid()

    def forward(self, x):

        # 前向传播

        hidden = self.sigmoid(self.input_to_hidden(x))

        output = self.sigmoid(self.hidden_to_output(hidden))

        return output

def NeuralNetwork_train(model):

    # 训练神经网络

    for epoch in range(10000):

        optimizer.zero_grad()  # 清零梯度

        outputs = model(input_data)  # 前向传播

        loss = criterion(outputs, labels)  # 计算损失

        loss.backward()  # 反向传播和优化

        optimizer.step()  # 更新参数

        # 每100个epoch打印一次损失

        if (epoch + 1) % 1000 == 0:

            print(f'Epoch [{epoch + 1}/10000], Loss: {loss.item():.4f}')

    return model

def NeuralNetwork_test(model):

    # 在训练后，可以使用模型进行预测

    with torch.no_grad():

        test_input = torch.tensor([[0, 0], [0, 1], [1, 0], [1, 1]], dtype=torch.float32)

        predictions = model(test_input)

        predicted_labels = (predictions > 0.5).float()

        print("Predictions:", predicted_labels)

if __name__ == '__main__':

    # 定义神经网络的参数

    input_size = 2  # 输入特征数量

    hidden_size = 4  # 隐藏层神经元数量

    output_size = 1  # 输出层神经元数量

    # 创建神经网络实例

    model = NeuralNetwork(input_size, hidden_size, output_size)

    # 定义损失函数和优化器

    criterion = nn.BCELoss()  # 二分类交叉熵损失

    optimizer = optim.SGD(model.parameters(), lr=0.1)  # 随机梯度下降优化器

    # 准备示例输入数据和标签

    input_data = torch.tensor([[0, 0], [0, 1], [1, 0], [1, 1]], dtype=torch.float32)

    labels = torch.tensor([[0], [1], [1], [0]], dtype=torch.float32)

    # model：神经网络模型

    # input_data：输入数据

    # layers_to_save：需要保存的层

    # vis_opt：rolled/unrolled，是否展开循环

    model_history = tl.log_forward_pass(model, input_data, layers_to_save='all', vis_opt='unrolled')  # 可视化神经网络

    print(model_history)

    # print(model_history['input_1'].tensor_contents)

    # print(model_history['input_1'])

    tl.show_model_graph(model, input_data)

    # model = NeuralNetwork_train(model) # 训练神经网络

    # NeuralNetwork_test(model) # 测试神经网络

1.神经网络结构

输入层包括2个神经元，隐藏层包括4个神经元，输出层包括1个神经元。

2.log_forward_pass

给定输入x，通过模型运行前向传播，并返回一个包含前向传播日志（层激活和相应的层元数据）的ModelHistory对象。如果vis_opt设置为rolled或unrolled并可视化模型图。

3.show_model_graph

可视化模型图，而不保存任何激活。

4.查看神经网络模型参数

权重(12)+偏置(5)共计17个参数，如下所示：

二.输出结果分析

1.model_history输出结果

Log of NeuralNetwork forward pass: // 神经网络前向传播日志

	Random seed: 1626722175 // 随机种子

	Time elapsed: 1.742s (1.74s spent logging) // 耗时

	Structure: // 结构

		- purely feedforward, no recurrence // 纯前馈，无循环

		- no branching // 无分支

		- no conditional (if-then) branching // 无条件（if-then）分支

		- 3 total modules // 3个模块

	Tensor info: // 张量信息

		- 6 total tensors (976 B) computed in forward pass. // 前向传播中计算的6个张量（976 B）

		- 6 tensors (976 B) with saved activations. // 6个张量（976 B）保存了激活

	Parameters: 2 parameter operations (17 params total; 548 B) // 参数：2个参数操作（总共17个参数；548 B）

	Module Hierarchy: // 模块层次

		input_to_hidden // 输入到隐藏

		sigmoid:1 // sigmoid:1

		hidden_to_output // 隐藏到输出

		sigmoid:2 // sigmoid:2

	Layers (all have saved activations): // 层（所有层都有保存的激活）

		  (0) input_1        // 输入

		  (1) linear_1_1     // 线性

		  (2) sigmoid_1_2    // sigmoid

		  (3) linear_2_3     // 线性

		  (4) sigmoid_2_4    // sigmoid

		  (5) output_1       // 输出

2.show_model_graph输出结果

（1）总共包含6层

分别为input_1、linear_1_1、sigmoid_1_2、linear_2_3、sigmoid_2_4和output_1。

（2）总共6个张量

指的是input_1(160B)、linear_1_1(192B)、sigmoid_1_2(192B)、linear_2_3(144B)、sigmoid_2_4(144B)和output_1(144B)。共计976B。

（3）input_1 4*2(160B)

4*2表示input_1的shape，而160B指的是该张量在内存中占用空间大小，以字节（B）为单位。知道张量的形状和内存占用情况，对于模型内存管理和优化来说是很有用的信息。其它张量信息如下所示：

（4）共计17参数

linear_1_1参数信息为42和4，linear_1_1参数信息为14和1，共计17参数，内存占用548B。

三.遇到的问题

1.需要安装和设置graphviz

subprocess.CalledProcessError: Command '[WindowsPath('dot'), '-Kdot', '-Tpdf', '-O', 'graph.gv']' returned non-zero exit status 1.

解决方案是将D:\Program Files\Graphviz\bin添加到系统环境变量PATH中。

2.AlexNet神经网络

因为BP神经网络过于简单，接下来可视化一个稍微复杂点儿的AlexNet神经网络，如下所示：

参考文献：

[1]torchlens_tutorial.ipynb：https://colab.research.google.com/drive/1ORJLGZPifvdsVPFqq1LYT3t5hV560SoW?usp=sharing#scrollTo=W_94PeNdQsUN

[2]Extracting and visualizing hidden activations and computational graphs of PyTorch models with TorchLens：https://www.nature.com/articles/s41598-023-40807-0

[3]torchlens：https://github.com/johnmarktaylor91/torchlens

[4]Torchlens Model Menagerie：https://drive.google.com/drive/folders/1BsM6WPf3eB79-CRNgZejMxjg38rN6VCb

[5]使用TorchLens可视化一个简单的神经网络：github.com/ai408/nlp-engineering/tree/main/20230917_NLP工程化公众号文章/使用torchlens可视化一个简单的神经网络

使用TorchLens可视化一个简单的神经网络的更多相关文章

tensorflow笔记（二）之构造一个简单的神经网络
tensorflow笔记(二)之构造一个简单的神经网络版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7425200.html ...
Python实现一个简单三层神经网络的搭建并测试
python实现一个简单三层神经网络的搭建(有代码) 废话不多说了,直接步入正题,一个完整的神经网络一般由三层构成:输入层,隐藏层(可以有多层)和输出层.本文所构建的神经网络隐藏层只有一层.一个神经网 ...
python日记：用pytorch搭建一个简单的神经网络
最近在学习pytorch框架,给大家分享一个最最最最基本的用pytorch搭建神经网络并且训练的方法.本人是第一次写这种分享文章,希望对初学pytorch的朋友有所帮助! 一.任务首先说下我们要搭建 ...
pytorch定义一个简单的神经网络
刚学习pytorch,简单记录一下 """ test Funcition """ import torch from torch.autog ...
使用RStudio学习一个简单神经网络
数据准备 1.收集数据 UC Irvine Machine Learning Repository-Concrete Compressive Strength Data Set 把下载到的Concre ...
从程序员的角度设计一个Java的神经网络
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 来自维基百科: 人工神经网络(ANN)或连接系统是受生物神经网络启发构成生物大脑的计算系统.这样的系统通过考虑例子来学习(逐步提高性能)来完成任 ...
pytorch学习笔记（8）--搭建简单的神经网络以及Sequential的使用
1.神经网络图输入图像是3通道的32×32的,先后经过卷积层(5×5的卷积核).最大池化层(2×2的池化核).卷积层(5×5的卷积核).最大池化层(2×2的池化核).卷积层(5×5的卷积核).最大池 ...
C++从零实现简单深度神经网络（基于OpenCV）
代码地址如下:http://www.demodashi.com/demo/11138.html 一.准备工作需要准备什么环境需要安装有Visual Studio并且配置了OpenCV.能够使用Op ...
使用Python来编写一个简单的感知机
来表示.第二个元素是表示期望输出的值. 这个数组定义例如以下: training_data = [ (array([0,0,1]), 0), (array([0,1,1]), 1), (arra ...
tensorflow学习笔记四：mnist实例--用简单的神经网络来训练和测试
刚开始学习tf时,我们从简单的地方开始.卷积神经网络(CNN)是由简单的神经网络(NN)发展而来的,因此,我们的第一个例子,就从神经网络开始. 神经网络没有卷积功能,只有简单的三层:输入层,隐藏层和输 ...

随机推荐

解决element-ui下拉框数据过多，导致页面卡顿问题与本地分页功能实现
效果前情提要: 最近使用element-ui开发的一个页面,在打开的时候占用cpu非常高,有时候都能达到90%↑.在调试时发现其中一个下拉框的接口返回2k↑的数据.本着有问题问百度的精神,看到主要的 ...
【C++ Primer】第二章（2 ~ 6节）
变量变量提供一个具名的.可供程序操作的存储空间. C++中变量和对象一般可以互换使用. 变量定义(define) 定义形式:类型说明符(type specifier) + 一个或多个变量名组成的列表 ...
阿里云ASK试用心得(避坑贴)
前言常年BP阿里云的各种服务,今天却被阿里云给上了一课,这一套组合拳把我安排的明明白白,血亏50大洋,算是提前为各位大佬排坑了,预祝大家中秋快乐目的最近阿里云首页放出了免费试用的活动,本着不用白 ...
从零开始整SpringBoot-搭建一个企业级项目
创建Springboot项目在企业里的项目多数是分Modules的,更多是通过物理方式隔离层之间的职责. 首先按照原有新建SpringBoot项目创建,填好相关信息后,选择Java 8其他不用选. ...
数据结构课后题答案 - XDU_953
参考书: 数据结构与算法分析(第二版) 作者:荣政编出版社:西安电子科技大学出版社出版日期:2021年01月01日答案解析:
【Java】并行执行任务
在实际的应用上,我们平时需要调用第三方的接口,可能会调用多个接口,串行执行的话, 就需要等待所有的接口调用完成之后才获取到结果,那我们有没有并行的方法的呢? 串行执行以下是三个接口,假设他们额的执行 ...
CVPR 2023 | RCF：完全无监督的视频物体分割
TLDR: 视频分割一直是重标注的一个task,这篇CVPR 2023文章研究了完全不需要标注的视频物体分割.仅使用ResNet,RCF模型在DAVIS16/STv2/FBMS59上提升了7/9/5% ...
.net 温故知新【12】：Asp.Net Core WebAPI 中的Rest风格
RPC RPC(Remote Procedure Call),远程过程调用),这种RPC形式的API组织形态是类和方法的形式.所以API的请求往往是一个动词用来标识接口的意思,比如 https://x ...
NSSCTF-[羊城杯 2021]签到题
(脑洞题 gif放在stegsolve,分离gif 大胆猜测! 图一 28准则图二太极八卦阵 8 图三三十而立 30 图四北斗七星 7 图五四个人 4大才子图六这个是歼-20 图七两只 ...
理解ASP.NET Core - 限流（Rate Limiting）
注:本文隶属于<理解ASP.NET Core>系列文章,请查看置顶博客或点击此处查看全文目录概述在微服务化的架构设计中,网关扮演着重要的看门人角色,它所提供的功能之一就是限流.而对于众 ...

使用TorchLens可视化一个简单的神经网络

使用TorchLens可视化一个简单的神经网络的更多相关文章

随机推荐

热门专题