torch.nn.functional中softmax的作用及其参数说明

参考：https://pytorch-cn.readthedocs.io/zh/latest/package_references/functional/#_1

class torch.nn.Softmax(input, dim)

或：

torch.nn.functional.softmax(input, dim)

对n维输入张量运用Softmax函数，将张量的每个元素缩放到（0,1）区间且和为1。Softmax函数定义如下：

参数：

　　dim:指明维度，dim=0表示按列计算；dim=1表示按行计算。默认dim的方法已经弃用了，最好声明dim，否则会警告：

UserWarning: Implicit dimension choice for softmax has been deprecated. Change the call to include dim=X as an argument.

shape：

输入：(N, L)
输出：(N, L)

返回结果是一个与输入维度dim相同的张量，每个元素的取值范围在（0,1）区间。

例子：

import torch

from torch import nn

from torch import autograd

m = nn.Softmax()

input = autograd.Variable(torch.randn(, ))

print(input)

print(m(input))

(deeplearning) userdeMBP:pytorch user$ python test.py

tensor([[ 0.2854,  0.1708,  0.4308],

        [-0.1983,  2.0705,  0.1549]])

test.py:: UserWarning: Implicit dimension choice for softmax has been deprecated. Change the call to include dim=X as an argument.

  print(m(input))

tensor([[0.3281, 0.2926, 0.3794],

        [0.0827, 0.7996, 0.1177]])

可见默认按行计算，即dim=1

更明显的例子：

import torch

import torch.nn.functional as F

x= torch.Tensor( [ [,,,],[,,,],[,,,]])

y1= F.softmax(x, dim = ) #对每一列进行softmax

print(y1)

y2 = F.softmax(x,dim =) #对每一行进行softmax

print(y2)

x1 = torch.Tensor([,,,])

print(x1)

y3 = F.softmax(x1,dim=) #一维时使用dim=，使用dim=1报错

print(y3)

(deeplearning) userdeMBP:pytorch user$ python test.py

tensor([[0.3333, 0.3333, 0.3333, 0.3333],

        [0.3333, 0.3333, 0.3333, 0.3333],

        [0.3333, 0.3333, 0.3333, 0.3333]])

tensor([[0.0321, 0.0871, 0.2369, 0.6439],

        [0.0321, 0.0871, 0.2369, 0.6439],

        [0.0321, 0.0871, 0.2369, 0.6439]])

tensor([., ., ., .])

tensor([0.0321, 0.0871, 0.2369, 0.6439])

因为列的值相同，所以按列计算时每一个所占的比重都是0.3333；行都是[1,2,3,4]，所以按行计算，比重结果都为[0.0321, 0.0871, 0.2369, 0.6439]

一维使用dim=1报错：

RuntimeError: Dimension out of range (expected to be in range of [-, ], but got )

torch.nn.functional中softmax的作用及其参数说明的更多相关文章

从 relu 的多种实现来看 torch.nn 与 torch.nn.functional 的区别与联系
从 relu 的多种实现来看 torch.nn 与 torch.nn.functional 的区别与联系 relu多种实现之间的关系 relu 函数在 pytorch 中总共有 3 次出现: torc ...
PyTorch : torch.nn.xxx 和 torch.nn.functional.xxx
PyTorch : torch.nn.xxx 和 torch.nn.functional.xxx 在写 PyTorch 代码时,我们会发现一些功能重复的操作,比如卷积.激活.池化等操作.这些操作分别可 ...
[pytorch笔记] torch.nn vs torch.nn.functional; model.eval() vs torch.no_grad(); nn.Sequential() vs nn.moduleList
1. torch.nn与torch.nn.functional之间的区别和联系 https://blog.csdn.net/GZHermit/article/details/78730856 nn和n ...
Pytorch本人疑问(1) torch.nn和torch.nn.functional之间的区别
在写代码时发现我们在定义Model时,有两种定义方法: torch.nn.Conv2d()和torch.nn.functional.conv2d() 那么这两种方法到底有什么区别呢,我们通过下述代码看 ...
pytorch torch.nn.functional实现插值和上采样
interpolate torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', ali ...
PyTorch官方中文文档：torch.nn
torch.nn Parameters class torch.nn.Parameter() 艾伯特(http://www.aibbt.com/)国内第一家人工智能门户,微信公众号:aibbtcom ...
Pytorch中pad函数toch.nn.functional.pad()的用法
padding操作是给图像外围加像素点. 为了实际说明操作过程,这里我们使用一张实际的图片来做一下处理. 这张图片是大小是(256,256),使用pad来给它加上一个黑色的边框.具体代码如下: 1 2 ...
torch.nn 的本质
torch.nn 的本质 PyTorch 提供了各种优雅设计的 modules 和类 torch.nn,torch.optim,Dataset 和 DataLoader 来帮助你创建并训练神经网络.为 ...
到底什么是TORCH.NN？
该教程是在notebook上运行的,而不是脚本,下载notebook文件. PyTorch提供了设计优雅的模块和类:torch.nn, torch.optim, Dataset, DataLoader ...

随机推荐

洛谷P4723 【模板】线性递推(多项式取模线性代数)
题意题目链接 Sol Orz shadowice 注意,下面的代码自带O(随时TLE)倍大常数.. #include<bits/stdc++.h> #define Pair pair&l ...
2018-10-04 [日常]用Python读取word文档中的表格并比较
最近想对某些word文档(docx)的表格内容作比较, 于是找了一下相关工具. 参考Automate the Boring Stuff with Python中的word部分, 试用了python-d ...
Human Motion Analysis with Wearable Inertial Sensors——阅读2
Human Motion Analysis with Wearable Inertial Sensors 实时人体运动跟踪已经应用于生物医学领域的许多应用:临床步态分析,运动康复,跌倒检测,关节生物力 ...
Python 多线程并发程序设计与分析
多线程并发程序设计与分析 by:授客 QQ:1033553122 1．技术难点分析与总结难点1:线程运行时,运行顺序不固定难点2:同一段代码,再不加锁的情况下,可能被多个线程同时执行,这会造成很多 ...
「破解」Xposed强
「破解」Xposed强 Hook Hook Hook! 两张图片,第一张是我的微信截图,第二张是我从微信Hook出的一些类名. 一段代码,Hook这些类名出来的源码. 知道这些我们能干嘛,当然是分析( ...
[Objective-C] Copy 和 MutableCopy
看了几篇文章,因为文章很新手向,所以内容很繁琐.故整理一下重点,写了测试程序去了解几个知识点,不讨论基本概念.新博客wossoneri.com传送门非集合类对象的copy与mutableCopy / ...
[翻译]LVM中逻辑卷的最大大小限制
前言: 本文是对这篇博客Maximum Size Of A Logical Volume In LVM的翻译,敬请尊重原创和翻译劳动成果,那些随意转载的大爷们,好歹也自觉注明出处.谢谢! 英文原文地址 ...
java笔记----常见的异常
常见的可控异常运行时的异常异常信息的获取
KMP算法详解-彻底清楚了(转载+部分原创)
引言 KMP算法指的是字符串模式匹配算法,问题是:在主串T中找到第一次出现完整子串P时的起始位置.该算法是三位大牛:D.E.Knuth.J.H.Morris和V.R.Pratt同时发现的,以其名字首字 ...
Foreach用法
循环语句是编程的基本语句,在C#中除了沿用C语言的循环语句外,还提供了foreach语句来实现循环.那么我要说的就是,在循环操作中尽量使用foreach语句来实现. 为了来更好地说明为什么要提倡使 ...

torch.nn.functional中softmax的作用及其参数说明

torch.nn.functional中softmax的作用及其参数说明的更多相关文章

随机推荐

热门专题