【转载】softmax的性质及其实现

原文地址：https://segmentfault.com/a/1190000010039529?utm_source=tag-newest

softmax函数将任意n维的实值向量转换为取值范围在(0,1)之间的n维实值向量，并且总和为1。

例如：向量softmax([1.0, 2.0, 3.0]) ------> [0.09003057, 0.24472847, 0.66524096]

性质：

因为softmax是单调递增函数，因此不改变原始数据的大小顺序。
将原始输入映射到(0,1)区间，并且总和为1，常用于表征概率。
softmax(x) = softmax(x+c), 这个性质用于保证数值的稳定性。

softmax的实现及数值稳定性

一个最简单的计算给定向量的softmax的实现如下：

import numpy as np

def softmax(x):

"""Compute the softmax of vector x."""

    exp_x = np.exp(x)

    softmax_x = exp_x / np.sum(exp_x)

    return softmax_x

让我们来测试一下上面的代码：

softmax([1, 2, 3])

array([0.09003057, 0.24472847, 0.66524096])

但是，当我们尝试输入一个比较大的数值向量时，就会出错：

softmax([1000, 2000, 3000])

array([nan, nan, nan])

这是由numpy中的浮点型数值范围限制所导致的。当输入一个较大的数值时，sofmax函数将会超出限制，导致出错。
为了解决这一问题，这时我们就能用到sofmax的第三个性质，即：softmax(x) = softmax(x+c)，
一般在实际运用中，通常设定c = - max(x)。
接下来，我们重新定义softmax函数：

import numpy as np

def softmax(x):

"""Compute the softmax in a numerically stable way."""

    x = x - np.max(x)

    exp_x = np.exp(x)

    softmax_x = exp_x / np.sum(exp_x)

    return softmax_x

然后再次测试一下：

softmax([1000, 2000, 3000])

array([ 0.,  0.,  1.])

Done!

以上都是基于向量上的softmax实现，下面提供了基于向量以及矩阵的softmax实现，代码如下：

import numpy as np

def softmax(x):

    """

    Compute the softmax function for each row of the input x.

    Arguments:

    x -- A N dimensional vector or M x N dimensional numpy matrix.

    Return:

    x -- You are allowed to modify x in-place

    """

    orig_shape = x.shape

    if len(x.shape) > 1:

        # Matrix

        exp_minmax = lambda x: np.exp(x - np.max(x))

        denom = lambda x: 1.0 / np.sum(x)

        x = np.apply_along_axis(exp_minmax,1,x)

        denominator = np.apply_along_axis(denom,1,x) 

        if len(denominator.shape) == 1:

            denominator = denominator.reshape((denominator.shape[0],1))

        x = x * denominator

    else:

        # Vector

        x_max = np.max(x)

        x = x - x_max

        numerator = np.exp(x)

        denominator =  1.0 / np.sum(numerator)

        x = numerator.dot(denominator)

    assert x.shape == orig_shape

    return x

【转载】softmax的性质及其实现的更多相关文章

Softmax vs. Softmax-Loss VS cross-entropy损失函数 Numerical Stability(转载)
http://freemind.pluskid.org/machine-learning/softmax-vs-softmax-loss-numerical-stability/ 卷积神经网络系列之s ...
【转载】softmax的log似然代价函数（求导过程）
全文转载自:softmax的log似然代价函数(公式求导) 在人工神经网络(ANN)中,Softmax通常被用作输出层的激活函数.这不仅是因为它的效果好,而且因为它使得ANN的输出值更易于理解.同时, ...
【转载】深度学习中softmax交叉熵损失函数的理解
深度学习中softmax交叉熵损失函数的理解 2018-08-11 23:49:43 lilong117194 阅读数 5198更多分类专栏: Deep learning 版权声明:本文为博主原 ...
Catalan 数列的性质及其应用（转载）
转自:http://lanqi.org/skills/10939/ 卡特兰数 — 计数的映射方法的伟大胜利发表于2015年11月8日由意琦行卡特兰(Catalan)数来源于卡特兰解决凸$n+2$边 ...
转载：sigmoid和softmax总结
转自:http://blog.csdn.net/u014422406/article/details/52805924 sigmoid函数(也叫逻辑斯谛函数): 引用wiki百科的定义: A logi ...
全连接与softmax[转载]
转自:https://www.jianshu.com/p/88bb976ccbd9 1.全连接示例: 2.softmax softmax输入层应和输出层(输出维度与类别数一致)纬度一样,如果不一样,就 ...
Machine Learning 学习笔记 (3) —— 泊松回归与Softmax回归
本系列文章允许转载,转载请保留全文! [请先阅读][说明&总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 泊松回归 (Poisson ...
（转载）经典计算机视觉论文笔记——DeepFace\DeepID\DeepID2\DeepID3\FaceNet\VGGFace汇总
1. DeepFace:Closing the Gap to Human-Level Performance in Face Verification 最早将深度学习用于人脸验证的开创性工作.Face ...
逻辑回归与神经网络还有Softmax regression的关系与区别
本文讨论的关键词:Logistic Regression(逻辑回归).Neural Networks(神经网络) 之前在学习LR和NN的时候,一直对它们独立学习思考,就简单当做是机器学习中的两个不同的 ...

随机推荐

python爬虫添加请求头
request import requests headers = { # 'Accept': 'application/json, text/javascript, */*; q=0.01', # ...
JVM（九），垃圾回收回收算法
九.垃圾回收回收算法 1.标记-清除(Mark and Sweep) 缺点是内存空间碎片化太严重 2.复制算法(Copying) (1)复制算法介绍 (2)复制算法优势 3.标记-整理算法(Compa ...
html5文件夹上传下载组件
我们平时经常做的是上传文件,上传文件夹与上传文件类似,但也有一些不同之处,这次做了上传文件夹就记录下以备后用. 这次项目的需求: 支持大文件的上传和续传,要求续传支持所有浏览器,包括ie6,ie7,i ...
图论小专题A
大意失荆州.今天考试一到可以用Dijkstra水过的题目我竟然没有做出来,这说明基础还是相当重要.考虑到我连Tarjan算法都不太记得了,我决定再过一遍蓝皮书,对图论做一个小的总结.图论这个部分可能会 ...
python2topython3遇到的问题
安装vncserver, vncviewer--远程桌面
1 问题如下 /etc/sysconfig/vncservers---配置文件作用去掉最后两行的注释 no route to host 是防火墙的原因---必须得研究好防火墙本地可以vnc,本地 ...
Anaconda 改为国内镜像的方法
Anaconda的conda 特别好用但如果用国外的镜像,慢的出奇可以改为了国内镜像会好很多 conda config --add channels https://mirrors.tuna.ts ...
警告（alert）、确认（confirm）
我们在访问网站的时候,有时会突然弹出一个小窗口,上面写着一段提示信息文字.如果你不点击“确定”,就不能对网页做任何操作,这个小窗口就是使用alert实现的. 语法: alert(字符串或变量);注:a ...
android下载网络图片，设置宽高，等比缩放
使用Picasso组件去下载图片会发现图片宽高会变形不受等比缩放控制,即使设置了图片的 scaleType,可能是对Picasso的api没有用对, Picasso.with(this.activit ...
剑指XX游戏(六) - 轻松搞定面试中的红黑树问题
原文地址 http://blog.csdn.net/silangquan/article/details/18655795?utm_source=tuicool&utm_medium=refe ...

【转载】softmax的性质及其实现

softmax的实现及数值稳定性

【转载】softmax的性质及其实现的更多相关文章

随机推荐

热门专题