英文可查:地址

1.SoftmaxWithLoss

对一对多的分类任务计算多项逻辑斯蒂损失,并通过softmax传递预测值,来获得各类的概率分布。该层可以分解为SoftmaxLayer+MultinomialLogisticLossLayer,但它的梯度计算在数值上更为稳健。在测试时,该层可用SoftmaxLayer替代。

前向传播

bottom: 1.(N×C×H×W)维的预测得分x,N是batch数,类别总数为K=CHW,目前看到的SoftmaxWithLossLayer的bottom一般是一个InnerProduct层,所以K是写在一起的。该层将这些得分通过softmax函数(多项logistic回归模型)映射为概率分布,n∈[0, 1, …, N-1],k、k’∈[0, 1, …, K-1]; 
2.(N×1×1×1)维的标签l,,表示这个bacth中各样本的正确标签。 
top:(1×1×1×1)维,对softmax输出类别概率的交叉熵分类损失

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测得分x,反向计算微分; 
2.(N×1×1×1)维的标签,忽略。 
另外可参考一篇很好的介绍文章:http://blog.csdn.net/u012162613/article/details/44239919

2.EuclideanLoss

对回归任务计算欧氏距离(L2)损失,可用于最小二乘回归任务。

前向传播

bottom: 1.(N×C×H×W)维的预测, 
2.(N×C×H×W)维的真实结果, 
top:(1×1×1×1)维的欧氏距离损失:

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测,反向计算微分; 
2.(N×C×H×W)维的预测,反向计算微分

3.HingeLoss

对一对多的分类任务计算铰链损失。

前向传播

bottom: 1.(N×C×H×W)维的预测t,blob值的范围是,表示对K=CHW中每个类的预测得分。在SVM中,是D维特征和超平面参数的内积,因此只有一个InnerProductLayer(num_output = D)提供预测到HingeLossLayer中的网络就相当于一个SVM; 
2.(N×1×1×1)维的真实标签l,。 
top:(1×1×1×1)维的铰链损失:,对应于正规化,默认是L1正规化,也可以用L2正规化,

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测得分t,反向计算微分; 
2.(N×1×1×1)维的标签,忽略。

4.SigmoidCrossEntropyLoss

计算交叉熵(逻辑斯蒂)损失,通常用于以概率形式预测目标。该层可以分解为SigmoidLayer+CrossEntropyLayer,但它的梯度计算在数值上更为稳健。在测试时,该层可用SigmoidLayer替代。

前向传播

bottom: 1.(N×C×H×W)维的预测得分,是用sigmoid函数的概率预测; 
2.(N×C×H×W)维的真实结果,。 
top:(1×1×1×1)维的交叉熵损失:

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测得分x,反向计算微分; 
2.(N×1×1×1)维的标签,忽略。

5.MultinomialLogisticLossLayer

对一对多的分类任务计算多项逻辑斯蒂损失,直接将预测的概率分布作为输入。当预测并不是概率分布时应该用SoftmaxWithLossLayer,因为它在计算多项逻辑斯蒂损失前通过SoftmaxLayer将预测映射为分布。

前向传播

bottom: 1.(N×C×H×W)维的预测得分,blob值的范围是[0, 1],表示对K=CHW个类中每个类的预测概率。每个预测向量之和为1,
2.(N×1×1×1)维的标签l,,表示这个bacth中各样本的正确标签。 
top:(1×1×1×1)维的多项逻辑斯蒂损失

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测得分,反向计算微分; 
2.(N×1×1×1)维的标签,忽略。

6.InfogainLoss

是MultinomialLogisticLossLayer的泛化,利用“information gain”(infogain)矩阵指定所有标签对的“value“,如果infogain矩阵一致则与MultinomialLogisticLossLayer等价。

前向传播

bottom: 1.(N×C×H×W)维的预测得分,blob值的范围是[0, 1],表示对K=CHW个类中每个类的预测概率。每个预测向量之和为1,
2.(N×1×1×1)维的标签l,,表示这个bacth中各样本的正确标签; 
3.(1×1×K×K)维的infogain矩阵H(相应的另一个为I),若H=I则该层等价于MultinomialLogisticLossLayer。 
top:(1×1×1×1)维的infogain多项逻辑斯蒂损失指的是H的第行。

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×H×W)维的预测得分,反向计算微分; 
2.(N×1×1×1)维的标签,忽略; 
3.(1×1×K×K)维的infogain矩阵,忽略。

7.ContrastiveLoss

计算对比损失,其中,可用于训练siamese网络。

前向传播

bottom: 1.(N×C×1×1)维的特征; 
2.(N×C×1×1)维的特征; 
3.(N×C×1×1)维的二元相似度。 
top:(1×1×K×K)维的对比损失

反向传播

top:(1×1×1×1)维,该blob的微分就是loss_weight λ,λ是该层输出 的系数,整个网络的损失为 ,这样。 
bottom: 1.(N×C×1×1)维的特征a; 
2.(N×C×1×1)维的特征b。

Caffe的loss layer(转)的更多相关文章

  1. 怎样在caffe中添加layer以及caffe中triplet loss layer的实现

    关于triplet loss的原理.目标函数和梯度推导在上一篇博客中已经讲过了.详细见:triplet loss原理以及梯度推导.这篇博文主要是讲caffe下实现triplet loss.编程菜鸟.假 ...

  2. Tutorial: Triplet Loss Layer Design for CNN

    Tutorial:  Triplet Loss Layer Design for CNN Xiao Wang  2016.05.02 Triplet Loss Layer could be a tri ...

  3. caffe 学习(3)——Layer Catalogue

    layer是建模和计算的基本单元. caffe的目录包含各种state-of-the-art model的layers. 为了创建一个caffe model,我们需要定义模型架构在一个protocol ...

  4. Caffe源码-Layer类

    Layer类简介 Layer是caffe中搭建网络的基本单元,caffe代码中包含大量Layer基类派生出来的各种各样的层,各自通过虚函数 Forward() 和 Backward() 实现自己的功能 ...

  5. 在Caffe添加Python layer详细步骤

    本文主要讨论的是在caffe中添加python layer的一般流程,自己设计的test_python_layer.py层只是起到演示作用,没有实际的功能. 1) Python layer 在caff ...

  6. caffe(6) Blob,Layer,Net 以及对应配置文件的编写

    深度网络(net)是一个组合模型,它由许多相互连接的层(layers)组合而成.Caffe就是组建深度网络的这样一种工具,它按照一定的策略,一层一层的搭建出自己的模型.它将所有的信息数据定义为blob ...

  7. 【caffe】loss function、cost function和error

    @tags: caffe 机器学习 在机器学习(暂时限定有监督学习)中,常见的算法大都可以划分为两个部分来理解它 一个是它的Hypothesis function,也就是你用一个函数f,来拟合任意一个 ...

  8. caffe调loss方法

    正文 what should I do if... ...my loss diverges? (increases by order of magnitude, goes to inf. or NaN ...

  9. 画caffe训练loss曲线

    Linux下操作 1. 将loss值存储到lossInf.txt中 fName1='loss.txt' cat loss.log | grep "solver.cpp:218] Iterat ...

随机推荐

  1. 10条SQL优化语句,让你的MySQL数据库跑得更快!

    慢SQL消耗了70%~90%的数据库CPU资源: SQL语句独立于程序设计逻辑,相对于对程序源代码的优化,对SQL语句的优化在时间成本和风险上的代价都很低: SQL语句可以有不同的写法: 1 不使用子 ...

  2. mysql DDL、DML、DCL、DQL区分

    mysql [Structure Query Language] 的组成分4个部分: DDL     [Data Mefinition Language]    数据定义语言 DML    [Data ...

  3. Oracle 11G RAC For Windows 2008 R2部署手册(亲测,成功实施多次)

    总体规划 服务器规划 1.建议使用两台硬件配置一模一样的服务器来作为 RAC 环境的两个物理节点 2.服务器至少需要配置两块物理网卡 3.服务器规划表: 节点 主机名 本地磁盘大小 操作系统 内存大小 ...

  4. [转帖] 磁盘IOPS 简介 -- 虽然自己知道有这么一回事 但是自己还是没有系统的总结.

    来源: https://www.cnblogs.com/zengkefu/p/5634299.html 机械硬盘的连续读写性很好, 但随机读写性能很差.这是因为磁头移动至正确的磁道上需要时间,随机读写 ...

  5. [转帖]“剖开” LinuxONE 和 Exadata,架构专家解读里面到底有什么

    “剖开” LinuxONE 和 Exadata,架构专家解读里面到底有什么 http://server.zhiding.cn/server/2018/0914/3111044.shtml    说起I ...

  6. 微信 小程序布局 swiper 页面

    JS // pages/classify/swiper.js Page({ /** * 页面的初始数据 */ data: { current:0   }, titleBtn:function(e){ ...

  7. Dapper 事务处理

    例子: using (var connection = GetOpenConnection()) using (var transaction = connection.BeginTransactio ...

  8. 关于BIO和NIO的理解

    摘要: 关于BIO和NIO的理解 最近大概看了ZooKeeper和Mina的源码发现都是用Java NIO实现的,所以有必要搞清楚什么是NIO.下面是我结合网络资料自己总结的,为了节约时间图示随便画的 ...

  9. 关于JavaScript诞生之初的趣事

    我在读很多优秀的JavaScript源码时候常常被它诡异的语法搞的精疲力尽,所以时不时的加固JavaScript基础知识是十分有必要的,这些知识每次温故或者你换个角度去思考都能收获颇多,那么如此深不可 ...

  10. YY淘宝商品数据库设计

    http://www.cnblogs.com/mmmjiang13/archive/2010/11/04/1868609.html 前言 这几个月都在做一个通过淘宝API线下管理淘宝店的系统,学习了很 ...