Eltwise层解析

Concat层虽然利用到了上下文的语义信息，但仅仅是将其拼接起来，之所以能起到效果，在于它在不增加算法复杂度的情形下增加了channel数目。那有没有直接关联上下文的语义信息呢？答案是Eltwise层，被广泛使用，屡试不爽，并且我们常常拿它和Concat比较，所以我常常一起说这两个层。我们普遍认为，像这样的“encoder-decoder”的过程，有助于利用较高维度的feature map信息，有利于提高小目标的检测效果。

Eltwise层有三种类型的操作：product(点乘)、sum(求和)、max(取最大值)，顾名思义，sum就是把bottom的对应元素相加，product就是对应相乘，max就是对应取最大，其中sum为默认操作。根据eltwise_layer.cpp的源码可见，eltwise层要求对应bottom层的blob一致，这才能是对应元素嘛。得到的结果top层的blob和bottom层一致，这个过程想象成三维的过程很好理解。

template <typename Dtype>

void EltwiseLayer<Dtype>::Reshape(const vector<Blob<Dtype>*>& bottom,

      const vector<Blob<Dtype>*>& top) {

  for (int i = ; i < bottom.size(); ++i) {

    CHECK(bottom[i]->shape() == bottom[]->shape());

  }

  top[]->ReshapeLike(*bottom[]);

  // If max operation, we will initialize the vector index part.

  if (this->layer_param_.eltwise_param().operation() ==

      EltwiseParameter_EltwiseOp_MAX && top.size() == ) {

    max_idx_.Reshape(bottom[]->shape());

  }

}

至于书写应用格式嘛，看看resnet。

layer {

    bottom: "res2a_branch1"

    bottom: "res2a_branch2c"

    top: "res2a"

    name: "res2a"

    type: "Eltwise"

}

layer {

    bottom: "res5a_branch1"

    bottom: "res5a_branch2c"

    top: "res5a"

    name: "res5a"

    type: "Eltwise"

}

这个书写的次序可能看着有点不舒服，但不影响使用。上面都是使用的默认sum的Eltwise。

如果需要指定操作，就应该这样：

layer {

    name: "res2b1"

    type: "Eltwise"

    bottom: "pool1"

    bottom: "res2b1_branch2b"

    top: "res2b1"

    eltwise_param{

        operation:SUM //operation:PROD或者operation:MAX

} }

另外，如果要实现相减，类似也可以实现其它的加权求和或相减，例如：

layer

{

  name: "res2b1"

  type: "Eltwise"

  bottom: "pool1"

  bottom: "res2b1_branch2b"

  top: "res2b1"

  eltwise_param {

    operation: SUM

    coeff:

    coeff: -

  }

}

注意coeff参数只对sum起作用，并且有多少个bottom就有多少个coeff。

总结：虽然上面说了这么多，但是sum操作仍然是我们用的最多的。效果上，Eltwise因为更直接的利用了上下文信息，所以精度提高，但是Eltwise的操作却增加了算法耗时，而Concat层虽然提高的精度没有Eltwise那么明显，但是训练和测试速度相对快了一点，所以应用时更看如何权衡两者能不能满足自己项目的需求。

Eltwise层解析的更多相关文章

Caffe 学习：Eltwise层
Eltwise层的操作有三个: 1. PROD(product):按元素乘积 2. SUM:按元素求和(默认操作) 3. MAX:保存元素大者
slice层解析
如果说之前的Concat是将多个bottom合并成一个top的话,那么这篇博客的slice层则完全相反,是把一个bottom分解成多个top,这带来了一个问题,为什么要这么做呢?为什么要把一个低层的切 ...
Concat层解析
Concat层的作用就是将两个及以上的特征图按照在channel或num维度上进行拼接,并没有eltwise层的运算操作,举个例子,如果说是在channel维度上进行拼接conv_9和deconv_9 ...
eltwise层
http://blog.csdn.net/u013989576/article/details/73294131 layer { name: "fuse" type: " ...
json两层解析
public class Demo { public static void main(String[] args) { try { // 创建连接服务器的连接地址 URL url = new UR ...
Caffe_Scale层解析
Caffe Scale层解析前段时间做了caffe的batchnormalization层的解析,由于整体的BN层实现在Caffe是分段实现的,因此今天抽时间总结下Scale层次,也会后续两个层做合 ...
ASP.NET SignalR2持久连接层解析
越是到年底越是感觉浑身无力,看着啥也不想动,只期盼着年终奖的到来以此来给自己打一针强心剂.估摸着大多数人都跟我一样犯着这样浑身无力的病,感觉今年算是没挣到啥钱,但是话也不能这么说,搞得好像去年挣到钱了 ...
Euclideanloss_layer层解析
这里说一下euclidean_loss_layer.cpp关于该欧式loss层的解析,代码如下: #include <vector> #include "caffe/layers ...
Spring的Service层与Dao层解析
本文转载于网络,觉得写得很透彻. dao完成连接数据库修改删除添加等的实现细节,例如sql语句是怎么写的,怎么把对象放入数据库的.service层是面向功能的,一个个功能模块比如说银行登记并完成一次存 ...

随机推荐

多校联赛7 1001 hdu 4666（最远哈曼顿距离+优先队列）
吐个糟,尼玛今天被虐成狗了,一题都没搞出来,这题搞了N久居然还是搞不出来,一直TLE,最后还是参考别人代码才领悟的,思路就这么简单, 就是不会转弯,看着模板却不会改,艹,真怀疑自己是不是个笨蛋题意:求 ...
【Python】使用python操作mysql数据库
这是我之前使用mysql时用到的一些库及开发的工具,这里记录下,也方便我查阅. python版本: 2.7.13 mysql版本: 5.5.36 几个python库 1.mysql-connector ...
BZOJ5102 POI2018Prawnicy（堆）
考虑固定右端点,使左端点最小.那么按右端点排序后查询前缀这些区间的左端点第k小即可.然而写了一个treap一个线段树都T飞了,感觉惨爆.事实上可以用堆求第k小,维护一个大根堆保证堆中元素不超过k个即可 ...
How Many Points? LightOJ - 1077（线段经过整点个数与gcd 证明）
题意: 已知两点 (x1,y1) 和 (x2, y2)求两点间线段上的整点的个数解析: 就是求gcd(abs(x2- x1),abs(y2 - y1)) 证明: 我们分水平方向和竖直方向两个方向看 ...
【BZOJ3622】已经没有什么好害怕的了（动态规划，容斥）
[BZOJ3622]已经没有什么好害怕的了(动态规划,容斥) 题面 BZOJ 题解很明显的,这类问题是要从至少变成恰好的过程,直接容斥即可. 首先我们要求的是(糖果>药片)=(药片>糖果 ...
51nod 1571 最近等对 | 线段树离线
51nod 1571 最近等对题面现在有一个序列 a1, a2, ..., an ,还有m个查询 lj, rj (1 ≤ lj ≤ rj ≤ n) .对于每一个查询,请找出距离最近的两个元素 ax ...
浅谈Tarjan算法及思想
在有向图G中,如果两个顶点间至少存在一条路径,称两个顶点强连通(strongly connected).如果有向图G的每两个顶点都强连通,称G是一个强连通图.非强连通图有向图的极大强连通子图,称为强连 ...
【Cf #290 B】Fox And Jumping（dp，扩展gcd）
根据裴蜀定理,当且仅当选出来的集合的L[i]的gcd等于1时,才能表示任何数. 考虑普通的dp,dp[i][j]表示前i个数gcd为j的最少花费,j比较大,但状态数不多,拿个map转移就好了. $ \ ...
Linux内核分析期中知识点总结
Linux内核分析期中知识点总结 1. 计算机是如何工作的存储程序计算机工作模型:冯诺依曼体系结构 X86汇编基础会变一个简单的C程序分析其汇编指令执行过程 2. 操作系统是如何工作的函数调用堆 ...
单点登录(二)----实战------简单搭建CAS---测试认证方式搭建CAS
我们在上一篇文章中已经介绍了cas以及它的工作流程. 单点登录(一)-----理论-----单点登录SSO的介绍和CAS+选型本章我们开始动手搭建一个完整的cas服务实现2个web之间的单点登录. ...

Eltwise层解析

Eltwise层解析的更多相关文章

随机推荐

热门专题