今天作了一个paper reading,感觉论文不错,马克一下~

CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies"



研究视觉问题的同学都知道,视觉问题很多都是多标签的问题,在进行优化的时候,我们都可以把他们转化为能量函数的形式,由数据项和平滑项组成。这些能量函数可以用变分的形式进行表达,当能量函数的项是非凸的话,一般使用梯度下降迭代的方法进行近似求解,有可能只能得到局部极小值。为了求解到全局最优值,我们致力于将非凸问题转化为凸问题,然后进行优化求解。

本篇论文基于泛函提升的方法提出空间连续的凸松弛框架,即将非凸问题转化为凸问题,是一种解决亚标签精度的多标签问题的方法。相比以前泛函提升的方法,该论文的方法能够使用较少的标签推断出不错的结果。这是因为以前方法标签之间是线性的,为了得到一个较好的结果,需要有很多的标签,而该论文的方法标签之间是凸近似的,可以是线性的,也可以是二次的。此外,该论文提出的将非凸问题转化为凸问题的方法,在数学上是最紧的凸松弛,有严格的数学推导。

该论文的整体思路是什么样的呢?现在我们有能量函数的变分表达式,分别对两项求取凸包络,怎么求呢?作者使用两次共轭的方法进行求解,在论文的第三部分有数学推导,这种方法是将非凸问题转化为凸问题最紧的方法。然后对转化后的数学表达式进行优化求解,可以把这个表达式转化为一个鞍点形式,进而使用原对偶的方法进行求解。x相比传统方法,该论文的优势是使用较少的标签,能够推断出空间平滑的结果,减少标签的数量,以视差图为例,如下:

为什么其标签少,还能得到不错的效果呢?请看下图

本篇论文的求解方法,作者公布了代码,他们还在ECCV2016发表了类似的文章,如下:

Code:https://github.com/tum-vision/sublabel_relax

Sublabel-AccurateRelaxation of Nonconvex Energies (T. Möllenhoff,E. Laude, M. Moeller, J. Lellmann, D. Cremers),In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

Sublabel-AccurateConvex Relaxation of Vectorial MultilabelEnergies (E. Laude, T. Möllenhoff, M. Moeller, J. Lellmann,D. Cremers),In European Conference on Computer Vision and Pattern Recognition (ECCV), 2016.

浅析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention的更多相关文章

  1. 深度视觉盛宴——CVPR 2016

    小编按: 计算机视觉和模式识别领域顶级会议CVPR 2016于六月末在拉斯维加斯举行.微软亚洲研究院在此次大会上共有多达15篇论文入选,这背后也少不了微软亚洲研究院的实习生的贡献.大会结束之后,小编第 ...

  2. (转)CVPR 2016 Visual Tracking Paper Review

    CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072 ...

  3. CVPR 2016 paper reading (3)

    DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations, Ziwei Liu, Pin ...

  4. CVPR 2016 paper reading (2)

    1. Sketch me that shoe, Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M. Hospedales, Cheng Chan ...

  5. CVPR 2016 paper reading (6)

    1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fi ...

  6. [CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记

    p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

  7. 论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)

    论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...

  8. Single Image Haze Removal(图像去雾)-CVPR’09 Best Paper

    公式推导 paper闪光点 找到了一个很简洁的假设. paper不足 代码跑起来很慢.据说2010年的ECCV那篇是改进的.

  9. 目标检测网络之 YOLOv2

    YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体. 每个格子预测B个bounding b ...

随机推荐

  1. Spring MVC【入门】就这一篇!

    MVC 设计概述 在早期 Java Web 的开发中,统一把显示层.控制层.数据层的操作全部交给 JSP 或者 JavaBean 来进行处理,我们称之为 Model1: 出现的弊端: JSP 和 Ja ...

  2. 百度tn劫持解决办法

    最近用右键进行百度搜索的时候总是会跳转到 tn=99135173这类的小尾巴,使得搜索失败,十分恶心,这种广告劫持的手段十分高明隐蔽,很难发觉.开始以为是dns劫持或者是电脑中毒了,更换了几个dns, ...

  3. C# Hex编码和解码

    /// 从字符串转换到16进制表示的字符串 /// 编码,如"utf-8","gb2312" /// 是否每字符用逗号分隔 public static stri ...

  4. 列表(list)之一定义 添加 删除 排序 反转 索引等其他操作

    1.定义: 创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可,序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推. # 列表list1=[&q ...

  5. Oracle12c功能增强新特性之维护&升级&恢复&数据泵等

    1.   内容提要 1)   表分区维护的增强. 2)   数据库升级改善. 3)   跨网络还原/恢复数据文件. 4)   数据泵的增强. 5)   实时ADDM. 6)   并发统计信息收集. 2 ...

  6. 小白学习java设计模式之策略模式

    策略模式:1.分析项目中的变化部分与不变部分(每个设计模式都要分析的)2.多用组合少用继承;用行为类组合,而不是行为继承,更具有弹性直接上代码: package com.wz.oneStrategis ...

  7. Event 发布与订阅(一)

    前言 主要讲的是发布与订阅在Event中的一个简单实现用来加深理解. C #中的事件(Event)的理解: 事件具有以下属性:(From Events) 发行者确定何时引发事件:订户确定对事件作出何种 ...

  8. 简陋的个人Vim使用命令

    最近把Visual Studio 的编辑器改成了 Vim,感觉像发现了新世界,记录记录一些提高效率的Vim命令. 插入命令 i 在当前位置前插入 I 在当前行首插入 a 在当前位置后插入 A 在当前行 ...

  9. [POI 2006]OKR-Periods of Words

    Description 题库链接 定义 \(A\) 串为 \(B\) 串的循环串,当且仅当 \(A\) 是 \(B\) 的前缀(不包括 \(B\) 本身),且 \(B\) 为连续的 \(A\) 串拼接 ...

  10. NOIP 2015运输计划

    题目背景 公元 2044 年,人类进入了宇宙纪元. 题目描述 L 国有 n 个星球,还有 n-1 条双向航道,每条航道建立在两个星球之间,这 n-1 条航道连通了 L 国的所有星球. 小 P 掌管一家 ...