今天作了一个paper reading,感觉论文不错,马克一下~

CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies"



研究视觉问题的同学都知道,视觉问题很多都是多标签的问题,在进行优化的时候,我们都可以把他们转化为能量函数的形式,由数据项和平滑项组成。这些能量函数可以用变分的形式进行表达,当能量函数的项是非凸的话,一般使用梯度下降迭代的方法进行近似求解,有可能只能得到局部极小值。为了求解到全局最优值,我们致力于将非凸问题转化为凸问题,然后进行优化求解。

本篇论文基于泛函提升的方法提出空间连续的凸松弛框架,即将非凸问题转化为凸问题,是一种解决亚标签精度的多标签问题的方法。相比以前泛函提升的方法,该论文的方法能够使用较少的标签推断出不错的结果。这是因为以前方法标签之间是线性的,为了得到一个较好的结果,需要有很多的标签,而该论文的方法标签之间是凸近似的,可以是线性的,也可以是二次的。此外,该论文提出的将非凸问题转化为凸问题的方法,在数学上是最紧的凸松弛,有严格的数学推导。

该论文的整体思路是什么样的呢?现在我们有能量函数的变分表达式,分别对两项求取凸包络,怎么求呢?作者使用两次共轭的方法进行求解,在论文的第三部分有数学推导,这种方法是将非凸问题转化为凸问题最紧的方法。然后对转化后的数学表达式进行优化求解,可以把这个表达式转化为一个鞍点形式,进而使用原对偶的方法进行求解。x相比传统方法,该论文的优势是使用较少的标签,能够推断出空间平滑的结果,减少标签的数量,以视差图为例,如下:

为什么其标签少,还能得到不错的效果呢?请看下图

本篇论文的求解方法,作者公布了代码,他们还在ECCV2016发表了类似的文章,如下:

Code:https://github.com/tum-vision/sublabel_relax

Sublabel-AccurateRelaxation of Nonconvex Energies (T. Möllenhoff,E. Laude, M. Moeller, J. Lellmann, D. Cremers),In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

Sublabel-AccurateConvex Relaxation of Vectorial MultilabelEnergies (E. Laude, T. Möllenhoff, M. Moeller, J. Lellmann,D. Cremers),In European Conference on Computer Vision and Pattern Recognition (ECCV), 2016.

浅析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention的更多相关文章

  1. 深度视觉盛宴——CVPR 2016

    小编按: 计算机视觉和模式识别领域顶级会议CVPR 2016于六月末在拉斯维加斯举行.微软亚洲研究院在此次大会上共有多达15篇论文入选,这背后也少不了微软亚洲研究院的实习生的贡献.大会结束之后,小编第 ...

  2. (转)CVPR 2016 Visual Tracking Paper Review

    CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072 ...

  3. CVPR 2016 paper reading (3)

    DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations, Ziwei Liu, Pin ...

  4. CVPR 2016 paper reading (2)

    1. Sketch me that shoe, Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M. Hospedales, Cheng Chan ...

  5. CVPR 2016 paper reading (6)

    1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fi ...

  6. [CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记

    p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

  7. 论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)

    论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...

  8. Single Image Haze Removal(图像去雾)-CVPR’09 Best Paper

    公式推导 paper闪光点 找到了一个很简洁的假设. paper不足 代码跑起来很慢.据说2010年的ECCV那篇是改进的.

  9. 目标检测网络之 YOLOv2

    YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体. 每个格子预测B个bounding b ...

随机推荐

  1. LeetCode169:Majority Element(Hash表\位操作未懂)

    题目来源: Given an array of size n, find the majority element. The majority element is the element that ...

  2. 【linux之sed及vim】

    一.sed sed 文本处理工具 流编辑器 行编辑器保留空间模式空间sed不会影响原文件的内容,它处理的是它载入模式空间的内容 sed [options].."AddressCommand& ...

  3. preg_replace引发的phpmyadmin(4.3.0-4.6.2)命令执行漏洞

    编辑器坏了 (:  今天看到这个phpmyadmin的代码执行,https://www.waitalone.cn/phpmyadmin-preg_replace-rce.html 记录一下:preg_ ...

  4. [HAOI2016]找相同字符

    题目描述 给定两个字符串,求出在两个字符串中各取出一个子串使得这两个子串相同的方案数.两个方案不同当且仅当这两个子串中有一个位置不同. 输入输出格式 输入格式: 两行,两个字符串s1,s2,长度分别为 ...

  5. [SDOI2009]HH的项链

    题目描述 HH 有一串由各种漂亮的贝壳组成的项链.HH 相信不同的贝壳会带来好运,所以每次散步完后,他都会随意取出一段贝壳,思考它们所表达的含义.HH 不断地收集新的贝壳,因此,他的项链变得越来越长. ...

  6. [HNOI2011]数学作业

    题目描述 小 C 数学成绩优异,于是老师给小 C 留了一道非常难的数学作业题: 给定正整数 N 和 M,要求计算 Concatenate (1 .. N) Mod M 的值,其中 Concatenat ...

  7. 【线段树】【BZOJ1798】【AHOI2009】维护序列

    还是那个学弟@lher出的丧题之一. 链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1798 题意简析:就是题目啊... 解题思路:显然是线段树 ...

  8. HDU 1729

    给定一个m × n (m行, n列)的迷宫,迷宫中有两个位置,gloria想从迷宫的一个位置走到另外一个位置 她在行走过程中,不能转太多弯了,否则她会晕倒的. (每次在一个方向上一直走到底,并push ...

  9. Win7删除文件夹提示找不到该项目无法删除

    在使用win7操作系统的过程中,有一些朋友会遇到这种情况,因为某种不明原因,硬盘里面某一个文件夹无法删除,表现为在删除的时候,系统提示找不到该项目,即找不到该文件夹,就像它变成了幽灵一样,看得到却摸不 ...

  10. TCP 通信

    一.TCP与UDP的区别 二.ServerSocket与Socket 1 ServerSocket 以上介绍的几个构造方法中,第二个构造方法最常用. 2.Socket import java.io.* ...