今天作了一个paper reading,感觉论文不错,马克一下~

CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies"



研究视觉问题的同学都知道,视觉问题很多都是多标签的问题,在进行优化的时候,我们都可以把他们转化为能量函数的形式,由数据项和平滑项组成。这些能量函数可以用变分的形式进行表达,当能量函数的项是非凸的话,一般使用梯度下降迭代的方法进行近似求解,有可能只能得到局部极小值。为了求解到全局最优值,我们致力于将非凸问题转化为凸问题,然后进行优化求解。

本篇论文基于泛函提升的方法提出空间连续的凸松弛框架,即将非凸问题转化为凸问题,是一种解决亚标签精度的多标签问题的方法。相比以前泛函提升的方法,该论文的方法能够使用较少的标签推断出不错的结果。这是因为以前方法标签之间是线性的,为了得到一个较好的结果,需要有很多的标签,而该论文的方法标签之间是凸近似的,可以是线性的,也可以是二次的。此外,该论文提出的将非凸问题转化为凸问题的方法,在数学上是最紧的凸松弛,有严格的数学推导。

该论文的整体思路是什么样的呢?现在我们有能量函数的变分表达式,分别对两项求取凸包络,怎么求呢?作者使用两次共轭的方法进行求解,在论文的第三部分有数学推导,这种方法是将非凸问题转化为凸问题最紧的方法。然后对转化后的数学表达式进行优化求解,可以把这个表达式转化为一个鞍点形式,进而使用原对偶的方法进行求解。x相比传统方法,该论文的优势是使用较少的标签,能够推断出空间平滑的结果,减少标签的数量,以视差图为例,如下:

为什么其标签少,还能得到不错的效果呢?请看下图

本篇论文的求解方法,作者公布了代码,他们还在ECCV2016发表了类似的文章,如下:

Code:https://github.com/tum-vision/sublabel_relax

Sublabel-AccurateRelaxation of Nonconvex Energies (T. Möllenhoff,E. Laude, M. Moeller, J. Lellmann, D. Cremers),In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

Sublabel-AccurateConvex Relaxation of Vectorial MultilabelEnergies (E. Laude, T. Möllenhoff, M. Moeller, J. Lellmann,D. Cremers),In European Conference on Computer Vision and Pattern Recognition (ECCV), 2016.

浅析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention的更多相关文章

  1. 深度视觉盛宴——CVPR 2016

    小编按: 计算机视觉和模式识别领域顶级会议CVPR 2016于六月末在拉斯维加斯举行.微软亚洲研究院在此次大会上共有多达15篇论文入选,这背后也少不了微软亚洲研究院的实习生的贡献.大会结束之后,小编第 ...

  2. (转)CVPR 2016 Visual Tracking Paper Review

    CVPR 2016 Visual Tracking Paper Review  本文摘自:http://blog.csdn.net/ben_ben_niao/article/details/52072 ...

  3. CVPR 2016 paper reading (3)

    DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations, Ziwei Liu, Pin ...

  4. CVPR 2016 paper reading (2)

    1. Sketch me that shoe, Qian Yu, Feng Liu, Yi-Zhe Song, Tao Xiang, Timothy M. Hospedales, Cheng Chan ...

  5. CVPR 2016 paper reading (6)

    1. Neuroaesthetics in fashion: modeling the perception of fashionability, Edgar Simo-Serra, Sanja Fi ...

  6. [CVPR 2016] Weakly Supervised Deep Detection Networks论文笔记

    p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 13.0px "Helvetica Neue"; color: #323333 } p. ...

  7. 论文阅读笔记二十七:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(CVPR 2016)

    论文源址:https://arxiv.org/abs/1506.01497 tensorflow代码:https://github.com/endernewton/tf-faster-rcnn 室友对 ...

  8. Single Image Haze Removal(图像去雾)-CVPR’09 Best Paper

    公式推导 paper闪光点 找到了一个很简洁的假设. paper不足 代码跑起来很慢.据说2010年的ECCV那篇是改进的.

  9. 目标检测网络之 YOLOv2

    YOLOv1基本思想 YOLO将输入图像分成SxS个格子,若某个物体 Ground truth 的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体. 每个格子预测B个bounding b ...

随机推荐

  1. linux系统命令学习系列8-文件相关操作touch,rm,mv,cat,head,tail命令

    上节内容: 系统和目录管理 Pwd命令 .和..目录 相对路径和绝对路径 作业:进入opt路径,分别使用相对路径方法和绝对路径方法进入到其实任意一个子目录 cd /opt 相对路径 cd rh 绝对路 ...

  2. python中创建实例属性

    虽然可以通过Person类创建出xiaoming.xiaohong等实例,但是这些实例看上除了地址不同外,没有什么其他不同.在现实世界中,区分xiaoming.xiaohong要依靠他们各自的名字.性 ...

  3. winform中的数据绑定

    1. 简单的数据绑定 例1 using (SqlConnection conn = new SqlConnection(ConfigurationManager.ConnectionStrings[& ...

  4. CSS 权威指南 CSS实战手册 第四版(阅读笔记)

    前言: 对于程序员,学习是无止境的,知识淘换非常快,能够快速稳固掌握一门新技术,是一个程序员应该具备的素质.这里将分析本人一点点不成熟的心得. 了解一门语言,了解它的概念非常重要,但是一些优秀的设计思 ...

  5. str_replace替换换行符失败原因

    在编程中,需要替换掉字符串的换行符再存进数据库, 语句: $str = str_replace(array('/r/n', '/r', '/n'), $str); 发现语句并没有替换,网上查找后,知道 ...

  6. [HNOI 2008]GT考试

    Description 题库链接 问你长度为 \(n\) 的可含前导零的数字串中,不含长度为 \(m\) 的子串 \(X\) 有多少个,取模. \(1\leq n\leq 10^9,1\leq m\l ...

  7. [SDOI2008]Cave 洞穴勘测

    题目描述 辉辉热衷于洞穴勘测. 某天,他按照地图来到了一片被标记为JSZX的洞穴群地区.经过初步勘测,辉辉发现这片区域由n个洞穴(分别编号为1到n)以及若干通道组成,并且每条通道连接了恰好两个洞穴.假 ...

  8. poj 1265 Area 面积+多边形内点数

    Area Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 5861   Accepted: 2612 Description ...

  9. 【Codeforces AIM Tech Round 4 (Div. 2) C】

    ·将排序限制于子序列中,又可以说明什么呢? C. Sorting by Subsequences ·英文题,述大意:       输入一个长度为n的无重复元素的序列{a1,a2……an}(1<= ...

  10. hdu 4609 (FFT求解三角形)

    Problem Description King OMeGa catched three men who had been streaking in the street. Looking as id ...