HRNet + Object Contextual Representation

文章内容来自CCF-CV走进高校报告会中MSRA王井东老师的报告“Learning high-resolution and object-contextual representations for semantic representation”

报告中主要介绍了 HRNet 和 OCR 两个方法。下面图中展示的是 timeline for deep semantic segmentation，可以看到 OCR 和 HRNet 是 2019 年提出比较有影响力的方法。而且在 Cityscapes segmentation leaderboard 上排名第一。

首先介绍第一个工作：HRNet: Deep High-Resolution Representation Learning for Visual Recognition, CVPR 2019

当前的语义分割方法需要高分辨率特征，主流方法是通过一个网络得到 低分辨 feature map，然后通过上采样或反卷积恢复到高分辨率

下面列举了一些经典方法，看起来不同，但本质核心思路是差不多的。这些方法存在一个缺点，分辨率由高到低会损失信息！

为了解决这个问题，团队提出了一个方法，核心思路是 “不恢复 到高分辨率，而是保持分辨率” 。具体图示如下，把不同分辨率的 feature map 并联，各个分辨率分别一路，“保持”信息。但是，这样仍有一个问题，就是 feature map 彼此之间没有交互。

为此，团队又给网络添加了一些内容，如下图红线所示，各路之间不断进行 repeated fusions。

交互的方式如下：上采样时，先双线性插值，然后用1x1的卷积处理；下采样时，采用步长为2，尺寸为3x3的卷积处理

这就是HRNet 的全部内容，下图是方法的总结：1）以往网络是串联，改为并联；2）以前是降分辨率，改为保持高分辨率；3）通过加强交互，进一步提高性能

现在介绍第二个工作：Object-Contextual Representations for Semantic Segmentation

当前的FCN没有解决好物体上下文信息。因为单独看一个象素，很难知道这个象素是属于某一个物体的，因为象素给我们的信息是RGB的信息，如果不给予足够多的上下文信息是很难判断的。下图列举了商汤的PSPNet和谷歌的ASPP。PSPNet通过给每个象素周围建立多尺度的表征获取上下文信息，当时这个方法取得了非常大的突破。同时谷歌的ASPP也用了类似于空洞卷积的方式来实现上下文信息获取。

当前方法分析上下文信息如下图所示，比如说红色点是我们关注的点，周围绿色几个点是采样出来的，可以看到，绿色点分为两部分，一部分是属于车的，还有一部分是属于背景的。当前方法并没有进行区分。

那我们该怎么办？我们找这个物体，要通过周围物体的象素表征来帮助。因此，我们需要把红色像素周围属于 object 的pixel取出来做为上下文，如下图所示：

具体如何做呢？首先用一个 baseline network 得到一个粗略的分割结果（黄色框中左半部分），同时，还会输出全图的 feature map。分割结果包括K类，我们把每个类别的特征提出来（黄色框中上半部分的特征），如下图所示：

然后，把红色小方块的的特征经过变换，右边K个区域的特征也经过一个变换，然后计划一下相似度，如下图所示。相似度计算以后，就可以得到红色小方块属于各个类别的可能性。我们根据这个可能性把每个区域的表征进行加权，会得到当前像素增强的特征表示（object-contextual representation）。

这个方法非常容易解释，看上去也比较有道理，最终在cityscapes上可以达到 82.5%，这是目前的SOTA。

HRNet + Object Contextual Representation的更多相关文章

论文学习-深度学习目标检测2014至201901综述-Deep Learning for Generic Object Detection A Survey
目录写在前面目标检测任务与挑战目标检测方法汇总基础子问题基于DCNN的特征表示主干网络(network backbone) Methods For Improving Object Rep ...
Object/Relational Mapping 数学关系反面向对象
[hibernate ORM 是对象关系映射框架事实上的持久化存储引擎] http://docs.jboss.org/hibernate/orm/5.2/userguide/html_single/ ...
ECCV 2014 Results (16 Jun, 2014) 结果已出
Accepted Papers Title Primary Subject Area ID 3D computer vision 93 UPnP: An optimal O(n) soluti ...
zz深度学习目标检测2014至201901综述
论文学习-深度学习目标检测2014至201901综述-Deep Learning for Generic Object Detection A Survey 发表于 2019-02-14 | 更新 ...
重新梳理HTML基础知识
缘起 HTML(HyperText Markup Language超文本标记语言)是用于构建web页面的标记语言和通用标准.它并不是一项新的发明,因为超文本(具有超链接的文本)和标记语言(用于电子文档 ...
apache开源项目-- Turbine
1.缘起 Jetspeed是Apache Jakarta小组的开放源码门户系统.它使得最终用户可以通过WAP手机.浏览器.PDA等各种设备来使用各种各样的网络资源(比如应用程序.数据以及这之外的任何网 ...
Python Challenge
0. 2的38次方 print 2**38 ##apply the result to the url 1. 看图是要right shift两位, 切片即可. import string intab ...
Python2.7笔记——常用技术点汇总
目录 · 概况 · 安装 · 基础 · 基础语法 · 数据类型 · 变量 · 常量 · 字符编码 · 字符串格式化 · list · tuple · dict · set · if语句 · for语句 ...
Python模块之pickle（列表，字典等复杂数据类型与二进制文件的转化）
1.pickle模块简介 The pickle module implements binary protocols for serializing and de-serializing a Pyth ...

随机推荐

实时web应用方案——SignalR（.net core）
何为实时先从理论上解释一下两者的区别. 大多数传统的web应用是这样的:客户端发起http请求到服务端,服务端返回对应的结果.像这样: 也就是说,传统的web应用都是客户端主动发起请求到服务端. 那 ...
ceph bluestore与 filestore 数据存放的区别
一. filestore 对象所在的PG以文件方式放在xfs文件中 1 查看所有的osd硬盘,跟其他linux其他硬盘一样,被挂载一个目录中. [root@hz-storage1 ~]# df -h ...
苹果XR手机的音频体验测试总结
苹果XR手机的音频苹果XR算是苹果手机历史上一个里程碑的型号了,是苹果憋了两年的大招,连苹果9的称号就不要了.直接是X.说明苹果对它给予的希望很大.作为一个音频算法工程师,一直想体验一下XR的音 ...
JDK8--04：内置接口
在JDK8--3中已经说过,使用lambda方法需要新增函数式接口,为了使用方便,JDK8已经提供了许多内置接口,总的归纳来说,有四大函数式接口. /** * * java8 四大内置接口 * * 1 ...
为DLL文件添加强名称
程序在编译时出现类似 "错误 1 程序集生成失败 -- 引用的程序集“XXXXXXXXXX”没有强名称" 这样的错误,是因为它不是强名称的,则需要进行以下操作: 例如:com.so ...
【Oracle】Oracle wrong result一则（优化器问题）
现象如下: SYS@proc> select * from v$version where rownum=1; BANNER ---------------------------------- ...
HTML文档解析和DOM树的构建
浏览器解析HTML文档生成DOM树的过程,以下是一段HTML代码,以此为例来分析解析HTML文档的原理 <!DOCTYPE html> <html lang="en&quo ...
css中出现height为100%失效的原因及解决方案
我们都知道需要给html和body标签设置了高度height:100%之后,再给内部的div设置height:100%的时候,内部div的高度100%才会起到作用.这是由于:%是一个相对父元素计算得来 ...
FarmCraft，又是Dp
题目依然链接题意: 从根节点出发,每条边走两遍回到根节点,走边用时1,到达某个节点之后开始计时,到该节点最大的计时数时结束,回到根节点时根节点开始计时.求让所有计时都结束的最小时间. Solve: ...
Jenkins Pipeline 部署 SpringBoot 应用
一. 安装依赖包 yum install -y wget yum install -y gcc-c++ yum install -y zlib-devel perl-ExtUtils-MakeMake ...

HRNet + Object Contextual Representation

HRNet + Object Contextual Representation的更多相关文章

随机推荐

热门专题