Direct Shot Correspondence Matching

一篇BMVC18的论文，关于semantic keypoints matching、dense matching的工作，感觉比纯patch matching有意思，记录一下。

1. 摘要

　　提出一种针对correspondence matching的直接解决方案。没有采用一贯的基于正负样本对（一般需要困难负样本挖掘）的解决方案，本文提出了一种相似性热图生成器（similarity heatmap generator ）来直接处理。对于所有query points直接在目标图像中生成相似性热图。结果大部分做到了SOTA。

2. 介绍

Correspondence search在好多领域都很重要。这一任务可以有很多变体：finding exact matches, e.g., in stereo matching, to finding semantic correspondence。早期工作肯定依赖于SIFT，SURF，近来都用siamese net做，例如用预训练VGG做image-to-image semantic keypoint matching ,其共同点都是要不利用一个matching 框架或在描述子空间搜索最近邻。然而作者认为这些工作都没有直接针对精确对应点定位而训练。

作者以精确对应匹配为目标，端到端搭建了包括feature generator和match network两个组成部分的网络。heatmap的峰值就是目标图像的位置。heatmaps based representation可以实现 N-pairs based metric learning，也即无需困难负样本采样。

本文的框架可以用来预测稀疏抑或稠密的视觉对应关系。利用多类分类损失来训练网络，且不含有spatial transformer layers。且我们的方法直接在raw images上操作，不需region proposals。评估数据集有：PF-Pascal , PF-Willow , Pascal-Parts , the KITTI-Flow 2015 [19] and MPI Sintel [4] datasets 。网络trained from sctatch。

总结贡献如下：

提出一个端到端的方法来解决correspondence search问题。
所提出的matching network可以被扩展到任何标准的深度网络来端到端解决精确对应匹配问题。
基于热图的表示enables N-pairs based metric learning，且无需困难负样本采样（triplet、contrastive divergence based metric learning）。

3. 相关工作

Correspondence search是一个CV中的基础问题，早期有SIFT\SURF\DAISY。接着Siamese net被用来patch similarity、face embedding、stereo matching，又有人利用预训练的net来做semantic correspondence search。利用triplet loss做fine-grained 图像ranking。又有Siamese net利用内积layer和多分类loss 做高效视差估计。尽管表现都很好，但之前的方法都是估计patch-patch或patch-image相似性，且对于多关键点的匹配相似性需要训练测试时多次前向传播。

近来的方法，基于image-image的semantic keypoints matching被提出。Choy提出的“Universal Correspondence Network”+spatial transformer layers利用metric learning方法高效训练，对于匹配多个关键点在预测时需要一次单向传播。然而因为是metric learning，需要额外的困难负样本挖掘。所以额外引入了distance measure和k近邻超参数。与之相比我们提出的端到端网络不需困难负样本挖掘。Kim提出了一个全卷积自相似性描述子对于稠密语义关键点匹配，然鹅他们的方法仍需要在顶端利用matching framework来实现对应关系。相比我们的方法是self contained且直接预测correspondences。【10】提出利用appearances和geometry匹配一对图像中的region proposals。我们的方法只需要利用appearances，无需region proposals。

我们思路来源于论文Improved Deep Metric Learning with Multi-class N-pair Loss Objective。文中提出了N-pairs loss，比contrastive divergence和triplet loss实现了更好的结果。然而他们的方法是为了实现patched based matching。而本文利用N-pairs loss是为了解决key points matching。

4. Correspendence Search

解释Correspendence Search：给定source image I1，I1中有query points pn，此外目标target image I2，目标很明确就是要找target image中与I1中每个关键点匹配的关键点qn。框架如图1，包括feature generator和matching network。

feature generator即以source image I1和target image I2为输入，生成特征F1和F2。matching network以F1、F2为输入生成N个相似性热图，对于N个query points而言。

1) Feature Generator

如图1，两个siamese分支都是feature generator，包含了两份google-net拷贝。输入图片，输出特征图F1，F2。

2) Matching Network

用来生成peaked similarity热图，对于目标image中的每个query point而言。训练时最小化预测的相似图与gt的差异，无需困难负样本挖掘，因为这个网络已将其作为训练的一部分来产生所有query point的负样本的不相似特征。网络结构在图2。包含一系列简单层，无可训练参数。图很直观了，不多做解释。

从图2可以看到matching network主要有7个操作：Crop layer、Reshape R1、Copy、Reshape R2、Dot Product、SoftMax、Reshape R3。很好理解，这里直接粘过来：

内积操作就是对两个特征处理结果的结合：

内积层高效计算每个cropped特征与F2中的每个特征的相似度。

训练：

为每个query point赋ground truth：

训练样本：

最小化预测S与真值S之间的交叉熵损失：

测试：

为每个query点pn预测一个对应的匹配点qn：

qn即为所预测的相似度图中的峰值peak。在定位peak之前利用bilinear-sampling来上采样相似度图。

5. 实验

在semantic keypoints matching 和 dense matching两个任务上做实验。

1）semantic keypoints matching

数据集：PF-PASCAL [9], PF-Willow [9] and Pascal-Parts [30] datasets

评价指标：PCK

2）dense correspondences

数据集： KITTI-Flow 2015 [19] and MPI Sintel [4] benchmarks

DAISY [27], DSP [12], and DM [20],这些传统方法应用 global optimization作为预处理步骤，实现了更精准的对应。本文没有采用任何预处理，和spatial transformer layers，没有明显的过拟合。达到了SOTA。

Direct Shot Correspondence Matching的更多相关文章

PatentTips - Improving security in a virtual machine host
BACKGROUND Computer viruses are a common problem for computer users. One typical mode of attack is t ...
【VS开发】设备控制台 (DevCon.exe) 示例
设备控制台 (DevCon.exe) 示例本部分提供以下设备控制台 (DevCon.exe) 命令的示例: DevCon HwIDs 示例 1:查找所有硬件 ID 示例 2:使用模式查找硬件 ID ...
Matching Networks for One Shot Learning
1. Introduction In this work, inspired by metric learning based on deep neural features and memory a ...
Literature Review: Improving Image-Based Localization by Active Correspondence Search
Abstract Input: A query image Source: A point cloud reconstruction of a large scene (有一百多万3D点) Resul ...
SSD: Single Shot MultiBox Detector
By Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexande ...
（转）Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning
Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning 2018-08-03 19:16:56 本文转自:http ...
Matching (2)
HALCON 10.0 II-B 3.1 Gray-Value-Based Matching 基于灰度的匹配是一个非常经典的方法,它仅适用于对象的不模糊,不缺失,灰度值不变化.适用于对象旋转转.注意 ...
[论文理解]SSD:Single Shot MultiBox Detector
SSD:Single Shot MultiBox Detector Intro SSD是一套one-stage算法实现目标检测的框架,速度很快,在当时速度超过了yolo,精度也可以达到two-stag ...
论文阅读: Direct Monocular Odometry Using Points and Lines
Direct Monocular Odometry Using Points and Lines Abstract 大多数VO都用点: 特征匹配 / 基于像素intensity的直接法关联. 我们做了 ...

随机推荐

mysql删除大表更快的drop table办法
mysql删除大表更快的drop table办法参考资料:https://blog.csdn.net/anzhen0429/article/details/76284320 利用硬链接和trunca ...
hadoop 伪分布式搭建
下载hadoop1.0.4版本,和jdk1.6版本或更高版本:1. 安装JDK,安装目录大家可以自定义,下面是我的安装目录: /usr/jdk1.6.0_22 配置环境变量: [root@hadoop ...
python机器学习-sklearn挖掘乳腺癌细胞（五）
python机器学习-sklearn挖掘乳腺癌细胞( 博主亲自录制) 网易云观看地址 https://study.163.com/course/introduction.htm?courseId=10 ...
如何优雅地使用Sublime Text3
此文非原创,出处见文章结尾. 一.Sublime Text 3插件安装优雅使用Sublime Text,插件则是不可缺少的存在:而插件的备份就显得非常的重要(譬如:各平台同步:更换系统/电脑,迅速使 ...
Kafka技术内幕读书笔记之（三）消费者：高级API和低级API——消费者消费消息和提交分区偏移量
消费者拉取钱程拉取每个分区的数据,会将分区的消息集包装成一个数据块( FetchedDataChunk )放入分区信息的队列中 . 而每个队列都对应一个消息流( KafkaStream ),消费者客户 ...
EL表达式获取日期时间类型后格式化的问题
最近在项目中遇到的问题,就是从后台取到的java.util.Date类型的数据,在前台需要格式化的问题. 开始想了很多办法,其实在JSP页面中处理很简单,JSTL提供的format标签即可解决这个问题 ...
介绍3款Markdown编辑器
为什么写此篇自从CSDN的博客有了Markdown后,慢慢的了解并学会了用Markdown语法写博客.但CSDN博客是在浏览器中使用,于是一直寻找离线的Markdown编辑器. 网上先是找到了M ...
Linux命令（十四）gdb调试
1. gdb调试 fun.c #include <stdio.h> #include "head.h" int sum(int a, int b) { printf(& ...
ArcGIS 常见错误
1. 平面坐标转为大地坐标出错提示是:找不到相关的要素 2. 当发现Shape文件或者Mdb内的文件有问题时,可以先将Shape文件导出,然后再导入,或许就可以解决其中的问题.
百度编辑器 ueditor 会屏蔽过滤 body html head DOCTYPE ... 的解决办法
百度编辑器很强,但有时候复制到html里时,会带有 body html head 等标签,切到视图时,内容都不见了是因为白名单解决办法: 我测的是1.4.3版本在 ueditor.config ...

Direct Shot Correspondence Matching

Direct Shot Correspondence Matching的更多相关文章

随机推荐

热门专题