Discriminative Learning of Deep Convolutional Feature Point Descriptors 论文阅读笔记

CuriosityWang 2024-09-07 22:32:46 原文

介绍

该文提出一种基于深度学习的特征描述方法，并且对尺度变化、图像旋转、透射变换、非刚性变形、光照变化等具有很好的鲁棒性。该算法的整体思想并不复杂，使用孪生网络从图块中提取特征信息（得到一个128维的特征向量），并且使用L2距离来描述特征之间的差异，目标是让匹配图块特征之间的距离缩短，让不匹配图块特征之间的距离增大。

数据集及模型结构

数据集

论文使用的是一个叫做MVS的建筑物数据集，包含了1.5M张\(64 \times 64\)张的灰度图来自500K个3D points。
网络的结构:

3.损失函数：

\[l\left(\mathbf{x}_{1}, \mathbf{x}_{2}\right)=\left\{\begin{array}{cc}
\left\|D\left(\mathbf{x}_{1}\right)-D\left(\mathbf{x}_{2}\right)\right\|_{2}, & p_{1}=p_{2} \\
\max \left(0, C-\left\|D\left(\mathbf{x}_{1}\right)-D\left(\mathbf{x}_{2}\right)\right\|_{2}\right), & p_{1} \neq p_{2}
\end{array}\right.
\]

解释一下，C是一个最小距离阈值；两个图像块$ x_1, x_2$,如果它们来自同一个3D point \(pi\),则使用（1）的上半部分计算损失函数，否则使用下半部分计算损失函数。

Mining

论文作者提出了一个训练模型的创新方法：

随着训练的进行，随机选择的负向样本之间的距离很容易就超过阈值C，使得损失变成0，无法有效的对网络进行训练了。也就是说，随机选择的负向样本太简单了，他们本身之间的距离就很大，无法有效的训练网络。因此作者希望能够从数据集中寻找到“困难”的样本，什么才算是困难样本呢，对于负向样本而言，就是他们之间的距离很小，非常相似，但却不属于一个3D点；对于正向样本而言，就是他们属于同一个3D点，但特征之间的距离却很大。这样的样本对模型训练有很好的促进作用。为了实现这个目标，作者先随机采样了一个包含\(s_n\) 个点的负样本集，然后经过一次正向的运算（网络正向传播）并计算损失，然后仅保留其中\(s_n^H\)个点构成的困难样本子集，并将这部分的损失反向传播回去，对网络参数进行训练。对于正向样本也采用同样的策略，来挖掘困难样本。

结果：

Last

		这个PR curves应该与是某个指标有关，以后遇到了再查阅。

Discriminative Learning of Deep Convolutional Feature Point Descriptors 论文阅读笔记的更多相关文章

Learning local feature descriptors with triplets and shallow convolutional neural networks 论文阅读笔记
题目翻译:学习 local feature descriptors 使用 triplets 还有浅的卷积神经网络.读罢此文,只觉收获满满,同时另外印象最深的也是一个浅(文章中会提及)字. 1 Cont ...
论文笔记之：UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS
UNSUPERVISED REPRESENTATION LEARNING WITH DEEP CONVOLUTIONAL GENERATIVE ADVERSARIAL NETWORKS ICLR 2 ...
论文学习：Learning a Deep Convolutional Network for Image Super-Resolution 2014
(Learning a Deep Convolutional Network for Image Super-Resolution, ECCV2014) 摘要:我们提出了一种单图像超分辨率的深度学习方 ...
[论文阅读笔记] node2vec Scalable Feature Learning for Networks
[论文阅读笔记] node2vec:Scalable Feature Learning for Networks 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问题由于DeepWal ...
论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
论文阅读笔记（二十一）【CVPR2017】：Deep Spatial-Temporal Fusion Network for Video-Based Person Re-Identiﬁcation
Introduction (1)Motivation: 当前CNN无法提取图像序列的关系特征:RNN较为忽视视频序列前期的帧信息,也缺乏对于步态等具体信息的提取:Siamese损失和Triplet损失 ...
[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks
[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks 本文结构解决问题主要贡献算法 ...
[论文阅读笔记] Structural Deep Network Embedding
[论文阅读笔记] Structural Deep Network Embedding 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问题现有的表示学习方法大多采用浅层模型,这可能不能 ...
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks
[论文阅读笔记] Adversarial Learning on Heterogeneous Information Networks 本文结构解决问题主要贡献算法原理参考文献 (1) 解决问 ...

随机推荐

Python实现北邮人论坛模拟登录
推荐去我的博客里查看这篇文章,效果更佳: http://fuxuemingzhu.cn/2017/08/12/byrbbs-login/ 模拟登录北邮人论坛可能是每个学着写爬虫的北邮人必备技能了.在网 ...
WPF之AvalonEdit实现MVVM双向绑定
AvalonEdit简介 AvalonEdit是基于WPF开发的代码显示控件,默认支持多种不同语言的关键词高亮,并且可以自定义高亮配置.所以通过AvalonEdit可以快速开发出自己想要的代码编辑器. ...
uniapp滑动操作
<view @touchmove="handletouchmove" @touchstart="handletouchstart" @touchend=& ...
基于Spring MVC + Spring + MyBatis的【银行卡系统】
资源下载:https://download.csdn.net/download/weixin_44893902/45604256 练习点设计: 删除.新增一.语言和环境实现语言:JAVA语言. 环 ...
SpringMVC+Spring+Mybatis实现登录注册Demo
使用环境:MyEclipse/Eclipse + Tomcat + MySql. 使用技术:SpringMVC + Spring + Mybatis. 实现效果登录页面: 密码错误提示登录成功后 ...
编写Java程序，创建Dota游戏中的防御塔类，通过两个坐属性显示防御塔所在的位置
返回本章节返回作业目录需求说明: 创建Dota游戏中的防御塔类通过两个坐属性显示防御塔所在的位置实现思路: 创建防御塔(TowerDefense)类在该类中定义了两个属性,分别是int类型横 ...
自学java，如何快速地找到工作
本人最近一直在帮零基础的java开发者提升能力和找工作,在这个过程中,发现零基础的java程序员,在自学和找工作时,普遍会出现一些问题,同时在实践过程中,也总结出了一些能帮零基础java开发尽快提升能 ...
Java二、八、十、十六进制介绍
1.说明在Java中整数有四种表示方式, 分别为十进制,二进制,八进制,十六进制, 其中十进制就是平常最熟悉,使用最多的进制: 二进制是在计算机中使用最多的进制, 八进制和十六进制都是基于二进制的, ...
.net core中Grpc使用报错：The response ended prematurely.
当我们调用Grpc是出现下面的一堆异常时,一般是由于LTS导致的: Call failed with gRPC error status. Status code: 'Unavailable', Me ...
2048 双人创新小游戏【JavaFX-FXGL游戏框架】
一个 uml 课程的大作业,项目要求设计并开发一款 2048 与某种游戏类型相结合的创新游戏.可以选择只建模或者既建模又实现,既然要做当然是选择实现啦(虽然没有接触过游戏...期末周的莽冲hhh,小组 ...