Working hard to know your neighbor's margins:Local descriptor learning loss论文笔记

CuriosityWang 2024-09-04 07:34:13 原文

Abstract

论文提出了一种新的训练方法，受到了 Lowe’s matching criterion for SIFT的启发。这种新的loss，要比负责的正则方法更好。把这个新的loss方法结合L2Net就得到了HardNet。它具有和SIFT同样的特征维度（128），并且在 wide baseline stereo, patch veriﬁcation and instance retrieval benchmarks这样的任务上取得了最高水准的表现。

Introduction

Sampling and loss

过程如图1.首先一个batch中的匹配块生成 \(\mathcal{X}=\left(A_{i}, P_{i}\right)_{i=1 . . n}\)，A代表anchor，P代表positive。那么每一对就是源于相同的一个3D point。

然后这2n个patches进入图2中的网络，使用得到的特征计算出一个图1中的距离矩阵。

\[d\left(a_{i}, p_{j}\right)=\sqrt{2-2 a_{i} p_{j}}, i=1 . . n, j=1 . . n
\]

然后在这个矩阵里寻找与\(a_i,p_i\)最相近的那两个negative点（不属于同一个3D point）。假设\(a_i\)对应的是M，\(p_i\)对应的是N。倘若\(distance(a_i,M)<distance(p_i,N)\),这样的话，我们就得到了一个triplet的训练数据\((a_i,p_i,M)\)，反之则是\((p_i,a_i,N)\)。

然后将这n个配对，送到loss函数里面：

\[L=\frac{1}{n} \sum \max \left(0,1+d\left(a_{i}, p_{i}\right)-\min \left(d\left(a_{i}, p_{j_{\min }}\right), d\left(a_{k_{\min }}, p_{i}\right)\right)\right)
\]

上述的M就是\(p_{j_{min}}\)，N就是\(a_{k_{min}}\)

Results

batch size inﬂuence

通过上文中的Sampling and loss小节可以看出，HardNet的表现与Bathsize应该有很大关系，

当Bathsize>512之后，模型性能就不会有明显提示了。

Empirical evaluation

Ablation study

这一节作者使用不同的loss函数和不同的采样方法进行研究，得出hardest-in-batch的采样方法是使得模型表现好的主要原因。

Wide baseline stereo

为了检测模型的泛化能力以及对极端情况的应对能力，作者在W1BS这个数据集上进行测试，关于这个数据集的extreme change可参考下图：

结果：

可以看到，HardNet和L2Net的表现相差不大。

Conclusion

作者提出了一种基于Batch的Hard-neagtive mining和loss function，使得模型更加容易训练表现更好

Working hard to know your neighbor's margins:Local descriptor learning loss论文笔记的更多相关文章

HardNet解读
论文:Working hard to know your neighbor’s margins: Local descriptor learning loss 为什么介绍此文:这篇2018cvpr文 ...
Learning Spread-out Local Feature Descriptors
论文Learning Spread-out Local Feature Descriptors 为什么介绍此文:引入了一种正则化手段,结合其他网络的损失函数,尤其是最新cvpr 2018的hardne ...
KNN(k-nearest neighbor的缩写)又叫最近邻算法
KNN(k-nearest neighbor的缩写)又叫最近邻算法机器学习笔记--KNN算法1 前言 Hello ,everyone. 我是小花.大四毕业,留在学校有点事情,就在这里和大家吹吹我们的 ...
cluster analysis in data mining
https://en.wikipedia.org/wiki/K-means_clustering k-means clustering is a method of vector quantizati ...
阅读MDN文档之基本盒模型(三)
Box properties Margin collapsing Adjacent siblings(相邻兄弟) Parent and first/last child Empty blocks Ac ...
face recognition[翻译][深度人脸识别:综述]
这里翻译下<Deep face recognition: a survey v4>. 1 引言由于它的非侵入性和自然特征,人脸识别已经成为身份识别中重要的生物认证技术,也已经应用到许多领 ...
学习笔记之k-nearest neighbors algorithm (k-NN)
k-nearest neighbors algorithm - Wikipedia https://en.wikipedia.org/wiki/K-nearest_neighbors_algorith ...
LogisticRegression in MLLib
例子 iris数据训练Logistic模型.特征petal width和petal height,分类目标有三类. import org.apache.spark.mllib.classificati ...
SVM的代码实现-python
隔了好久木有更新了,因为发现自己numpy的很多操作都忘记了,加上最近有点忙... 接着上次我们得到的迭代函数为首先j != yi j = yi import numpy as np def sv ...

随机推荐

C. The Meaningless Game
C. The Meaningless Game 题目链接题意给你两个数,开始都为1,然后每轮可以任选一个k,一边可以乘以\(k\),另一边乘以\(k^2\),然后问你最终是否可以得到所给的两个数a ...
Quoit Design（hdu1007）
---恢复内容开始--- Quoit Design Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 65536/32768 K (Ja ...
第十七个知识点：描述和比较DES和AES的轮结构
第十七个知识点:描述和比较DES和AES的轮结构这是密码学52件事中的第17篇.本周我们描述和比较DES和AES的结构. DES和AES都是迭代分组密码的例子.分组密码通过重复使用一个简单的轮函数来 ...
CS5210|低成本HDMI转VGA方案|CS5210参数说明
Capstone最新推出的一款HDMI转VGA音视频转接线或者转换器方案芯片CS5210. 其设计的优势在于内置晶振,外围电路器件较少设计简单,芯片封装集成度较高,方案BOM成本低,相比其他方案产品更 ...
编写Java程序，模拟五子棋博弈过程中的异常声明和异常抛出
返回本章节返回作业目录需求说明: 模拟五子棋博弈过程中的异常声明和异常抛出,判断用户所下棋子的位置,是否超越了棋盘的边界. 棋盘的横坐标的范围为0-9,纵坐标范围为0-14,如果用户所放棋子的坐标 ...
Android开发布局案例二
实践案例: XML <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:an ...
windows下的Python的下载与安装
Python的下载 Python下载要去官网下载,xdm,这里是网址 www.python.org 因为是外网所以打开下载会慢一些(不要着急的说) 这是python官网界面,跟着图片去下载(因为我这会 ...
Python max()方法扩展：求字典中值最大的键
重要的应该写在前面[捂脸] 场景一:仅求最大值对应的键,代码如下: >>> dic = {'A':4, 'B':2, 'C':3} >>> max_key = ...
gitlab修改（重置）root用户密码
gitlab修改(重置)root用户密码 1.使用root权限登录到服务器. 2.使用以下命令启动控制台: gitlab-rails console production 该命令有时候启动比较慢,需 ...
mysql数据库读写分离教程
注意:实现MySQL读写分离的前提是我们已经将MySQL主从复制配置完毕一.Mycat实现读写分离安装和配置架构规划: 192.168.201.150 master 主节点 192.168. ...