-

论文地址:https://arxiv.org/abs/1604.01325

contribution is twofold:
(i) we leverage a ranking framework to learn convolution and projection weights that are used to build the region features;
(ii) we employ a region proposal network to learn which regions should be pooled to form the final global descriptor.
 
当前最先进的是:

the state of the art is currently held by conventional methods relying on local descriptor matching and re-ranking with elaborate spatial verfication
 
当前使用CNN被限制在:using a pre-trained network as local feature extractor
当前的难点和解决方法有有:
1)图像被压缩还要保留大部分细节;本文可以精确的表达不同大小的长宽比的图像,解决CNN缺少的几何不变的特性;
2)深度学习的图像检索性能落后于传统方法的原因是缺少特定实例检索任务的数据集,基于深度学习的图像检索一般是使用Imagenet预训练的网络提取局部特征,这些特征被用来学习不同的语义分类,但是在类内的变化却是鲁棒的,这对实例检索不利,因为we are interested in distinguishing between particular objects – even if they belong to the same semantic  category。
 
本文的解决手段:
1)建立在R-MAC(regional maximum activation of convolution)基础之上, It aggregates several image regions into a compact feature vector of fixed length and is thus robust to scale and translation(平移).这种表示可以处理不同长宽比的高分辨率图像,并获得相当好的准确性。构建R-MAC表示所涉及的所有步骤都是可区分的,因此可以以端到端的方式学习权重;
2)use a three-stream Siamese network that explicitly optimizes the weights of the R-MAC representation for the image retrieval task by using a triplet ranking loss;

3)使用Landmarks dataset,并提出清理的方法;

4)池化机制使用region proposal network而不是rigid grid。

rigid grid的问题:

First, as the grid is independent of the image content,it is unlikely that any of the grid regions accurately align with the object of interest.
Second, many of the regions only cover background.
RPN的优点:
First, the region proposals typically cover the object of interest more tightly than the rigid grid.
Second, even if they do not overlap exactly with the region of interest, most of the proposals do overlap significantly with it, which means that increasing the number of proposals per image not only helps to increase the coverage but also helps in the many-to-many matching.
Representations of different images can be then compared using the dot-product(点积)。
 
 
使用 shifting and a fully connected (FC) layer代替PCA
 

Deep Image Retrieval: Learning global representations for image search In ECCV, 2016学习笔记的更多相关文章

  1. Learning to Track at 100 FPS with Deep Regression Networks ECCV 2016 论文笔记

    Learning to Track at 100 FPS with Deep Regression Networks   ECCV 2016  论文笔记 工程网页:http://davheld.git ...

  2. 论文解读(GraRep)《GraRep: Learning Graph Representations with Global Structural Information》

    论文题目:<GraRep: Learning Graph Representations with Global Structural Information>发表时间:  CIKM论文作 ...

  3. Deep learning with Python 学习笔记(5)

    本节讲深度学习用于文本和序列 用于处理序列的两种基本的深度学习算法分别是循环神经网络(recurrent neural network)和一维卷积神经网络(1D convnet) 与其他所有神经网络一 ...

  4. Deep High-Resolution Representation Learning for Human Pose Estimation

    Deep High-Resolution Representation Learning for Human Pose Estimation 2019-08-30 22:05:59 Paper: CV ...

  5. Deep Learning(深度学习)学习笔记整理

    申明:本文非笔者原创,原文转载自:http://www.sigvc.org/bbs/thread-2187-1-3.html 4.2.初级(浅层)特征表示 既然像素级的特征表示方法没有作用,那怎样的表 ...

  6. Deep Learning(深度学习)学习笔记整理系列之(五)

    Deep Learning(深度学习)学习笔记整理系列 zouxy09@qq.com http://blog.csdn.net/zouxy09 作者:Zouxy version 1.0 2013-04 ...

  7. 【转载】Deep Learning(深度学习)学习笔记整理

    http://blog.csdn.net/zouxy09/article/details/8775360 一.概述 Artificial Intelligence,也就是人工智能,就像长生不老和星际漫 ...

  8. Deep Learning(深度学习)学习笔记整理系列之(八)

    Deep Learning(深度学习)学习笔记整理系列 zouxy09@qq.com http://blog.csdn.net/zouxy09 作者:Zouxy version 1.0 2013-04 ...

  9. Deep Learning(深度学习)学习笔记整理系列之(七)

    Deep Learning(深度学习)学习笔记整理系列 zouxy09@qq.com http://blog.csdn.net/zouxy09 作者:Zouxy version 1.0 2013-04 ...

随机推荐

  1. 「JSOI2015」最大公约数

    「JSOI2015」最大公约数 传送门 考虑先枚举区间左端点, 然后我们会发现所有可能的区间虽然有 \(O(n)\) 个,但是本质不同的区间 \(\gcd\) 只有 \(\log n\) 级别,而且是 ...

  2. nodejs的POST两种type类型提交(原生)

    POST数据的两种提交格式 application/x-www-form-urlencoded(上传数据中没有文件) multipart/form-data (文件上传) 获取POST数据,post数 ...

  3. 栈的python实现

    栈,又名堆栈,它是一种运算受限的线性表.其限制是仅允许在表的一端进行插入和删除运算.这一端被称为栈顶,相对地,把另一端称为栈底. 向一个栈插入新元素又称作进栈.入栈或压栈,它是把新元素放到栈顶元素的上 ...

  4. windows 以太坊开发框架Truffle环境搭建

    https://www.jianshu.com/p/f7a4de0cba9d 一.安装DApp开发环境 1.1 安装Node.js 我们使用官方长期支持的8.10.0LTS版本,下载64位包装包. 下 ...

  5. Codeforces Round #588 (Div. 2)C(思维,暴力)

    #define HAVE_STRUCT_TIMESPEC#include<bits/stdc++.h>using namespace std;int a[27],b[27];int vis ...

  6. error C2664: “FILE *fopen(const char *,const char *)”: 无法将参数 1 从“LPCTSTR”转换为“const char *”

    遇到这个问题,请打开本项目的Properties(属性)-------> Configuration Properties(配置属性)-------->General(常规)------- ...

  7. PHP+Mysql实现网站顶和踩投票功能实例

    PHP+Mysql实现网站顶和踩投票功能实例,通过记录用户IP,判断用户的投票行为是否有效,该实例也可以扩展到投票系统中. 首先我们在页面上放置“顶”和“踩”的按钮,即#dig_up和#dig_dow ...

  8. 7.12 Varnish体系结构

    备注:应用比较小,采用的架构模式  Varnish + 基本业务功能 但是一个问题是所有的资源在一台服务器上,反向代理特别多,缓存数据特别大,导致一台机器资源不够,考虑机器的拆分 Nginx 的反向代 ...

  9. Xcode Edit Schemes

    关于本文:有关“Xcode Edit Schemes”的设置,还是有很大的学问的.由于时间关系,我一点一点的补充. 1.在开发的时候,至少将Run的Build Configuration设置为Debu ...

  10. SVM数学原理推导

    //2019.08.17 #支撑向量机SVM(Support Vector Machine)1.支撑向量机SVM是一种非常重要和广泛的机器学习算法,它的算法出发点是尽可能找到最优的决策边界,使得模型的 ...