http://www.umiacs.umd.edu/~ejaz/

* 也是同时学习feature和metric
* 输入一对图片,输出是否是同一个人
* 包含了一个新的层:
include a layer that computes cross-input neighborhood differences
(capture local relationships between the two input images based on midlevel features from each input image )
* A high-level summary of the outputs of this layer is computed by a layer of patch summary features 
* 在比较大的数据集CUHK03,中等数据集CUHK01取得较好的结果,在无关的大数据集上预训练然后在小数据集上fine-tune后也在小数据集(VIPeR)上有comparable to the state of art的性能

* Person Re-id的定义:the problem of identifying people across images that have been taken using different cameras, or across time using a single camera
* 难点: 由于光照和视角等原因,同一个人变化很大,不同人的样子可能很像
 
* 一般是输入两张图片,计算它们的相似度或者判断他们是同一类或者不是同一类
 
cross-inputneighborhood difference
 f只有中心(x,y)的一个值,5x5的每个元素都是这个值。 g是(x,y)为中心的5x5邻域。
这种操作是非对称的,所以反过来再做一次
如果两个输入是25通道,则结果有50通道。
输入12x37x25-->输出12x37x5x5, 共50通道
这一层之后过一个ReLU

然后过一个patch summary layer, 通过卷积实现
对K',L'也一样,所以结果应该有50个通道的

visualization of features
 
 visualization of weights


给正样本对做data augmentation,但仍然是不平衡的

因此采用hard negative mining
随机采样负样本对,使负样本对是扩充后的正样本对的2倍(1倍会不会更好?)
用这些训练模型,但不是最优的,
用这个模型去分类负样本对,找出网络表现最差的,然后用这些样本 只重训练顶层的fc(实验说明比重训连整个网络要更有效,这也相当于fine-tune)

对于很小的数据集,用大数据集训练的模型(在hard-negative mining之后)初始化,然后fine-tuning,此时learning rate比原来小10倍,0.001

 
这篇文章提出了一个可能的改进方向,对不同的身体部位训练不同的模型, 然后将不同部位的分数组合起来得到最后的决策,这对于实际场景中有严重的occlusion或者对于 图片中的人在一系列时刻做不同动作的(比如某一时刻坐着,另一时刻站着)的情况可能会有帮助。 





                         
 





15 cvpr An Improved Deep Learning Architecture for Person Re-Identification的更多相关文章

  1. (转) Deep learning architecture diagrams

    FastML Machine learning made easy RSS Home Contents Popular Links Backgrounds About Deep learning ar ...

  2. 视觉中的深度学习方法CVPR 2012 Tutorial Deep Learning Methods for Vision

    Deep Learning Methods for Vision CVPR 2012 Tutorial  9:00am-5:30pm, Sunday June 17th, Ballroom D (Fu ...

  3. A Survey of Visual Attention Mechanisms in Deep Learning

    A Survey of Visual Attention Mechanisms in Deep Learning 2019-12-11 15:51:59 Source: Deep Learning o ...

  4. Deep Learning in a Nutshell: History and Training

    Deep Learning in a Nutshell: History and Training This series of blog posts aims to provide an intui ...

  5. 深度学习材料:从感知机到深度网络A Deep Learning Tutorial: From Perceptrons to Deep Networks

    In recent years, there’s been a resurgence in the field of Artificial Intelligence. It’s spread beyo ...

  6. Deep Learning for Chatbots(Introduction)

    聊天机器人又被称为会话系统,已经成为一个热门话题,许多公司都在这上面的投入巨大,包括微软,Facebook,苹果(Siri),Google,微信,Slack.许多创业公司尝试通过多种方式来改变与消费者 ...

  7. 【Deep Learning】genCNN: A Convolutional Architecture for Word Sequence Prediction

    作者:Mingxuan Wang.李航,刘群 单位:华为.中科院 时间:2015 发表于:acl 2015 文章下载:http://pan.baidu.com/s/1bnBBVuJ 主要内容: 用de ...

  8. 【CS-4476-project 6】Deep Learning

    AlexNet / VGG-F network visualized by mNeuron. Project 6: Deep LearningIntroduction to Computer Visi ...

  9. 【深度学习Deep Learning】资料大全

    最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron C ...

随机推荐

  1. Yii2.0 rules验证规则大全

    required : 必须值验证属性 [['字段名'],required,'requiredValue'=>'必填值','message'=>'提示信息']; #说明:CRequiredV ...

  2. 执行最慢的SQL语句

    ---执行最慢的SQL语句SELECT top 20(total_elapsed_time / execution_count)/1000 N'平均时间ms',total_elapsed_time/1 ...

  3. stm8s103串口

    #include "uart.h" #define UART2#define uart_115200 1 void Init_UART2(void){#ifdef UART2    ...

  4. c# 反射应用之工厂

    反射是.net的核心功能,十分的强大.但是好像微软封装的太过了,作为程序员,在实际项目中我很少用到反射(估计是参加的大型项目太少了,需要交互第三方的项目太少了). 工厂模式是软件设计模式中重要的一种, ...

  5. flex中image控件source属性改变的例子

    Download: main.mxml <?xml version="1.0" encoding="utf-8"?> <mx:Applicat ...

  6. win10 Unistack 服务组 占用资源如何解决

    开始菜单>设置>隐私,隐私界面的左侧栏目,找最后一个“后台应用”,把后台运行的应用全部关掉即可

  7. Javascript生成随机数

    随机数在前后端都比较常用,用途也较广.这里记录一下前端的实现方法,代码比较简单,封装成函数可随时调用. 具体如下: function getRandNum(n){ return Math.floor( ...

  8. 关于<form>标签

    <form>用于为用户输入创建HTML表单,表单用于向服务器传输数据 form是块级元素,其前后会产生折行 <form>包含: 1.input元素:(根据不同的type属性,输 ...

  9. 第一章 JavaScript简史

    JavaScript:  一种使网页具有交互能力的程序设计语言. BOM: 浏览器对象模型,指通过JS用来调整Web浏览器的高度.宽度和位置属性的办法. DHTML: 1.利用HTML标记各种元素   ...

  10. Android 完整开源应用,完整开源项目

    (Antox)聊天的  (new)   (OpenKeychain)OpenPGP在android上的实现  (new)   (Flock)提供同步服务   (OpenFlappyBird)曾经火爆的 ...