论文笔记 CVPR-2014 DeepReID Deep filter pairing neural network for person re-identification
1. 摘要
第一篇用深度学习做Reid的文章,提出的FPNN采用端到端的训练方式,解决行人再识别的不对齐,光照,姿态等问题。
建立了一个新的带benchmark的数据集CUHK03,表现性能良好。
2.介绍
作者在文章中提到,目前做Reid的大致框架如下

目前的工作主要集中在优化上述框架中的一项或者同时优化几项。
作者在本文的贡献总结:
(1)解决不对齐、光照变换、几何变换、遮挡等问题
(2)使用一些有用的训练技巧;如dropout、数据增强、数据平衡、自助法等,使用端到端的训练
(3)建立发布了一个带benchmark的大规模行人再识别数据集CUHK03,该数据集包含1360个id,13164张图像
3. 模型,方法
模型分为6层,大致框架

(1)Feature extraction
使用卷积核对\((W_k,V_k)\)对输入的图像对进行卷积提取特征,然后最大池化成 $ H_1 $ x $ W_1 $ x \(K_1\)的特征图
\[ f_{ij}^k = \sigma((W_k*I)_{ij}+b_k^I)\]
\[ g_{ij}^k = \sigma((V_k*I)_{ij}+b_k^J)\]
(2)Patch matching
对特征图尽行分条处理,垂直方向分成M条,每条的宽度为\(W_1\),在条内对图像进行匹配,输出为\(K_1MW_1\) x \(W_1\)的块位移矩阵
\[ S_{(i,j) (i',j')}^k = f_{ij}^k g_{i'j'}^k \]
$ S_{(i,j) (i',j')}^k $ 的值越大,响应匹配越好。
(3)Modeling mixture of photometric transforms
maxout-grouping layer 把\(K_1\)通道数分成T组,每组内的最大响应才往下一层传播,输出为\(TMW_1\) x \(W_1\)
(4)Modeling part displacement
这一层卷积池化,输出为\(MW_2\) x \(W_2\) x $K_2 $
(5)Modeling pose and viewpoint transforms
这一层为全连接层
(6)Identity Recognition
这一层为softmax层,使用softmax函数
4. 训练策略
dropout 、data augmentation、data balancing 、bootstrapping
5. 结论


6. 评价
模型性能良好,能够解决一些遮挡、不对齐、光照变化、几何变换、姿态等问题。这是一篇良好的开篇之作,这个提供了一种深度学习解决行人再识别问题的思路。
论文笔记 CVPR-2014 DeepReID Deep filter pairing neural network for person re-identification的更多相关文章
- 论文笔记:(CVPR2019)Relation-Shape Convolutional Neural Network for Point Cloud Analysis
目录 摘要 一.引言 二.相关工作 基于视图和体素的方法 点云上的深度学习 相关性学习 三.形状意识表示学习 3.1关系-形状卷积 建模 经典CNN的局限性 变换:从关系中学习 通道提升映射 3.2性 ...
- 论文笔记之:Hybrid computing using a neural network with dynamic external memory
Hybrid computing using a neural network with dynamic external memory Nature 2016 原文链接:http://www.na ...
- 论文笔记:Person Re-identification with Deep Similarity-Guided Graph Neural Network
Person Re-identification with Deep Similarity-Guided Graph Neural Network 2018-07-27 17:41:45 Paper: ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1
3.Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.1 http://blog.csdn.net/sunbow0 ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.2
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.2 http://blog.csdn.net/sunbow0 ...
- Spark MLlib Deep Learning Convolution Neural Network (深度学习-卷积神经网络)3.3
3.Spark MLlib Deep Learning Convolution Neural Network(深度学习-卷积神经网络)3.3 http://blog.csdn.net/sunbow0 ...
- 论文笔记之:Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation
Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation xx
- 通过Visualizing Representations来理解Deep Learning、Neural network、以及输入样本自身的高维空间结构
catalogue . 引言 . Neural Networks Transform Space - 神经网络内部的空间结构 . Understand the data itself by visua ...
- 论文翻译:2020_WaveCRN: An efficient convolutional recurrent neural network for end-to-end speech enhancement
论文地址:用于端到端语音增强的卷积递归神经网络 论文代码:https://github.com/aleXiehta/WaveCRN 引用格式:Hsieh T A, Wang H M, Lu X, et ...
随机推荐
- Spring boot 入门三:SpringBoot用JdbcTemplates访问Mysql 实现增删改查
建表脚本 -- create table `account`DROP TABLE `account` IF EXISTSCREATE TABLE `account` ( `id` int(11) NO ...
- 莫名其妙的标记之@noescape
Swift 中经常遇到一些不熟悉的关键字, 例如@autoclosure, @noescape...等等, 为什么要加这样的关键字, 我自己写方法的时候什么时候要加, 什么时候不加, 都是应该考虑的问 ...
- DOM增删操作(创建删除表格)
<!DOCTYPE html><html> <head> <meta charset="UTF-8"> <title>& ...
- com.android.builder.packaging.DuplicateFileException: Duplicate files copied in APK META-INF/NOTICE
在将vivo eclipse sdk 迁移 android studio 时候报错 Error:Execution failed for task ':vivosdk:transformResour ...
- python学习笔记之——range()函数
range函数的三种用法:>>> range(1,5) # 代表从1到5(不包含5) [1, 2, 3, 4] >>> range(1,5,2) # 代表从1到5, ...
- Android sync adapter初体验之为什么官方文档上的代码不能work
回答:因为其实可以work sync adapter就是google推出的一个同步框架,把各种同步操作放在一起智能管理比较省电之类的.对我而言最具体的好处反正就是,不用自己写代码了,用框架就可以了.目 ...
- Sublime Text 的使用笔记
Sublime Text 是一个代码编辑器(Sublime Text 2,3是收费软件,但可以无限期试用),也是HTML和散文先进的文本编辑器.Sublime Text是由程序员Jon Skinner ...
- 【Redis】命令学习笔记——字符串(String)(23个超全字典版)
Redis支持五种数据类型:string(字符串),hash(哈希),list(列表),set(集合)及zset(sorted set:有序集合). 本篇基于redis 4.0.11版本,学习字符串( ...
- Linux内存管理(text、rodata、data、bss、stack&heap)
一.各内存区段的介绍 系统内的程序分为程序段和数据段,具体又可细分为一下几个部分: (1)text段-代码段 text段存放程序代码,运行前就已经确定(编译时确定),通常为只读,可以直接在ROM或Fl ...
- OpenGLES渲染
OpenGLES渲染 OpenGLES使用GPU渲染图片,不占用CPU,但其使用还是挺复杂的. 先用OpenGLES显示一张图片: // // ShowViewController.m // Open ...