1. 摘要

为解决姿态变化的问题,作者提出Pose-driven-deep convolutional model(PDC),结合了global feature跟local feature,
而local feature 还用一个feature weight network(FWN) 进行重要性程度度量,在常用reid数据集
CUHK03 、Market1501、viper 上面取到了非常好的效果。

2. 介绍

这个PDC模型有两个比较重要的子网络:FEN FWN;最后整合global feature 和 local feature 用一个softmax loss进行分类。
(1)FEN主要是把原始的图像进行姿态估计,找出14个关键点,然后基于这个14个关键点把行人分成6 parts
然后其中还有一个PTN 的网络把6 parts进行一个变换,整合成一张新的行人图像。
(2)FWN 对经过一系列CNN 的modified image学习每个part的权重表示

本文的主要贡献:

(1)提出PDC 模型,其中的FEN子网络对行人进行关键点检测,对parts进行处理
(2)FWN子网络,通过赋予行人每个part一个不同的权重来凸显有判别力的part,并且避免引入不必要的噪声

3. 方法

PDC模型的framework 如下           FEN子网络说明如下

FEN中的PTN具体结构     local feature 经过FWN同global feature 整合的过程图

4. 实验

(1)证明global feature 同local feature 结合的有效性、经过子网络FEN处理的有效性、经过FWN处理的有效性;
PDC模型(结合上述所有的处理)的结果最佳

(2)在经典数据集上同state-of-the-art 方法的比较
CUHK03 数据集上的比较(取得最好的结果)

Market-1501数据集上的比较(取得最好的结果)

VIPeR数据集上的比较(结果比spindle net稍差,可能是训练数据集数量不够多)

(3)FWN子网络的设计实验(实验表明一个卷积层+一个非线性变换最佳)

local feature同global feature 整合过程经过FWN子网络处理后的变化展示

5. 结论

文章的PDC模型证明了body parts cue 对Reid 还是起到相当大的作用。PDC模型通过整合global feature and local feature
并用一个子网络FWN对part部分的权重进行计算,效果甚佳。

6. 评价

模型效果很好。只是模型稍微显得有点多:其中包含了一般的CNN模型提取特征,还有FEN子网络对人体的关键点进行估计,
再对人体的parts进行变换,而整合;之后仍需要通过一个FWN子网络估计行人的各个part对Reid 的作用程度。
不过非常有意思的是FWN子网络,认为不同的part对Reid的影响不一致,从而为parts分配一个权重,这个有利于增强具有分辨力
的part,抵制噪声的加入,非常好。

7. 参考

Pose-driven Deep Convolutional Model for Person Re-identification

论文笔记 Pose-driven Deep Convolutional Model for Person Re-identification_tianqi_2017_ICCV的更多相关文章

  1. 论文笔记: Dual Deep Network for Visual Tracking

    论文笔记: Dual Deep Network for Visual Tracking  2017-10-17 21:57:08  先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...

  2. 论文笔记(1):Deep Learning.

    论文笔记1:Deep Learning         2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...

  3. 论文笔记之:Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks

    Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks NIPS 2015  摘要:本文提出一种 ...

  4. ASPLOS'17论文导读——SC-DCNN: Highly-Scalable Deep Convolutional Neural Network using Stochastic Computing

    今年去参加了ASPLOS 2017大会,这个会议总体来说我感觉偏系统和偏软一点,涉及硬件的相对少一些,对我这个喜欢算法以及硬件架构的菜鸟来说并不算非常契合.中间记录了几篇相对比较有趣的paper,今天 ...

  5. 论文笔记之:Deep Attributes Driven Multi-Camera Person Re-identification

    Deep Attributes Driven Multi-Camera Person Re-identification 2017-06-28  21:38:55    [Motivation] 本文 ...

  6. 论文笔记之:Deep Attention Recurrent Q-Network

    Deep Attention Recurrent Q-Network 5vision groups  摘要:本文将 DQN 引入了 Attention 机制,使得学习更具有方向性和指导性.(前段时间做 ...

  7. 论文笔记之: Hierarchical Convolutional Features for Visual Tracking

    Hierarchical Convolutional Features for Visual Tracking  ICCV 2015 摘要:跟卢湖川的那个文章一样,本文也是利用深度学习各个 layer ...

  8. 论文笔记之:Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grained Recognition

    Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grain ...

  9. 论文笔记之:Deep Recurrent Q-Learning for Partially Observable MDPs

    Deep Recurrent Q-Learning for Partially Observable MDPs  摘要:DQN 的两个缺陷,分别是:limited memory 和 rely on b ...

随机推荐

  1. db2存储过程迁移

    一.导出存储过程 EXPORT TO D:/PROCUDURE/procudure.del OF del MODIFIED BY LOBSINFILE SELECT 'SET CURRENT SCHE ...

  2. Code Signal_练习题_Sort by Height

    Some people are standing in a row in a park. There are trees between them which cannot be moved. You ...

  3. 177. [USACO Jan07] 有限制的素数

    177. [USACO Jan07] ★   输入文件:qprime.in   输出文件:qprime.out   简单对比 时间限制:1 s   内存限制:128 MB Farmer John 开始 ...

  4. FFmpeg实现将图片转换为视频

    ##名称:ffmpeg实现将图片转换为视频 ##平台:ubuntu(已经安装好了ffmpeg工具) ##日期:2017年12月10日 简介: 因为学习需要,需要将连续图片转换成视频,昨天和今天早上用o ...

  5. flutter Row里面元素居中显示

    直接上代码: new Expanded( flex: , child: new Row( children: <Widget>[ Expanded( child: new Containe ...

  6. GridView视图(BaseAdapter)

    效果图:

  7. CSS 引入方式 选择器

    ---恢复内容开始--- CSS是Cascading Style Sheets的简称,中文称为层叠样式表,用来控制网页数据的表现,可以使网页的表现与数据内容分离. 步骤: A.找到标签 B.操作标签 ...

  8. spring boot(14)-pom.xml配置

    继承spring-boot-starter-parent 要成为一个spring boot项目,首先就必须在pom.xml中继承spring-boot-starter-parent,同时指定其版本 & ...

  9. 7.Spring MVC静态资源访问

    在SpringMVC中常用的就是Controller与View.但是我们常常会需要访问静态资源,如html,js,css,image等. 默认的访问的URL都会被DispatcherServlet所拦 ...

  10. ASM Disk Discovery 最佳实践

    ASM DISK 的Discovery PATH ASM实例的ASM_DISKSTRING初始化参数使用一个逗号分割的字符串限制ASM实例发现的DISK可以用于ASM DISK, 该字符串支持通配符如 ...