论文笔记 Pose-driven Deep Convolutional Model for Person Re-identification_tianqi_2017_ICCV

老砍浪天涯 2024-10-16 01:38:47 原文

1. 摘要

为解决姿态变化的问题，作者提出Pose-driven-deep convolutional model（PDC），结合了global feature跟local feature，
而local feature 还用一个feature weight network（FWN）进行重要性程度度量，在常用reid数据集
CUHK03 、Market1501、viper 上面取到了非常好的效果。

2. 介绍

这个PDC模型有两个比较重要的子网络:FEN FWN；最后整合global feature 和 local feature 用一个softmax loss进行分类。
（1）FEN主要是把原始的图像进行姿态估计，找出14个关键点，然后基于这个14个关键点把行人分成6 parts
然后其中还有一个PTN 的网络把6 parts进行一个变换，整合成一张新的行人图像。
（2）FWN 对经过一系列CNN 的modified image学习每个part的权重表示

本文的主要贡献：

（1）提出PDC 模型，其中的FEN子网络对行人进行关键点检测，对parts进行处理
（2）FWN子网络，通过赋予行人每个part一个不同的权重来凸显有判别力的part，并且避免引入不必要的噪声

3. 方法

PDC模型的framework 如下 FEN子网络说明如下

FEN中的PTN具体结构 local feature 经过FWN同global feature 整合的过程图

4. 实验

（1）证明global feature 同local feature 结合的有效性、经过子网络FEN处理的有效性、经过FWN处理的有效性；
PDC模型（结合上述所有的处理）的结果最佳

（2）在经典数据集上同state-of-the-art 方法的比较
CUHK03 数据集上的比较（取得最好的结果）

Market-1501数据集上的比较（取得最好的结果）

VIPeR数据集上的比较（结果比spindle net稍差，可能是训练数据集数量不够多）

（3）FWN子网络的设计实验（实验表明一个卷积层+一个非线性变换最佳）

local feature同global feature 整合过程经过FWN子网络处理后的变化展示

5. 结论

文章的PDC模型证明了body parts cue 对Reid 还是起到相当大的作用。PDC模型通过整合global feature and local feature
并用一个子网络FWN对part部分的权重进行计算，效果甚佳。

6. 评价

模型效果很好。只是模型稍微显得有点多：其中包含了一般的CNN模型提取特征，还有FEN子网络对人体的关键点进行估计，
再对人体的parts进行变换，而整合；之后仍需要通过一个FWN子网络估计行人的各个part对Reid 的作用程度。
不过非常有意思的是FWN子网络，认为不同的part对Reid的影响不一致，从而为parts分配一个权重，这个有利于增强具有分辨力
的part，抵制噪声的加入，非常好。

7. 参考

Pose-driven Deep Convolutional Model for Person Re-identification

论文笔记 Pose-driven Deep Convolutional Model for Person Re-identification_tianqi_2017_ICCV的更多相关文章

论文笔记： Dual Deep Network for Visual Tracking
论文笔记: Dual Deep Network for Visual Tracking 2017-10-17 21:57:08 先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...
论文笔记(1)：Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
论文笔记之：Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks
Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks NIPS 2015 摘要:本文提出一种 ...
ASPLOS'17论文导读——SC-DCNN: Highly-Scalable Deep Convolutional Neural Network using Stochastic Computing
今年去参加了ASPLOS 2017大会,这个会议总体来说我感觉偏系统和偏软一点,涉及硬件的相对少一些,对我这个喜欢算法以及硬件架构的菜鸟来说并不算非常契合.中间记录了几篇相对比较有趣的paper,今天 ...
论文笔记之：Deep Attributes Driven Multi-Camera Person Re-identification
Deep Attributes Driven Multi-Camera Person Re-identification 2017-06-28 21:38:55 [Motivation] 本文 ...
论文笔记之：Deep Attention Recurrent Q-Network
Deep Attention Recurrent Q-Network 5vision groups 摘要:本文将 DQN 引入了 Attention 机制,使得学习更具有方向性和指导性.(前段时间做 ...
论文笔记之： Hierarchical Convolutional Features for Visual Tracking
Hierarchical Convolutional Features for Visual Tracking ICCV 2015 摘要:跟卢湖川的那个文章一样,本文也是利用深度学习各个 layer ...
论文笔记之：Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grained Recognition
Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grain ...
论文笔记之：Deep Recurrent Q-Learning for Partially Observable MDPs
Deep Recurrent Q-Learning for Partially Observable MDPs 摘要:DQN 的两个缺陷,分别是:limited memory 和 rely on b ...

随机推荐

python学习之老男孩python全栈第九期_day015知识点总结
# 作用域相关(2)locals() # 返回本地作用域中的所有名字 globals() # 返回全局作用域中的所有名字 # 迭代器/生成器相关(3)range()print('__next__' i ...
个人遗漏知识的回顾-HTML
常用的一些快捷键: Windows + e 我的电脑Ctrl + Tab 网页间不同页面切换F2 重命名Ctrl+Shift+S 另存为前端的一些常识:前端意义:将效果图生成网页网页组成:文字.图片 ...
第二十三天- 模块 re
# 1. 正则表达式 # 元字符# . 除了换行符外任意字符# \w 数字字母下划线# \s 空白符# \b 单词的末尾# \d 数字# \W 除了数字字母下划线# \D 除了数字# \S 除 ...
AngularJS之过滤器
AnularJS的过滤器用来格式化需要展示给用户的数据,有很多实用的内置过滤器,也可以自己编写. 在HTML中的模板绑定符号{{ }}内通过|符号来调用过滤器.例如,假设我们希望将字符串转换成大写,可 ...
了解JS
什么是js? JS,是JavaScript的缩写形式,JavaScript是一种基于对象和事件驱动并且具有相对安全性的客户端脚本语言. 借用java之名,但和java没有关系 javascript历 ...
JavaScript 面向对象的程序设计
面向对象(Object-oriented,OO)的语言有一个标志,那就是它们都有类的概念.而通过类可以创建任意多个具有相同属性和方法的对象.前面提到过,ECMAScript中没有类的概念,因此它的对象 ...
elixir 表单 map
键-值对 iex(13)> map = %{:a => 1, 2 => :b}%{2 => :b, :a => 1}iex(14)> map[:a]1iex(15) ...
ES6入门——类的概念
1.Class的基本用法概述 JavaScript语言的传统方式是通过构造函数,定义并生成新对象.这种写法和传统的面向对象语言差异很大,下面是一个例子: function Point(x, y) { ...
实验二：klee处理未建模函数和处理error的方式
首先,能够分析klee源码固然重要.但是目前尚未到那个地步.我按照我的过程,记录和分析我所做的实验. 结论性内容是: 1.klee处理printf传入符号值的情形时,报为error,不会将符号值具体化 ...
32位Windows7 利用多余的不能识别的电脑内存 RAMDISK5.5教程
32位Windows7 利用多余的不能识别的电脑内存 RAMDISK5.5教程环境:Windows7 32位 Ultimate 内存8GB 只能识别2.95GB内存 ramdisk5.5只适用于Wi ...