(摘自王逍同学的论文arxiv-2019+Pedestrian Attribute Recognition A Survey)

1. 数据集

Dataset Pedestrians Attribute Source
PETA Dataset 19000 61 binary and 4 multi-class attributes outdoor & indoor
RAP Dataset 41585 69 binary and 3 multi-class attributes indoor
RAP 2.0 Dataset 84928 69 binary and 3 multi-class attributes indoor
PA-100K Dataset 10w 26 binary attributes outdoor
WIDER Attribute Dataset 13789 14 binary attributes WIDER images
Market-1501_Attribute 32668 26 binary and 1 multi-class attributes outdoor
DukeMTMC-Attribute 34183 23 binary attributes outdoor
Parse27k Dataset 27000 8 binary and 2 multi-class orientation attributes outdoor
APiS 3661 11 binary and 2 multi-class attributes KITTI , CBCL Street Scenes,INRIA and SVS
Database of Human Attributes 9344 27 binary attributes image site Flickr
CRP Dataset 27454 1 binary attributes and 13 multi-class attributes outdoor
Clothing Attributes Dataset 1856 23 binary attributes and 3 multi-class attributes Sartorialist and Flickr
Berkeley-Attributes of People dataset 8035 9 binary attributes H3D dataset PASCAL VOC 2010

备注: 加粗的数据集是已经获取到的,RAP和RAP2.0数据集需要联系作者,之后会拿到.

2. 实现方法总结及已有资源


Github资源(图中橙色框标注):

3.详细介绍

3.1 基于全局特征的属性检测方法

3.1.1 FT-CNN(Re-id Using CNN Features Learned from Combination of Attributes(ICPR2016))


在Alexnet的4096维特征上,用多个全连接分类器表征各个特征。很明显惨不忍睹。

3.2 基于局部特征的行人属性检测方法

3.2.1 Poselets (ICCV-2011)

3.2.2 PANDA(CVPR-2014)


其中关键poselet采用3.2.1《Describing people: A poselet-based
approach to attribute classification》中的划分方法。通过融合局部特征和整体特征,提高了准确率。

3.2.3 MLCNN (ICB-2015)


采用网格划分,部分融合

3.2.4 ARAP (BMVC2016)


自适应检测关键点和对应Bbox,然后进行属性检测。端到端。

3.2.5 PGDM (ICME-2018)

3.2.6 LGNet (BMVC-2018)

3.2.7 总结

算法结合了全局和细粒度部件的特征,其中身体部位的定位是通过分割算法得到,如:part detection, pose estimation, poselets or proposal generation algorithm.
算法整体准确率和部件分割的算法有很大关系。

3.3 基于注意力机制的属性检测方法

3.3.1 HydraPlus-Net (ICCV-2017)

SenseTime的论文,将多层注意力机制图多向映射到不同的特征层。。HP-net包含两部分,M-Net和AF-Net。

  • Main Net(M-Net):
    单纯的CNN结构,论文的实现是基于inception_v2,包含三个inception block,还包含几个低层卷积层;
  • Attentive Feature Net(AF-Net):三个分支,每个分支有三个inception_v2 block和一个MDA

    AF-Net包含三个子网络分支,并使用MDA模块增强,即F(αi)F(αi),其中αiαi是由inception块输出特征生成的注意力图,图中使用黑实线标记。随后应用到kth块的输出,图中用虚红线标示。每个MDA模块,有一条注意力生成链接,三条注意力特征构造链接。不同的MDA模块,注意力图由不同的inception模块生成,之后乘到不同层的特征图,生成不同层在注意特征。 MDA模块的一个示例如下图所示:

    以下是可视化特征:

3.3.2 DIAA (ECCV-2018)

3.4 继续序列预测的属性检测方法

3.4.1 JRL (ICCV-2017)

3.4.2 RCRA (AAAI-2019)

3.5 基于图的属性检测方法

h3.5.1 VSGR (AAAI-2019)

Attribute-Recognition行人属性识别资料的更多相关文章

  1. 行人属性识别 PETA数据集

    参见https://blog.csdn.net/hyk_1996/article/details/80322026(内有数据集下载地址) 其中footwearSneaker属性应该是footwearS ...

  2. 行人重识别(ReID) ——基于深度学习的行人重识别研究综述

    转自:https://zhuanlan.zhihu.com/p/31921944 前言:行人重识别(Person Re-identification)也称行人再识别,本文简称为ReID,是利用计算机视 ...

  3. (2020行人再识别综述)Person Re-Identification using Deep Learning Networks: A Systematic Review

    目录 1.引言 2.研究方法 2.1本次综述的贡献 2.2综述方法 2.3与现有综述的比较 3.行人再识别基准数据集 3.1基于图像的再识别数据集 3.2基于视频的再识别数据集 4.基于图像的深度再识 ...

  4. 行人重识别(ReID) ——技术实现及应用场景

    导读 跨镜追踪(Person Re-Identification,简称 ReID)技术是现在计算机视觉研究的热门方向,主要解决跨摄像头跨场景下行人的识别与检索.该技术能够根据行人的穿着.体态.发型等信 ...

  5. 行人重识别(ReID) ——数据集描述 CUHK03

    数据集简介 CUHK03是第一个足以进行深度学习的大规模行人重识别数据集,该数据集的图像采集于香港中文大学(CUHK)校园.数据以"cuhk-03.mat"的 MAT 文件格式存储 ...

  6. 区分元素特性attribute和对象属性property

    × 目录 [1]定义 [2]共有 [3]例外[4]特殊[5]自定义[6]混淆[7]总结 前面的话 其实attribute和property两个单词,翻译出来都是属性,但是<javascript高 ...

  7. [SQL]select scope_identity()传回插入相同范围之识别资料行中的最后一个识别值

    传回插入相同范围之识别资料行中的最后一个识别值.范围是一个模组:预存程序.触发程序.函数或批次.因此,如果两个陈述式在相同预存程序.函数或批次中,它们就在相同范围中. 语法: SCOPE_IDENTI ...

  8. boolean attribute(布尔值属性) attribute vs property

    boolean attribute(布尔值属性) boolean attribute     HTML - Why boolean attributes do not have boolean val ...

  9. ecshop 属性表(attribute)商品属性表(goods_attr)货品表(prduct) 商品数量的联系

    ecshop 属性表(attribute)商品属性表(goods_attr)货品表(prduct) 商品数量的联系 一个商城的商品属性存放在属性表(attribute)里 ,每个商品对应的属性在goo ...

随机推荐

  1. 使用Sublime Text 3进行Markdown编辑+实时预览

    使用Sublime Text 3进行Markdown编辑+实时预览 安装软件包管理器 打开Sublime Text 3 同时按下 ctrl+` ,窗口底部出现一个小控制台 复制以下代码,粘贴到控制台的 ...

  2. 用Pytorch训练MNIST分类模型

    本次分类问题使用的数据集是MNIST,每个图像的大小为\(28*28\). 编写代码的步骤如下 载入数据集,分别为训练集和测试集 让数据集可以迭代 定义模型,定义损失函数,训练模型 代码 import ...

  3. tomcat在windows及linux环境下安装

    下载tomcat 下载地址: https://tomcat.apache.org/download-90.cgi 7,8,9的版本都可以下,这里下载最新版本 注意:Binary是编译好的,可以直接使用 ...

  4. MongoDB 高可用集群副本集+分片搭建

    MongoDB 高可用集群搭建 一.架构概况 192.168.150.129192.168.150.130192.168.150.131 参考文档:https://www.cnblogs.com/va ...

  5. 查看linux的cpu信息

    # 总核数 = 物理CPU个数 X 每颗物理CPU的核数 # 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数 # 查看物理CPU个数 cat /proc/cpuinfo| ...

  6. 滚动锚定(Scroll Anchoring)- 让视口内容不再因视口上方 DOM 元素的高度变化而产生跳动

    不知道你有没有经历过这样的场景:当你打开一张“多图杀猫”的页面后,正一张图一张图边滚边看,在你刚准备定睛看某一张图的时候,这张图突然被它上面的内容挤到了视口下方,然后你赶紧把滚动条往下拉,试图追赶这张 ...

  7. tr1

    tr echo 12345 | tr '0-9' '9876543210' echo 87654 | tr '9876543210' '0-9' ROT13 echo "tr came, t ...

  8. 9、el表达式的使用

    一.EL表达式的作用: 1).使用变量访问web域中存储的对象 ${user } 2).访问javabean的属性   ${user.address.city } 3).执行基本的逻辑运算(el表达式 ...

  9. 有关于 java native方法

    看java源码时,经常看到native方法后,就没有具体的是实现了. 以前一直有疑惑,今天查了查,看到前辈们的博文才明白: Java的native方法http://blog.csdn.net/wike ...

  10. Junit的基础学习

    一个强大的单元测试框架: 一.组成部分: 1.注解: (1)@Test 注解: 放在测试方法上,表示这是用于测试其他方法的一个测试单元 @Test public void testSum1(){ Sy ...