【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

转载请注明出处：https://www.cnblogs.com/White-xzx/

原文地址：https://arxiv.org/abs/1709.09930

Github: https://github.com/xh-liu/HydraPlus-Net

如有不准确或错误的地方，欢迎交流~

　　HP-Net是一个基于注意力机制（attention-based）的深度神经网络，将多层注意力机制图多向映射到不同的特征层。

【HP-Net Adavantage】

　　（1）模型能够从浅层到语义层捕获注意力；

　　（2）挖掘多尺度的可选注意力特征，充实最终的行人特征表示；

　　（3）提取出细节和局部特征来充实高层全局特征，这些特征在细粒度的行人分析任务中是非常重要的；

　　（4）提出多方向注意机制模块（multi-directional attention，MDA），提取多层（multiple level）特征，包含局部和全局特征，进行多层特征融合，进行细粒度的行人分析；

　　　multi-level：（a）语义层：分辨相似外观行人的局部区域特征，如长短发、长短袖；（b）浅层：捕捉行人的衣服的条纹；

　　 multi-scale：（c）（d）多尺度特征，描述行人特点（c）小尺度特征对应‘打电话’；（d）大尺度全局理解描述‘性别’

【HydraPlus-Net网络结构】

　　（1）Main Net（M-Net）：单纯的CNN结构，论文的实现是基于inception_v2，包含三个inception block，还包含几个低层卷积层

　　（2）Attentive Feature Net（AF-Net）：三个分支，每个分支有三个inception_v2 block和一个MDA

【Attentive Feature Network】

　　AF-Net包含3个MDA增强的网络分支，

　　AF-Net和M-Net共享卷积框架，他们的输出级联后经过全局平均池化和全连接层融合，最终的输出映射到属性logits用于属性识别，或特征向量用于再认证。

　　为inception i模块的输出经过1 1conv、BN、ReLU产生的注意力图，并被相乘到inception k的输出特征图，产生多层多尺度注意力特征，传送到后续的层，MDA模块的最后L个注意力特征级联作为最终特征表示，k∈{1,2,3}

【Attention Mechanism 注意力机制】

　　传统基于注意力的模型，将注意力图返回输入到原相同的模块（右图红线），通过应用注意力图到相邻的模块来扩展此机制；HP-Net应用不同的注意力图到多个模块（下图b），在相同的空间分布下融合多层特征。

【Multi-level Attention Map 多层注意力图】

　　不同模块学习得到注意力图在尺度和细节上差异非常大，如下图(a)，高层通常更粗糙、更聚焦语义区域（特定物体），如，低层捕获局部特征和细节（边缘和纹理），如。因此，使用MDA模块融合不同层注意力特征，可以收集不同层的语义信息，提供更多可选特征表达。

　　上图为每个输入图像提取某level的L = 8 attention channels 的特征图，不同MDA作用下，多级注意力特征的定性演示

　　（a）浅层属性，如上衣类型，需要低层注意力连接，纹理 -> T-Shirt （b）语义或目标级别的属性，如手机，需要高层注意力连接

【Stage-wise Training 分阶段训练】

　　①训练M-Net，提取基本特征；

　　②将M-Net复制三次，得到AF-Net的三个分支，每个MDA模块有三个子分支组成，即临近的三个不同的inception blocks，依次微调每个blocks，即共有9个blocks需要微调；

　　③微调完成后，固定AF-Net和M-Net，训练全局平均池化层（GAP）和全连接层（FC）；

　　④输出层：属性识别使用交叉熵损失函数，行人ReID使用softmax函数。

【实验结果】

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis的更多相关文章

论文阅读 | Towards a Robust Deep Neural Network in Text Domain A Survey
摘要这篇文章主要总结文本中的对抗样本,包括器中的攻击方法和防御方法,比较它们的优缺点. 最后给出这个领域的挑战和发展方向. 1 介绍对抗样本有两个核心:一是扰动足够小:二是可以成功欺骗网络. 所有 ...
[论文阅读] ImageNet Classification with Deep Convolutional Neural Networks(传说中的AlexNet)
这篇文章使用的AlexNet网络,在2012年的ImageNet(ILSVRC-2012)竞赛中获得第一名,top-5的测试误差为15.3%,相比于第二名26.2%的误差降低了不少. 本文的创新点: ...
论文解读第三代GCN《 Deep Embedding for CUnsupervisedlustering Analysis》
Paper Information Titlel:<Semi-Supervised Classification with Graph Convolutional Networks>Aut ...
论文解读DEC《Unsupervised Deep Embedding for Clustering Analysis》
Junyuan Xie, Ross B. Girshick, Ali Farhadi2015, ICML1243 Citations, 45 ReferencesCode:DownloadPaper: ...
论文解读GCN 1st《 Deep Embedding for CUnsupervisedlustering Analysis》
论文信息 Tittle:<Spectral Networks and Locally Connected Networks on Graphs> Authors:Joan Bruna.Wo ...
BERT 论文阅读笔记
BERT 论文阅读 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 由 @快刀切草莓君 ...
Deep Reinforcement Learning for Dialogue Generation 论文阅读
本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...
【医学图像】3D Deep Leaky Noisy-or Network 论文阅读（转）
文章来源:https://blog.csdn.net/u013058162/article/details/80470426 3D Deep Leaky Noisy-or Network 论文阅读原 ...
论文阅读：Face Recognition: From Traditional to Deep Learning Methods 《人脸识别综述：从传统方法到深度学习》
论文阅读:Face Recognition: From Traditional to Deep Learning Methods <人脸识别综述:从传统方法到深度学习> 一.引 ...

随机推荐

Java NIO Socket编程实例
各I/O模型优缺点 BIO通信模型 BIO主要的问题在于每当有一个新的客户端请求接入时,服务端必须创建一个新的线程处理新接入的客户端链路,一个线程只能处理一个客户端连接线程池I/O编程假如所有可用 ...
TCP协议连接三次握手
TCP(Transmission Control Protocol) 传输控制协议 TCP是主机对主机层的传输控制协议,提供可靠的连接服务,采用三次握手确认建立一个连接: 位码即tcp标志位,有6种标 ...
【题解】 bzoj2460: [BeiJing2011]元素（线性基）
bzoj2460,戳我戳我 Solution: 线性基板子,没啥好说的,注意long long 就好了 Code: //It is coded by Ning_Mew on 5.29 #include ...
HGOI20180831 NOIP2018模拟
input1: 4 4 4 4 4 3 2 4 5 4 5 5 5 1 7 3 2 output1: Yes Yes Yes No 好的吧数学题QwQ考场上没人做出来qwq 就是判断两个矩形能否互相放 ...
洛谷 T28312 相对分子质量【2018 6月月赛 T2】解题报告
T28312 「化学」相对分子质量题目描述做化学题时,小\(F\)总是里算错相对分子质量,这让他非常苦恼. 小\(F\)找到了你,请你来帮他算一算给定物质的相对分子质量. 如果你没有学过相关内容也 ...
SQLServer过期的解决方案
看图吧,不喜欢说话,图里面我都打备注了 0SQLService异常 1找到安装中心 2升级版本 3监测ing 4输入升级key 5同意并下一步 6下一步 7下一步 8下一步 9收工 10可以打开了
java开发爬虫Deno
java开发爬虫Deno 身为一个程序员不会两三手爬虫怎么能在行业里立足啊,这是开发中自己写的一个java爬虫的Demo,供大家参考. java爬虫的开发依赖于jsoup.jar 直接上代码 publ ...
eos源码剖析之controller
controller::block_status,区块状态枚举类,包括: irreversible = 0,该区块已经被当前节点应用,并且被认为是不可逆的.validated = 1,这是由一个有效生 ...
DNA序列编码中Hairpin的定义和计算
DNA序列编码中Hairpin的定义和计算觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 [1] 张凯. DNA计算核酸编码优化及算法设计[D]. 2008. [2] Shin, ...
bzoj千题计划239：bzoj4069: [Apio2015]巴厘岛的雕塑
http://www.lydsy.com/JudgeOnline/problem.php?id=4069 a!=1: 从高位到低位一位一位的算记录下哪些位必须为0 dp[i][j] 表示前i个数分为 ...

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis

【论文阅读】HydraPlus-Net: Attentive Deep Features for Pedestrian Analysis的更多相关文章

随机推荐

热门专题