论文阅读笔记（十五）【CVPR2016】：Top-push Video-based Person Re-identiﬁcation

Approach

特征由两部分组成：space-time特征和外貌特征。space-time特征由HOG3D【传送门】提取，其包含了空间梯度和时间动态信息；外貌特征采用颜色直方图【传送门】和LBP【传送门】特征，并对同一个行人的所有帧采用平均池化。

定义训练集，其中是从标记为 y_i 的行人视频中提取的特征向量。定义两个特征向量的距离为：，采用马氏距离，具体为：

其中 M 为正半定矩阵。

（1）采用Top-push距离学习提高Top-rank匹配

正样本对的距离小于所以相关负样本对的距离最小值，其中 ρ 设置为1：

该项损失函数：

减小同类样本间的距离，使得同类行人视频间更收敛：

top-push距离学习的目标函数，其中 α 属于 [0, 1]：

该方法称为Top-push distance learning（TDL）.

（2）优化算法：

① 计算样本对的外积：

② 计算马氏距离：

③ 目标函数改写：

④ 采用随机梯度下降法来计算半正定矩阵 M，在第 t 步，假设 M = M_t，定义三元组的索引（i, j, k），当前梯度为：

⑤ 要求 M_t+1 保持半正定。对 M_t+1 进行特征分解：

对角矩阵 D_t+1 将负值清除，重新对 M_t+1 进行计算。

（3）算法流程：

（4）匹配：

定义待测行人的特征向量为：x_p，参照行人的特征向量为：x_g，则两者间的距离为：

Experiments

（1）实验设置：

① 数据集：PRID2011和iLIDS-VID

② 参数设置：λ = 1e-3，若损失函数减小，则在每次迭代以1.01倍进行扩大；若损失函数增大，则以0.5倍减小.

③ 特征提取：每一帧被resize为128*48，并被划分为8*16大小的patch，并包含50%的重叠，最终划分为155个patch来提取颜色直方图和LBP特征。所有样貌特征被concat为1705维的特征向量。HOG3D提取出的特征向量为1200维，最终合并为2905维。

（2）实验结果：

论文阅读笔记（十五）【CVPR2016】：Top-push Video-based Person Re-identiﬁcation的更多相关文章

论文阅读笔记十五：Pyramid Scene Parsing Network（CVPR2016）
论文源址:https://arxiv.org/pdf/1612.01105.pdf tensorflow代码:https://github.com/hellochick/PSPNet-tensorfl ...
论文阅读笔记（七）【TIP2018】：Video-Based Person Re-Identiﬁcation by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics
是由一篇 IJCAI2016 扩的期刊. 该篇会议论文的阅读笔记[传送门] 期刊扩充的部分:P-SI2DL 1.问题描述: 在会议论文中介绍的SI2DL方法采用了视频三元组作为视频关系(是否匹配)的逻 ...
论文阅读笔记十八：ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation(CVPR2016)
论文源址:https://arxiv.org/abs/1606.02147 tensorflow github: https://github.com/kwotsin/TensorFlow-ENet ...
论文阅读笔记十：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs (DeepLabv2)(CVPR2016)
论文链接:https://arxiv.org/pdf/1606.00915.pdf 摘要该文主要对基于深度学习的分割任务做了三个贡献,(1)使用空洞卷积来进行上采样来进行密集的预测任务.空洞卷积可以 ...
论文阅读笔记十九：PIXEL DECONVOLUTIONAL NETWORKS(CVPR2017)
论文源址:https://arxiv.org/abs/1705.06820 tensorflow(github): https://github.com/HongyangGao/PixelDCN 基于 ...
论文阅读笔记十六：DeconvNet:Learning Deconvolution Network for Semantic Segmentation(ICCV2015)
论文源址:https://arxiv.org/abs/1505.04366 tensorflow代码:https://github.com/fabianbormann/Tensorflow-Decon ...
论文阅读笔记十四：Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation（CVPR2015）
论文链接:https://arxiv.org/abs/1506.04924 摘要该文提出了基于混合标签的半监督分割网络.与当前基于区域分类的单任务的分割方法不同,Decoupled 网络将分割与分类 ...
论文阅读笔记十二：Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation（DeepLabv3+）(CVPR2018)
论文链接:https://arxiv.org/abs/1802.02611 tensorflow 官方实现: https: //github.com/tensorflow/models/tree/ma ...
论文阅读笔记（五）【CVPR2012】:Large Scale Metric Learning from Equivalence Constraints
由于在读文献期间多次遇见KISSME,都引自这篇CVPR,所以详细学习一下. Introduction 度量学习在机器学习领域有很大作用,其中一类是马氏度量学习(Mahalanobis metric ...
云时代架构阅读笔记十五——之前碰到的Java面试题
1.一个".java"源文件中是否可以包括多个类(不是内部类)?有什么限制? 可以有多个类,但只能有一个public的类,并且public的类名必须与文件名相一致. 2.Java有 ...

随机推荐

学习Qt的资源-网站、论坛、博客等
来自<零基础学Qt 4编程>一书的附录附录C Qt资源 C.1 Qt 官方资源全球各大公司以及独立开发人员每天都在加入 Qt 的开发社区.他们已经认识到了Qt 的架构本身便可加快应用程 ...
React+wangeditor+node富文本处理带图片上传
最近有个需求出现在我的视野中,因为我的另外的博客需要上传文章,但是我不想每次都在我的数据库中慢慢的修改格式,所以我另做了一个后台去编辑文本后发送给服务器,那么这里就涉及到两点,一个是富文本,一个是需要 ...
UnityTips:不要在发布版本中实现OnGUI方法
0x00 问题不知道大家是否在调试Unity应用性能的时候发现过一条常见的Marker:UIEvents.IMGUIRenderOverlays. 很多情况下,这条叫做UIEvents.IMGUIR ...
Redis5.xc两种持久化方式以及主从复制配置
关注公众号:CoderBuff,回复"redis"获取<Redis5.x入门教程>完整版PDF. <Redis5.x入门教程>目录第一章 · 准备工作第 ...
浅析Internet上使用的安全协议
Internet上使用的安全协议网络安全是分层实现的,从应用层安全到数据链路层安全. 一.运输层安全协议:安全套接字SSL 1.1.简介 SSL 是安全套接层 (Secure Socket Laye ...
Lambda如何实现条件去重distinct List,如何实现条件分组groupBy List
条件去重我们知道, Java8 lambda自带的去重为 distinct 方法, 但是只能过滤整体对象, 不能实现对象里的某个值进行判定去重, 比如: List<Integer> nu ...
Error serializing object：序列化对象时出错
序列化对象时出错 :Error serializing object. Error serializing object. Cause: java.io.NotSerializableExceptio ...
springboot之swagger快速启动(新的ui)
springboot之swagger快速启动(新的ui) 功能点: 集成swagger前端接口文档 Swagger 整合 zuul 智能列表无缝集成 knife4j 前端文档支持 v0.1.2RE ...
使用C#的计时器加观察者模式完成报警推送需求
前言这两天面试了一个物联网公司高级研发,面试题是下面这样子公司领导,部门主管,小组组长,组成员4级,假如有个疫情预警,先通知组人员(对个人,主要有一个处理就算处理了) 如果3分钟没处理,就往组长 ...
Python当中的len(),str(),input(),print()函数当中值得注意的点
在python当中很多时候会用到这三个函数,这也是考试当中十分常见的考点,这里做一些记录: 1.len():用于测量变量当中的字符串/元组等的长度举个例子: >>> stt=&qu ...

论文阅读笔记（十五）【CVPR2016】：Top-push Video-based Person Re-identiﬁcation

论文阅读笔记（十五）【CVPR2016】：Top-push Video-based Person Re-identiﬁcation的更多相关文章

随机推荐

热门专题