论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation

Introduction

（1）Motivation:
在现实场景中，摄像头会因为故障呈现灰白色，或者为了节省视频的存储空间而人工设置为灰白色。灰度图像(grayscale images)由8位存储，而彩色图像由24位存储。在节省存储空间的同时，也带来了信息丢失的问题，增加了行人重识别的难度。

通过对同一张照片的彩色版和灰度版进行余弦相似度(cosine similarity)计算，发现两者相似度在0.8左右，即灰度图像损失了约20%的有效信息。

定义本文彩色-灰度视频间行人重识别的问题：Color to Gray Video Person Re-identification (CGVPR).

（2）Contribution:

① 提供了一个新的基准数据集，命名为 true-color and grayscale video person re-identification dataset (CGVID);

② 提出了解决 CGVPR 的方法，命名为 semi-coupled dictionary pair learning (SDPL).

Dataset Description

Our Approach

（1）视频重构错误项（video reconstruction error term）：

彩色视频特征集合：A = [A¹, A², ..., A^N]

灰度视频特征集合：B = [B¹, B², ..., B^N]

其中 Aⁱ = [aⁱ₁, aⁱ₂, ..., aⁱ_ni] 表示第 i 个视频的特征集合，aⁱ_j 表示第 i 个视频的第 j 个步行周期的特征，每个特征维度为 d.

定义：彩色、灰度字典矩阵 D_C 和 D_G，A 和 B 通过字典矩阵的编码后的矩阵为 X 和 Y，视频内投影矩阵为 W 和 V.

视频重构错误项定义（目的是提高保真度）：

异构视频投影项定义（目的是提高同一视频间的收敛）：

其中 μⁱ 定义为第 i 个行人视频的特征集合的中心.

（2）半耦合映射项（semi-coupled mapping term）：

目的是为了使得编码后的两个矩阵更接近，通过学习映射矩阵 P 来弥补灰度图像的信息损失. 该项定义为：

（3）距离区分度项（discriminative fidelity term）：

目的是为了缩小相同行人视频间距离，增大不同行人视频间距离. 该项定义为：

（4）目标函数：

其中 α 和 λ 是平衡因子，ρ₁ 和 ρ₂ 分别控制了视频间投影矩阵和视频内映射的效果，一般设置为 1 / N.

E_reg为正则化项目，等于：.

模型的思路：

The Optimization of SDPL

（1）更新 W 和 V：

通过求导得到解：

推导过程：中间跳过了计算步骤，详见论文笔记3【传送门】. V 的计算类似，略.

（2）更新 X 和 Y：

通过求导得到解：

推导过程：得到的解有细微差别（Y 的求解同理，略）. 这里 |S| = 1.

（3）更新 D_C 和 D_G：

使用ADMM算法进行求解.

（4）更新 P：

通过求导得出解：

推导过程：得到的解有细微差别.

（5）优化算法：

（6）视频匹配：

① 对灰度视频特征 F 进行编码（设置 Y = 0）：

② 对彩色视频特征 C 进行编码（设置 X = 0）：

③ 计算两者距离，并挑选出距离最近的匹配视频.

④ 算法流程：

Experiments

（1）实验设置：

① 特征提取：STFV3D、深度学习特征PCB.

② 参数设置：α = 0.04，β = 0.06，λ = 0.2， ρ₁ = ρ₂ = 1 / N. 5-fold cross validation.

③ 对比方法：

字典学习方法：STFV3D，TDL，KISSME，XQDA，SI2DL，JDML；

深度学习方法：RNNCNN，ASTPN，DeepZero，PCB.

（2）实验结果：

论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation的更多相关文章

论文阅读笔记（七）【TIP2018】：Video-Based Person Re-Identiﬁcation by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics
是由一篇 IJCAI2016 扩的期刊. 该篇会议论文的阅读笔记[传送门] 期刊扩充的部分:P-SI2DL 1.问题描述: 在会议论文中介绍的SI2DL方法采用了视频三元组作为视频关系(是否匹配)的逻 ...
论文阅读笔记九：SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFS (DeepLabv1)(CVPR2014)
论文链接:https://arxiv.org/abs/1412.7062 摘要该文将DCNN与概率模型结合进行语义分割,并指出DCNN的最后一层feature map不足以进行准确的语义分割,DCN ...
论文阅读笔记（二）【IJCAI2016】：Video-Based Person Re-Identiﬁcation by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics
摘要 (1)方法: 面对不同行人视频之间和同一个行人视频内部的变化,提出视频间和视频内距离同时学习方法(SI2DL). (2)模型: 视频内(intra-vedio)距离矩阵:使得同一个视频更紧凑: ...
论文阅读笔记（四）【TIP2017】：Video-Based Pedestrian Re-Identiﬁcation by Adaptive Spatio-Temporal Appearance Model
Introduction (1)背景知识: ① 人脸识别是具有高可靠性的生物识别技术,但在低解析度(resolution)和姿态变化下效果很差. ② 步态(gait)是全身行为的生物识别特征,大部分步 ...
论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center
作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...
论文阅读笔记 Word Embeddings A Survey
论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...
论文阅读笔记 Improved Word Representation Learning with Sememes
论文阅读笔记 Improved Word Representation Learning with Sememes 一句话概括本文工作使用词汇资源--知网--来提升词嵌入的表征能力,并提出了三种基于 ...
[置顶] 人工智能（深度学习）加速芯片论文阅读笔记（已添加ISSCC17，FPGA17...ISCA17...）
这是一个导读,可以快速找到我记录的关于人工智能(深度学习)加速芯片论文阅读笔记. ISSCC 2017 Session14 Deep Learning Processors: ISSCC 2017关于 ...
Nature/Science 论文阅读笔记
Nature/Science 论文阅读笔记 Unsupervised word embeddings capture latent knowledge from materials science l ...

随机推荐

node -- express框架
express node的一个框架安装express cnpm install express -S 引入 const express = require("express"); ...
linux系统的启动流程梳理
1. 不同版本的linux系统的启动流程 1.1 centos6.x系统的启动流程其详细启动步骤如下: 1)开机,BIOS自检,检查各个硬件是否正常 2)读取硬盘MBR信息,引导系统启动 3)加载g ...
table-cell设置宽高、居中
table-cell默认宽高由内容决定 <style type="text/css" rel="stylesheet"> .content { co ...
《自拍教程29》Sublime_小脚本编写首选
Sublime Sublime 是一个轻量.简洁.高效.跨平台的编辑器, 最新的是Sublime Text 3. Sublime对Python支持非常好,如果只是简单的编写批处理脚本编写, 或者小范围 ...
一篇文章带你搞定 ElasticSearch 术语
这篇文章主要介绍 ElasticSearch 的基本概念,学习文档.索引.集群.节点.分片等概念,同时会将 ElasticSearch 和关系型数据库做简单的类比,还会简单介绍 REST API 的使 ...
pikachu-服务器端请求伪造SSRF(Server-Side Request Forgery)
一.SSRF概述(部分内容来自pikachu平台) SSRF(Server-Side Request Forgery:服务器端请求伪造),其形成的原因大都是由于服务端提供了从其他服务器应用获取数据的功 ...
python len函数(41)
在python中除了print函数之外,len函数和type函数应该算是使用最频繁的API了,操作都比较简单. 一.len函数简介返回对象的长度(项目数)参数可以是序列(例如字符串str.元组tup ...
盒模型大小取决于它的padding，margin，border数值
盒模型规定了元素框处理元素内容width与height值.内边距padding.边框border 和外边距margin 的数值大小.边框内的空白是内边距padding,边框外的空白是外边距margi ...
Android中四种补间动画的使用示例(附代码下载)
场景 Android中四种补间动画. 透明度渐变动画旋转动画缩放动画平移动画注: 博客: https://blog.csdn.net/badao_liumang_qizhi关注公众号霸道的程 ...
使用MuMu模拟器调试AndroidStudio项目
1.安装一款安卓模拟器本例使用网易MuMu模拟器,因为目前网络上这类模拟器只有mumu的安卓版本是最新的,为6.0,安卓自带的Virtual Device虽然有很新的版本,但如果pc配置不是很高 ...

论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation

论文阅读笔记（九）【TIFS2020】：True-Color and Grayscale Video Person Re-Identiﬁcation的更多相关文章

随机推荐

热门专题