论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21:43:53  这篇文章的 Motivation 来自于 MDNet: 本文所提出的 framework 为:…
Co-saliency Detection via A Self-paced Multiple-instance Learning Framework  T-PAMI  2016  摘要:Co-saliency detection 从一组图像中提取出共同显著的物体.一方面,传统的检测方法严重依赖于手工设计的距离度量来反应协同显著区域有效的属性.另一方面,大部分的当前方法都是无监督的.在实际场景中,效果不会很好,因为缺乏一种 robust 的学习机制 来充分利用每一张图像的 weak labels…
Pedestrian Detection aided by Deep Learning Semantic Tasks CVPR 2015 本文考虑将语义任务(即:行人属性和场景属性)和行人检测相结合,以语义信息协助进行行人检测.先来看一下大致的检测结果(TA-CNN为本文检测结果): 可以看出,由于有了属性信息的协助,其行人检测的精确度有了较大的提升.具体网络架构如下图所示: 首先从各个数据集上进行行人数据集的收集和整理,即:从Caltech上收集行人正样本和负样本,然后从其他数据集上收集 ha…
概要 JiFeng老师CVPR2019的另一篇大作,真正地把检测和跟踪做到了一起,之前的一篇大作FGFA首次构建了一个非常干净的视频目标检测框架,但是没有实现帧间box的关联,也就是说没有实现跟踪.而多目标跟踪问题一般需要一个off-the-shelf的检测器先去逐帧检测,然后再将各帧的detection进行associate,检测与跟踪是一个"晚融合"的过程,检测是为了跟踪,跟踪却不能反哺检测.这篇文章结构非常干净,就连笔者这样对跟踪基本小白的水平也能无压力看懂.更可贵的是,这篇文章…
这篇论文主要介绍了如何使用图片级标注对像素级分割任务进行训练.想法很简单却达到了比较好的效果.文中所提到的loss比较有启发性. 大体思路: 首先同FCN一样,这个网络只有8层(5层VGG,3层全卷积).不同的是由于图片只有image-level的标注,所以输出图像的清晰度无法保证,所以没有反卷积.图片的分辨率很低很低,但这相对于我们的期望已经很好了. FCN框图 LOSS: 这个loss说明了很多道理,我们先贴原文: 我们只关注1.该图片中有label的dense output2.含有该lab…
Cross-Domain Visual Matching,即跨域视觉匹配.所谓跨域,指的是数据的分布不一样,简单点说,就是两种数据「看起来」不像.如下图中,(a)一般的正面照片和各种背景角度下拍摄的照片:(b)摄像头不同角度下拍到的照片:(c)年轻和年老时的人脸照:(d)证件照和草图风格的人脸照,这些图像都存在对应关系,但由于它们属于不同的域,因此必须针对不同的域采用不同的特征提取方法,之后再做特征匹配.这篇论文提出用一种通用的相似模型来匹配两个域之间的特征,并将其和特征提取流程融合在一起,统一…
2014 TKDE(IEEE Transactions on Knowledge and Data Engineering) 张敏灵,周志华 简单介绍 传统监督学习主要是单标签学习,而现实生活中目标样本往往比较复杂,具有多个语义,含有多个标签.本综述主要介绍了多标签学习的一些相关内容,包括相关定义,评价指标,8个多标签学习算法,相关的其它任务. 论文大纲 相关定义:学习任务,三种策略 评价指标:基于样本的评价指标,基于标签的评价指标 学习算法:介绍了8个有代表性的算法,4个基于问题转化的算法和4…
Analysis Coreset 是带有权重的数据子集,目的是在某个方面模拟完整数据的表现(例如损失函数的梯度,既可以是在训练数据上的损失,也可以是在验证数据上的损失): 给出优化目标的定义: $w^t$ 是 t 轮得到的 coreset 权重,$X_t$ 是 t 轮得到的 coreset,$L$ 既可以是在训练数据上的损失,也可以是在验证数据上的损失,$L_T$ 是在 coreset 上的损失函数,$\theta_t$ 是 t 轮得到模型参数: 最小化 ERR 来使 Coreset 最好地模拟…
MIL陷入局部最优,检测到局部,无法完整的检测到物体.将instance划分为空间相关和类别相关的子集.在这些子集中定义一系列平滑的损失近似代替原损失函数,优化这些平滑损失. C-MIL learns instance subsets, where the instances are spatially related, i.e., overlapping with each other, and class related, i.e., having similar object class…
Saliency Detection: A Spectral Residual Approach 题目:Saliency Detection: A Spectral Residual Approach 作者:Xiaodi Hou, Liqing Zhang 领域:显著性目标检测 类型:新视角, 新方法 概述 The ability of human visual system to detect visual saliency is extraordinarily fast and reliab…