论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns

DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns

CVPR 2016

　　本文提出一种分割图像 patch 的方法，因为细粒度的分类问题，如：行人动作识别和行人属性识别等等。

　　Appearance Overview

　　本文提出一种利用 mid-level 深度视觉模式进行动作和属性分类，这是属于细粒度分类任务。我们的一个想法是：一个较好的 embedding 可以改善聚类算法的质量。我们设计了一种迭代算法，在每次迭代中，我们通过训练一个新的 CNN 来对上一次迭代得到的 cluster labels 进行分类，以此来改善 embedding。此外，我们相信结合人物整体的信息和 context 以及图像 patch 的特定动作和属性标签可以改善 mid-level elements 的clusters。所以，我们从 AlexNet 网络结构上进行改进，以结合 patch 和 global image 的 feature。实验表明，利用这种新的结构学到的 embedding 性能超过了仅仅使用 patch images 微调后的 AlexNet 网络结构。

　　此外，在每次迭代过程中，我们通过移除 poorly scored patches 来改善 clusters。作者提到本文的两个贡献点为：

　　1). design an iterative algorithm contains an expert patch CNN to improve the embedding ;

　　2). proposing new patch CNN architecture training to use context in clustering the patches.

　　Pipeline Details

　　1. Initial feture extraction and clustering.

　　　　第一个模块利用 MDPM 对image patches 进行聚类。

　　2. Train patch clusters CNN.

　　　　我们主要的意识认为图像 patches 的表示在聚类上扮演了重要的角色。假设初始的聚类是合理的，在这个模块，我们训练一个新的 CNN 来改善表示。训练这个新的 CNN 的目的就是当给定图像 patch的时候，可以预测 cluster 的 label。这里就和之前的那个 CNN 区别开来，之前的那个是为了 classify bounding box images to different action categories. 我们相信利用判别性的 patch cluster CNN results 学习这个细粒度的分类可以得到一个更好的聚类表示。　　

　　Updating clusters

　　既然已经用新训练的 CNN 学习了表示，那么我们利用 MDPM算法再一次的更新 clusters 以得到一个更好的 clusters 的集合来匹配新的表示。由于在 MDPM 中进行 mid-level clusters 的填充是非常耗时的，我们固定住第一层的聚类，然后通过重复 re-clustering 和利用新的表示融合来更新 clusters。这个可以得到更好的聚类，最后，我们训练新的 LDA 分类器来检测 clusters。为了进行 re-clustering而改进的 MDPM在 4.1节进行了描述。

　　Harvesting patches.

　　为了改善 clusters 的纯度，我们通过移除不适合任何 cluster的patches来清理 clusters。我们通过阈值化 LDA 分类器为每一个cluster产生的置信值来达到此效果。最终，we pass the new patches with associate cluster labels to learn a new CNN based representation.

　　3. Mid-level Deep Patterns Network

　　说实话，感觉看到这里，感觉整个流程写的挺混乱的。我哩个去。。。让我先整理下思路。。。懵逼了。。。

　　Experience

　　我的感受：

　　　　夜深了，我要入睡了。。。

　　　　明天再 bb

论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns的更多相关文章

论文笔记(1)：Deep Learning.
论文笔记1:Deep Learning 2015年,深度学习三位大牛(Yann LeCun,Yoshua Bengio & Geoffrey Hinton),合作在Nature ...
论文笔记： Dual Deep Network for Visual Tracking
论文笔记: Dual Deep Network for Visual Tracking 2017-10-17 21:57:08 先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...
ASPLOS'17论文导读——SC-DCNN: Highly-Scalable Deep Convolutional Neural Network using Stochastic Computing
今年去参加了ASPLOS 2017大会,这个会议总体来说我感觉偏系统和偏软一点,涉及硬件的相对少一些,对我这个喜欢算法以及硬件架构的菜鸟来说并不算非常契合.中间记录了几篇相对比较有趣的paper,今天 ...
论文笔记之：Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks
Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networks NIPS 2015 摘要:本文提出一种 ...
论文笔记之：Deep Attention Recurrent Q-Network
Deep Attention Recurrent Q-Network 5vision groups 摘要:本文将 DQN 引入了 Attention 机制,使得学习更具有方向性和指导性.(前段时间做 ...
论文笔记之： Hierarchical Convolutional Features for Visual Tracking
Hierarchical Convolutional Features for Visual Tracking ICCV 2015 摘要:跟卢湖川的那个文章一样,本文也是利用深度学习各个 layer ...
论文笔记之：Deep Reinforcement Learning with Double Q-learning
Deep Reinforcement Learning with Double Q-learning Google DeepMind Abstract 主流的 Q-learning 算法过高的估计在特 ...
论文笔记之：Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grained Recognition
Fully Convolutional Attention Localization Networks: Efficient Attention Localization for Fine-Grain ...
论文笔记之：Deep Attributes Driven Multi-Camera Person Re-identification
Deep Attributes Driven Multi-Camera Person Re-identification 2017-06-28 21:38:55 [Motivation] 本文 ...

随机推荐

python 接口开发（一）
cmd中,提示pip版本太低,先升级pip pip install --upgrade pip (pip,安装和管理python扩展包的工具) cmd下,pip,出现详细信息证明装成功了 pip ...
ACM - 概率、期望题目小结（临时）
概率DP求期望大多数都是全期望公式的运用.主要思考状态空间的划分以及状态事件发生的概率.问题可以分为无环和有环两类.无环一类多数比较简单,可以通过迭代或者记忆化搜索完成.有环一类略复杂,可以通过假设方 ...
ios应用数据存储方式
一.ios应用常用的数据存储方式 1.plist(XML属性列表归档) 2.偏好设置 3.NSKeydeArchiver归档(存储自定义对象) 4.SQLite3(数据库,关系型数据库,不能直接存储对 ...
文本编辑器vim
Vim是一个功能强大的全屏幕文本编辑器,是Linux/UNIX上最大的文本编辑器,它的作用是建立.编辑.显示文本文件. Vim没有菜单,只有命令.
IndexOf() LastIndexOf() Contains() StartsWith() EndsWith()方法比较
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.I ...
HttpHandler中无法使用Session(context.Session 为Null)
一.问题描述: 最近需要做一个对特定请求(.report)进行响应的接口,当然是使用实现IHttpHandler来进行处理,实现IHttpHandler接口就必须要实现它的两个方法,ProcessRe ...
PHP 防范IP攻击
<?php //查询禁止IP $ip =$_SERVER['REMOTE_ADDR']; $fileht=".htaccess2"; if(!file_exists($fil ...
Inno Setup 插件大全
Inno Setup 插件大全这是我收集到的目前网上最全的插件之一,里面的每个插件,都有详细的脚本示例来讲解该插件的具体用法.另外,下载了我公开的脚本的朋友,也有可能会被提示缺少文件,如果缺 ...
Magento产品批量导入方法？
从事外贸的我们在工作中,经常需要添加成千上万个的产品,如果一个一个的去上传,要花费很多时间,有是很让人头痛,那么应该如何实现产品批量上传?如果使用的是Magento系统的话,那么你现在有福利了,因为M ...
Dynamic支持CollectionView布局、 MotionEffects特效、 BlurImage效果、 TextKit
1 使用UIDynamicAnimator对集合视图进行布局 1.1 问题 UIKit Dynamic动力模型一个非常有趣的用途就是影响集合视图的布局,可以给集合视图的布局添加各种动力行为,使其产生丰 ...

论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns

论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns的更多相关文章

随机推荐

热门专题