【CV论文阅读】Dynamic image networks for action recognition

论文的重点在于后面approximation部分。

在《Rank Pooling》的论文中提到，可以通过训练RankSVM获得参数向量d，来作为视频帧序列的representation。而在dynamic论文中发现，这样的参数向量d，事实上与image是同等大小的，也就是说，它本身是一张图片（假如map与image同大小而不是提取的特征向量），那么就可以把图片输入到CNN中进行计算了。如下图可以看到一些参数向量d pooling的样例

参数向量d的快速计算

把计算d的过程定义一个函数。一个近似的方法是初始化，通过梯度下降的方法求解d的最优值

，最终可以得到，

把上式展开得

其中。在这里，于是结果为。

Dynamic Maps Network

可以看到rank pooling操作把多个image的信息pooling到一张image。上图的结构中，可以看到rank pooling的操作要么直接作用在输入的image上，要么作用在经过多层CNN提取的feature image上，因此可以把pooling 操作定义如下函数

可以把pooling层表达成一个线性的组合，由于Vt是一个线性函数，于是重写

可以看到函数本身也依赖于，对于BP算法的求导而言是很困难的。

使用近似的方法

从近似计算参数向量d的方法中可以看到，系数是独立于image的。直接使用d的近似计算来替代计算的线性组合，则BP算法后向传播时可以看到偏导数的解为

是一个单位矩阵。很明显，是一个常数。

总结

个人认为，近似的方法很巧妙，实验结果也挺好的，但近似的方法好像不大合理的样子……

【CV论文阅读】Dynamic image networks for action recognition的更多相关文章

【CV论文阅读】Rank Pooling for Action Recognition
这是期刊论文的版本,不是会议论文的版本.看了论文之后,只能说,太TM聪明了.膜拜~~ 视频的表示方法有很多,一般是把它看作帧的序列.论文提出一种新的方法去表示视频,用ranking function的 ...
【ML】Two-Stream Convolutional Networks for Action Recognition in Videos
Two-Stream Convolutional Networks for Action Recognition in Videos & Towards Good Practices for ...
论文阅读：Prominent Object Detection and Recognition: A Saliency-based Pipeline
论文阅读:Prominent Object Detection and Recognition: A Saliency-based Pipeline 如上图所示,本文旨在解决一个问题:给定一张图像, ...
【CV论文阅读】Two stream convolutional Networks for action recognition in Vedios
论文的三个贡献 (1)提出了two-stream结构的CNN,由空间和时间两个维度的网络组成. (2)使用多帧的密集光流场作为训练输入,可以提取动作的信息. (3)利用了多任务训练的方法把两个数据集联 ...
论文阅读 Dynamic Graph Representation Learning Via Self-Attention Networks
4 Dynamic Graph Representation Learning Via Self-Attention Networks link:https://arxiv.org/abs/1812. ...
论文阅读 TEMPORAL GRAPH NETWORKS FOR DEEP LEARNING ON DYNAMIC GRAPHS
14 TEMPORAL GRAPH NETWORKS FOR DEEP LEARNING ON DYNAMIC GRAPHS link:https://scholar.google.com.hk/sc ...
【CV论文阅读】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
由RCNN到FAST RCNN一个很重要的进步是实现了多任务的训练,但是仍然使用Selective Search算法来获得ROI,而FASTER RCNN就是把获得ROI的步骤使用一个深度网络RPN来 ...
【CV论文阅读】action recognition by dense trajectories
密集轨迹的方法是通过在视频帧上密集地采样像素点并且在追踪,从而构造视频的局部描述子,最后对视频进行分类的方法依然是传统的SVM等方法. 生成密集轨迹: (1)从8个不同的空间尺度中采样,它们的尺度差因 ...
【CV论文阅读】生成式对抗网络GAN
生成式对抗网络GAN 1. 基本GAN 在论文<Generative Adversarial Nets>提出的GAN是最原始的框架,可以看成极大极小博弈的过程,因此称为“对抗网络”.一般 ...

随机推荐

60使用nanopim1plus查看HDMI显示分辨率的问题(分色排版）V1.0
60使用nanopim1plus查看HDMI显示分辨率的问题(分色排版)V1.0 大文实验室/大文哥壹捌陆捌零陆捌捌陆捌贰 21504965 AT qq.com 完成时间:2017/12/5 17: ...
Linux基础之操作系统
一.什么是操作系统简单来说,操作系统就是一个协调.管理和控制计算机硬件资源和软件资源的控制程序. 二.操作系统存在的意义究根结底,我们日常对计算机的管理是对计算机硬件的管理.经过近百年的时间,现代 ...
canvas一周一练 -- canvas绘制马尾图案（5）
运行效果: <!DOCTYPE html> <html> <head> </head> <body> <canvas id=" ...
（转）全文检索技术学习(一)——Lucene的介绍
http://blog.csdn.net/yerenyuan_pku/article/details/72582979 本文我将为大家讲解全文检索技术——Lucene,现在这个技术用到的比较多,我觉得 ...
扩增子分析解读4去嵌合体非细菌序列生成代表性序列和OTU表
本节课程,需要先完成扩增子分析解读1质控实验设计双端序列合并 2提取barcode 质控及样品拆分切除扩增引物 3格式转换去冗余聚类先看一下扩增子分析的整体流程,从下向上逐层分析分 ...
ORACLE索引介绍和使用
1．什么是索引索引是建立在表的一列或多个列上的辅助对象,目的是加快访问表中的数据: Oracle存储索引的数据结构是B*树,位图索引也是如此,只不过是叶子节点不同B*数索引: 索引由根节点.分支节点 ...
[Luogu] P1407 [国家集训队]稳定婚姻
题目描述我国的离婚率连续7年上升,今年的头两季,平均每天有近5000对夫妇离婚,大城市的离婚率上升最快,有研究婚姻问题的专家认为,是与简化离婚手续有关. 25岁的姗姗和男友谈恋爱半年就结婚,结婚不到 ...
JDBC—简单的数据交互
东西传值.交互 ps:里面的时间为手动添加.如果需要更改为系统日期,那就把里面加了 // 的语句去掉 ,然后再加包驱动. 新建一个1.jsp 用来当做用户输入东西的界面再新建第二个页面 ...
VM 安装ubuntu16.04简易方法
在已经安装好VM10虚拟机后首先文件—>新建虚拟机—>典型(标准) 选择稍后安装操作系统,后续要使用的是已经下载好的ubuntu16.04镜像选择操作系统是linux ,版本是ub ...
对于前端请求Django 后端服务出现403 Forbidden (CSRF token missing or incorrect.) 问题的解析
Django中使用ajax post向後臺傳送資料時403 Forbidden (CSRF token missing or incorrect.):的解決辦法在Django中使用ajax post ...

【CV论文阅读】Dynamic image networks for action recognition

【CV论文阅读】Dynamic image networks for action recognition的更多相关文章

随机推荐

热门专题