论文笔记之 SST: Single-Stream Temporal Action Proposals

SST: Single-Stream Temporal Action Proposals

2017-06-11 14:28:00

　　本文提出一种时间维度上的 proposal 方法，进行行为的识别。本文方法具有如下的几个特点：

　　　　1. 可以处理 long video sequence，只需要一次前向传播就可以处理完毕整个video；可以处理任意长度的 video，而不需要处理重叠的时间窗口；

　　　　2. 在 proposal generation task 上取得了顶尖的效果；

　　　　3. SST proposals 提供了一个较强的基准，进行 temporal action localization，将该方法结合到现有的分类任务中，可以改善分类的性能。

　　所提出方法的流程图如下所示：

　　Technical Approach:

　　我们所要达到的目标是：在一个 long video 上产生 temporal action proposals。

　　网络的几个重要的部分：

　　1. Visual Encoder (C3D) 用于编码 video frame，感知输入 video ；

　　2. Seq.Encoder (GRU) 的输入是降维后的 C3D feature，设计该模块的目的是： accumulate evidence across time as the video sequence progresses. 为了能够更好的产生 good proposals，该模块应该能够收集信息直到确定某个动作已经发生了，与此同时，扔掉不相关的背景信息。

　　Training:

　　由于行为识别本身就是一个多分类问题，所以这里用到了交叉熵损失函数来作为最终 loss function。

　　而总的 loss 就是该 loss 的加和：

　　数据集提供了裁剪好的 video，所以就是给定 gt 的监督训练任务，完全可以用反向传播算法进行训练。　　

　　Reference:

　　1. Paper: http://vision.stanford.edu/pdf/buch2017cvpr.pdf

　　2. Github: https://github.com/ranjaykrishna/SST

论文笔记之 SST: Single-Stream Temporal Action Proposals的更多相关文章

SST:Single-Stream Temporal Action Proposals论文笔记
SST:Single-Stream Temporal Action Proposals 这是本仙女认认真真读完且把算法全部读懂(其实也不是非常懂)的第一篇论文 CVPR2017 一作论文写作的动机m ...
TURN TAP: Temporal Unit Regression Network for Temporal Action Proposals（ICCV2017）
Motivation 实现快速和准确地抽取出视频中的语义片段 Proposed Method -提出了TURN模型预测proposal并用temporal coordinate regression来 ...
论文笔记之：DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns
DeepCAMP: Deep Convolutional Action & Attribute Mid-Level Patterns CVPR 2016 本文提出一种分割图像 patch 的 ...
论文笔记 | A Closer Look at Spatiotemporal Convolutions for Action Recognition
( 这篇博文为原创,如需转载本文请email我: leizhao.mail@qq.com, 并注明来源链接,THX!) 本文主要分享了一篇来自CVPR 2018的论文,A Closer Look at ...
Twitter 新一代流处理利器——Heron 论文笔记之Heron架构
Twitter 新一代流处理利器--Heron 论文笔记之Heron架构标签(空格分隔): Streaming-process realtime-process Heron Architecture ...
论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning
Dueling Network Architectures for Deep Reinforcement Learning ICML 2016 Best Paper 摘要:本文的贡献点主要是在 DQN ...
论文笔记：Towards Diverse and Natural Image Descriptions via a Conditional GAN
论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN ICCV 2017 Paper: http://op ...
论文笔记系列-Neural Network Search ：A Survey
论文笔记系列-Neural Network Search :A Survey 论文笔记 NAS automl survey review reinforcement learning Bayesia ...
Video Frame Synthesis using Deep Voxel Flow 论文笔记
Video Frame Synthesis using Deep Voxel Flow 论文笔记 arXiv 摘要:本文解决了模拟新的视频帧的问题,要么是现有视频帧之间的插值,要么是紧跟着他们的探索. ...

随机推荐

Marlin 溫度 sensor 校正
Marlin 溫度 sensor 校正使用 Type-K 溫度計將探針綑綁在加熱頭側面開啟Marlin-Marlin_v1\Marlin\thermistortables.h 要修改的溫度對應表 ...
擠出機步進馬達的 Steps per Unit 該如何計算?
擠出機步進馬達的 Steps per Unit 該如何計算? 這邊 Steps per Unit 指的是塑料往前推進1mm,步進馬達須要走幾步.依此定義,可知計算方式可以用步進馬達轉一圈需要的步 ...
cookie中存取中文
仿照admin的stark自定义组件的功能实现
仿照admin的stark自定义组件的功能实现:其中最主要的就是增删改查的实现 1.查:首先页面中显示表头和数据,都是动态的,而不是写死的. (1) 先看表头和表单数据:这个是查看的视图函数,但是为了 ...
实现Winform 跨线程安全访问UI控件
在多线程操作WinForm窗体上的控件时,出现“线程间操作无效:从不是创建控件XXXX的线程访问它”,那是因为默认情况下,在Windows应用程序中,.NET Framework不允许在一个线程中直接 ...
web前端学习：JavaScript学习指南
JavaScript是一种属于网络的脚本语言,已经被广泛用于Web应用开发,常用来为网页添加各式各样的动态功能,为用户提供更流畅美观的浏览效果.通常JavaScript脚本是通过嵌入在HTML中来实现 ...
GLSL写vertex shader和fragment shader
0.一般来说vertex shader处理顶点坐标,然后向后传输,经过光栅化之后,传给fragment shader,其负责颜色.纹理.光照等等. 前者处理之后变成裁剪坐标系(三维),光栅化之后一般认 ...
Linux 执行文本保存报错是使用了记事本等工具打开之后导致的
dos2unix xx.bat 格式化下就好了安装: yum install -y dos2unix
react复习总结（1）--react组件开发基础
这次是年后第一次发文章,也有很长一段时间没有写文章了.准备继续写.总结是必须的. 最近一直在业余时间学习和复习前端相关知识点,在一个公司呆久了,使用的技术不更新,未来真的没有什么前景,特别是我们这种以 ...
django外使用django ORM
import os, sys import django BASE_DIR = os.path.dirname(os.path.abspath(__file__)) # 定位到你的django根目录 ...

论文笔记之 SST: Single-Stream Temporal Action Proposals

论文笔记之 SST: Single-Stream Temporal Action Proposals的更多相关文章

随机推荐

热门专题