CTAP: Complementary Temporal Action Proposal Generation论文笔记

主要观点：基于sliding window（SW）类的方法，如TURN，可以达到很高的AR，但定位不准；基于Group的方法，如TAG，AR有明显的上界，但定位准。所以结合两者的特长，加入Complementary Filtering（互补滤波）模块，实际上就是加一个网络预测TAG能不能搞，不能搞就用SW。

第一阶段：视频被划分为等长的单元，使用两层时序卷积生成unit-level的actionness score，基于这一分数序列，分别使用TAG和滑动窗口生成两组proposals，其中TAG就是分水岭算法，滑动窗口选用几种不同的尺寸，窗口之间有一定重合，具体参数见论文4.2。

第二阶段：互补滤波。通过一个Proposal-level Actionness Trustworthiness Estimator（PATE）模块来评估TAG能否成功。训练时使用gt作为目标，通过TAG出来的proposals与gt之间的iou决定正负样本，将proposals内的unit-level特征池化到固定尺寸，再过两层fc和sigmoid即可。测试时将其作用于每个SW，如果输出的分数低于阈值，则代表这个窗口内TAG大概率失效，该窗口正式成为一个proposal，否则丢弃。如此，便可获得一个正式的proposal集合。

第三阶段：排序和边界调整。TURN也有这一步骤，但它使用均值池化来聚合时序特征，丢弃了temporal ordering信息。本文设计一个Temporal convolutional Adjustment and Ranking（TAR）网络，使用时序卷积来聚合unit-level特征。具体地，在proposal内部，均匀采样n_ctl个unit（个人称之为内部特征），分别以起始点和终结点为中心各采样n_ctx个unit（个人称之为上下文特征）。内部特征过两层时序卷积和一层全连接，输出是动作的概率。两个上下文特征也分别通过两层时序卷积和一层全连接，输出时间offset。TAR模块的训练，对于原视频进行密集的滑窗采样作为样本，注意，这里SW的参数设定应该比第一阶段更密集，虽然我还没具体看代码。

CTAP: Complementary Temporal Action Proposal Generation论文笔记的更多相关文章

CTAP: Complementary Temporal Action Proposal Generation (ECCV2018)
互补时域动作提名生成这里的互补是指actionness score grouping 和 sliding window ranking这两种方法提proposal的结合,这两种方法各有利弊,形成互补 ...
SST:Single-Stream Temporal Action Proposals论文笔记
SST:Single-Stream Temporal Action Proposals 这是本仙女认认真真读完且把算法全部读懂(其实也不是非常懂)的第一篇论文 CVPR2017 一作论文写作的动机m ...
论文笔记之 SST: Single-Stream Temporal Action Proposals
SST: Single-Stream Temporal Action Proposals 2017-06-11 14:28:00 本文提出一种时间维度上的 proposal 方法,进行行为的识别.本 ...
论文阅读（Zhuoyao Zhong——【aixiv2016】DeepText A Unified Framework for Text Proposal Generation and Text Detection in Natural Images）
Zhuoyao Zhong--[aixiv2016]DeepText A Unified Framework for Text Proposal Generation and Text Detecti ...
论文笔记：Towards Diverse and Natural Image Descriptions via a Conditional GAN
论文笔记:Towards Diverse and Natural Image Descriptions via a Conditional GAN ICCV 2017 Paper: http://op ...
论文笔记系列-Neural Network Search ：A Survey
论文笔记系列-Neural Network Search :A Survey 论文笔记 NAS automl survey review reinforcement learning Bayesia ...
Temporal Action Detection with Structured Segment Networks (ssn)【转】
Action Recognition: 行为识别,视频分类,数据集为剪辑过的动作视频 Temporal Action Detection: 从未剪辑的视频,定位动作发生的区间,起始帧和终止帧并预测类别 ...
TURN TAP: Temporal Unit Regression Network for Temporal Action Proposals（ICCV2017）
Motivation 实现快速和准确地抽取出视频中的语义片段 Proposed Method -提出了TURN模型预测proposal并用temporal coordinate regression来 ...
论文笔记之：Natural Language Object Retrieval
论文笔记之:Natural Language Object Retrieval 2017-07-10 16:50:43 本文旨在通过给定的文本描述,在图像中去实现物体的定位和识别.大致流程图如下 ...

随机推荐

Pytorch-拼接与拆分
引言本篇介绍tensor的拼接与拆分. 拼接与拆分 cat stack split chunk cat numpy中使用concat,在pytorch中使用更加简写的 cat 完成一个拼接两个向量 ...
MongoDB导入文件夹（内含json和bson文件）
1. 使用mongo命令将数据库删除: mongo命令: use db_name; db.dropDatabase() 2. 导入(指定文件夹)数据: linux命令: mongorestore -d ...
架构模式: Saga
架构模式: Saga 上下文您已应用每服务数据库模式.每个服务都有自己的数据库.但是,某些业务事务跨越多个服务,因此您需要一种机制来确保服务之间的数据一致性.例如,假设您正在建立一个客户有信用额度的 ...
realpython教程之机器学习之Windows下的环境配置
不得不说,realPython的教程确实写的仔细,准确,有逻辑.果然高质量的学习材料还是更利于学的. 反观我们学校,似乎就有些急功近利了.连Python语言基础都没学,就直接讲深度学习.完全不符合学习 ...
20191204-使用nginx解决ajax测试调用接口跨域问题
问题描述之前要测试一个http的接口,在postman中测试成功,但使用ajax调用却跨域.于是通过使用ngin反向代理的方式来解决ajax调用跨域问题测试页面的内容 <html> & ...
[转帖]k8s.gcr.io镜像无法下载的问题
k8s.gcr.io镜像无法下载的问题 https://blog.51cto.com/liuzhengwei521/2301497 看了下赵安家老师应该是青岛人在济南顺能网络科技有限公司上班铭盛 ...
Redis（1.11）Redis4.0.11 cluster 分布式集群搭建
概念与了解:Redis(1.7)Redis高可用架构(理论篇) [0]试验环境结构图如下: (这里试验没有那么多机器,就用3台机器搭建试验) redis1是redis集群的一个节点A,上面运行了两个 ...
ABP领域层定义仓储并实现
原文作者:圣杰原文地址:ABP入门系列(3)——领域层定义仓储并实现在原文作者上进行改正,适配ABP新版本.内容相同一.先来介绍下仓储仓储(Repository): 仓储用来操作数据库进行数据 ...
nginx自定义log_format以及输出自定义http头
官方文档地址: http://nginx.org/en/docs/http/ngx_http_log_module.html 一.log_format默认格式首先Nginx默认的log_format ...
Djangon简介
目录 Djangon简介 MVC与MTV模型 MVC MTV python三大主流web框架 Django的下载与基本命令基于Django实现的一个简单示例 Django静态文件配置 Django ...

CTAP: Complementary Temporal Action Proposal Generation论文笔记

CTAP: Complementary Temporal Action Proposal Generation论文笔记的更多相关文章

随机推荐

热门专题