论文笔记《Hand Gesture Recognition with 3D Convolutional Neural Networks》

一、概述

　　Nvidia提出的一种基于3DCNN的动态手势识别的方法，主要亮点是提出了一个novel的data augmentation的方法，以及LRN和HRn两个CNN网络结合的方式。

　　3D的CNN主要是使用了三维的卷积核去处理视频序列，是视频分析中常用的方法之一。

　　这里是可以识别手语这种动态连续的手势的。

二、亮点

　　首先..竟然没有state of art...

　　1、预处理：因为输入是连续的视频序列，所以需要对他们进行规范化，这里用nearest neighbor interpolation的方法来删除或者重复一些frame，来做出一个32frames的视频序列，然后做了一系列的预处理工作，用sobel算子得到梯度图啊，downsampling之类的，最后CNN的inputs是 57*125*32大小的梯度图和深度图交错的视频序列。

　　2、分类：用了两个CNN网络，hign-resolutin network 和low-resolution network，他们分别有一个参数W，两个的区别是，第一个就是正常的前面描述的网络，后面一个是28*62*32的一个input的网络，最后的结果是两个预测的成绩，这里运用了多空间尺度，所以泛化能力得到了提高。

　　3、optimation：cost function用了负的log-likelihood，优化用的是Nesterov accelerated gradient，参数设置的方法也是比较新的..具体名字忘了，反正就是对于防止方差过大有很好的抑制作用。

　　4、data augmentation：因为是视频序列，所以在时间和空间上做了很多操作，具体可以看论文，这个工作是他们的核心，但暂时不是我个人关注的重点，因为我觉得这个从学术上看，只能说是个不错的trick吧。

三、结论

　　两个网络的fusion我觉得是个很好的想法，或许以后还有进一步的想象空间，data augmentation也确实是提高泛化能力的一个不错的方法。

论文笔记《Hand Gesture Recognition with 3D Convolutional Neural Networks》的更多相关文章

《Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition》论文笔记
论文题目:<Vision Permutator: A Permutable MLP-Like ArchItecture For Visual Recognition> 论文作者:Qibin ...
[place recognition]NetVLAD: CNN architecture for weakly supervised place recognition 论文翻译及解析（转）
https://blog.csdn.net/qq_32417287/article/details/80102466 abstract introduction method overview Dee ...
论文笔记系列-Auto-DeepLab:Hierarchical Neural Architecture Search for Semantic Image Segmentation
Pytorch实现代码:https://github.com/MenghaoGuo/AutoDeeplab 创新点 cell-level and network-level search 以往的NAS ...
论文笔记——Rethinking the Inception Architecture for Computer Vision
1. 论文思想 factorized convolutions and aggressive regularization. 本文给出了一些网络设计的技巧. 2. 结果用5G的计算量和25M的参数. ...
论文笔记：Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells
Fast Neural Architecture Search of Compact Semantic Segmentation Models via Auxiliary Cells 2019-04- ...
论文笔记：ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware
ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware 2019-03-19 16:13:18 Pape ...
论文笔记：DARTS: Differentiable Architecture Search
DARTS: Differentiable Architecture Search 2019-03-19 10:04:26accepted by ICLR 2019 Paper:https://arx ...
论文笔记：Progressive Neural Architecture Search
Progressive Neural Architecture Search 2019-03-18 20:28:13 Paper:http://openaccess.thecvf.com/conten ...
论文笔记：Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation
Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation2019-03-18 14:4 ...
论文笔记系列-DARTS: Differentiable Architecture Search
Summary 我的理解就是原本节点和节点之间操作是离散的,因为就是从若干个操作中选择某一个,而作者试图使用softmax和relaxation(松弛化)将操作连续化,所以模型结构搜索的任务就转变成了 ...

随机推荐

小游戏banner广告流量量主指引
小程序导航 https://wq.xmaht.top
js匿名函数运行的方法
Javascript中定义函数的方式有多种,函数直接量就是其中一种.如var fun = function(){},这里function如果不赋值给fun那么它就是一个匿名函数.好,看看匿名函数的如何 ...
谈一谈如何远程访问MySQL(腾讯云,云主机)
连接MySQL (其他的sql 基本相同套路) 腾讯云不管怎么设置端口和MySQL权限以及监听端口就是不能连接? 远程访问MySQL数据库的几个关键点端口设置数据库权限设置数据库的监听端口设置 ...
PLC状态机编程第五篇－状态机自动生成PLC程序
这篇比较简单了,我就直接上图了,不多废话. 一.选择求解器,一定要选择定步长的. 二.右击Chart状态机,出现图上菜单三.左边红色的勾选择,选择右侧的菜单,然后点击Generate Code按钮, ...
笔记-pytho-语法-yield
笔记-python-语法-yield 1. yield 1.1. yield基本使用 def fab(max): n,a,b = 0, 0, 1 while n < max: y ...
Diycode开源项目 SitesListFragment分析
1.效果预览 1.1.网站列表实际界面 1.2.注意这个界面没有继承SimpleRefreshRecycleFragment 前面的话题和新闻继承了SimpleRefreshRecyclerFragm ...
5.Mongodb聚合
聚合 aggregate 聚合(aggregate)主要用于计算数据,类似sql中的sum().avg() 语法 db.集合名称.aggregate([{管道:{表达式}}]) 1.管道管道在Uni ...
Eclipse 安装(Neon 版本2016年)---Eclipse教程第01课
Eclipse 最新版本 Eclipse Neon,这个首次鼓励用户使用 Eclipse Installer 来做安装,这是一种由Eclipse Oomph提供的新技术,它通过提供一个很小的安装器来使 ...
erlang中的原子(atom)内部实现[转]
转自: http://www.kongqingquan.com/archives/208#more-208 Erlang中的atom由通用hash表实现,虚拟机中atom最终的用数值表示,对应表中的下 ...
Vue组件编写
Vue无疑是近来最火的一个前端框架,它吸取了angular1.x和react的精华,性能优良,而且易于上手,本文主要是关于如何去写一个组件. 首先是项目目录编写组件在这里我写了一个日期控件(移动端 ...

论文笔记《Hand Gesture Recognition with 3D Convolutional Neural Networks》

论文笔记《Hand Gesture Recognition with 3D Convolutional Neural Networks》的更多相关文章

随机推荐

热门专题