C3D Introduction

卷积神经网络（CNN）近年被广泛应用于计算机视觉中，包括分类、检测、分割等任务。这些任务一般都是针对图像进行的，使用的是二维卷积（即卷积核的维度为二维）。而基于视频的问题，提特征的方法主要分为双流和C3D两个分支，目前C3D衍生出P3D，I3D等等，这里只介绍最早的C3D caffe版提取特征的步骤以及遇到的问题。

C3D 用caffe实现
官网
 github

C3D Installation

installation

C3D User Guide

官方User Guide

Du Tran (Last modified Mar , )

C3D-v1. is released with new models (Mar , ).

No documentation for v1. yet, but some examples for feature extraction, training, and fine-tuning are provided.

文档介绍了C3D 1.0的用法，至于1.1，只有examples。

I.C3D Feature Extration

安装好C3D，下载预训练的模型，保存到

YOUR_PATH_TO_C3D/C3D-master/C3D-v1./examples/c3d_feature_extraction

change dir to

YOUR_PATH_TO_C3D/C3D-master/C3D-v1./examples/c3d_feature_extraction

Run:

sh c3d_sport1m_feature_extraction_frm.sh

or

sh c3d_sport1m_feature_extraction_video.sh

运行成功将在output文件夹找到特征文件。

遇到“out of memeory”内存不足的错误，调整min_batch_size参数。参见章节 I.B。

如能使用图片输入，不能使用视频输入。请确保编译OpenCV和ffmpeg时”shared-flags”为”on”。

I.A Extract C3D features for your own videos or frames

a.准备输入文件

输入为视频或视频帧
对于视频文件，由于使用opencv获得帧，帧数从0开始。
对于视频帧，命名为“video_folder/%06d.jpg”，帧数从1开始。一个文件夹最多999999个帧，如果视频超出999999帧，需要分成多个文件夹。

b.准备配置文件(具体可以参考默认的两个例子修改)

两个设置选项：输入列表(input_list) 和输出前缀(output_prefix)
在example中，输入列表的配置文件为: “prototxt/input_list_video.txt”和”prototxt/input_list_frm.txt”。

input_list文件需要制定输入的列表，格式为每行制定一个输入。每行的格式为

<string_path> <starting_frame> <label>

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

input/frm/v_ApplyEyeMakeup_g01_c01/

“string_path”: 为路径，对视频，为视频路径和文件名；对frames，是包含视频帧的目录路径。
“starting_frame”: C3D能从长为16帧的视频中提取特征。一个视频包含了大量的帧，我们需要指定C3D从哪一帧开始提取特征。例如上面例子中的视频一共有165帧，那么最后一行对应的145帧开始提取特征，取16帧，使用145帧-161帧的数据。在这里如果取用的帧的编号超过总帧数165，则会报错，要注意这一点。
“label”: 这个仅对训练、测试、调优起作用，提取特征的时候会被忽略，设置为0。

output_prefix文件要为每一个输入指定一个输出前缀。即行数与input_list一致。每行的格式为：
<output_prefix>

C3D将特征输出到 output_prefix.[feature_name]文件(例如prefix.fc6)。为了与输入对应，输出建议采用如下格式`sprintf(“output_folder/%06d”, starting_frame)。

c.提取特征

在prototxt中，通过后缀名为.prototxt的文档来指向你的输入列表文件。
主要修改这两行：

source: “prototxt/input_list_video.txt”

use_image: false

shuffle: false

source 修改为输入列表文件
如果使用图像文件，use_image修改为true。
提取特征时确保shuffle为false。
（.prototxt文件第一行是name，接下来是若干个layer，layer用json表示，我们只需要修改第一个输入layer。）

mean_file: "sport1m_train16_128_mean.binaryproto"

这里是使用的均值文件的路径，根据所使用的模型生成或选择均值文件即可

另外也可根据需求修改其他参数。

接下来使用extract_image_features工具来提取特征。

该工具使用的参数如下

extract_image_features.bin <feature_extractor_prototxt_file> <c3d_pre_trained_model> <gpu_id> <mini_batch_size> <number_of_mini_batches> <output_prefix_file> <feature_name1> <feature_name2> ...

feature_extractor_prototxt_file:

.prototxt文件，指向input_list_file，如prototxt/c3d_sport1m_feature_extractor_video.prototxt是demo所使用的prototxt文档
c3d_pre_trained_model:

下载的C3D预训练模型，如conv3d_deepnetA_sport1m_iter_1900000
gpu_id：

GPU ID，从0开始。设为-1则使用CPU
mini_batch_size:

批处理大小。默认值为50。根据GPU的性能修改。
number_of_mini_batches

批处理数量。

如果有100个clips，<mini_batch_size>设置为50，则<number_of_mini_batches>为2。

如果有101个clips，<mini_batch_size>设置为50，则<number_of_mini_batches>为3。

（就是ceil除法嘛）
output_prefix_file:

输出前缀文件
feature_name1：

特征名。(参见.prototxt文件的layers, 如 fc6-1, fc7-1, fc8-1, pool5, conv5b, prob,…)

example中的命令行如下：

GLOG_logtosterr= ../../build/tools/extract_image_features.bin prototxt/c3d_sport1m_feature_extractor_frm.prototxt conv3d_deepnetA_sport1m_iter_1900000   1 prototxt/output_list_prefix.txt fc7- fc6- prob

其他注意事项

输出的特征文件所保存的路径必须自己生成，C3D不会创建文件夹

如果提示“out of memory” 可以尝试减小batch size

提取的特征是二进制文件，需要进行格式转换才能正常处理

其他的注意事项可以参考官方的用户指南

问题及解决方法：

1. 运行成功但无法得到输出特征

完全按demo的路径配置一遍即可

2. 使用多batch提大量视频的特征

F0914 17:45:44.359544 287137792 video_data_layer.cpp:123] Check failed: read_status Testing must not miss any example

暂时的解决办法是设batchsize为1，将input_list和output_prefix切分为batch大小，一次一batch跑

 frame_num=

 for((i=;i<=frame_num;i=i+))

 do

     j=

     num=$(($i+$j))

     sed -n ''$i','$num'p' prototxt/input_list_frm.txt > prototxt/tmp_input_list_frm.txt

     sed -n ''$i','$num'p' prototxt/output_list_prefix.txt > prototxt/tmp_output_list_prefix.txt

     GLOG_logtosterr= ../../build/tools/extract_image_features.bin prototxt/c3d_sport1m_feature_extractor_frm.prototxt conv3d_deepnetA_sport1m_iter_1900000    prototxt/tmp_output_list_prefix.txt fc6-

 done

参考：

https://annazhou.github.io/2015/12/09/c3d/

https://www.cnblogs.com/yaoyaoliu/p/6929234.html

提取C3D视频特征(官方文档&实践)的更多相关文章

SolrJ API 官方文档最佳实践
以下内容译自Solr Wiki官方文档,版权没有,随意转载. Solrj 是一个访问solr的Java客户端.它提供了一个java接口用于添加更新和查询solr索引.本页面介绍SolrJ最新版本1.4 ...
HBase官方文档
HBase官方文档目录序 1. 入门 1.1. 介绍 1.2. 快速开始 2. Apache HBase (TM)配置 2.1. 基础条件 2.2. HBase 运行模式: 独立和分布式 2.3. ...
一起学微软Power BI系列-官方文档-入门指南(4)Power BI的可视化
在前面的系列文章中,我们介绍了官方有关获取数据,以及建模的原始文档和基本介绍.今天继续给大家介绍官方文档中,有关可视化的内容.实际上获获取数据和建模更注重业务关系的处理,而可视化则关注对数据的解读.这 ...
spring官方文档中文版
转 http://blog.csdn.net/tangtong1/article/details/51326887 spring官方文档:http://docs.spring.io/spring/do ...
《KAFKA官方文档》入门指南（转）
1.入门指南 1.1简介 Apache的Kafka™是一个分布式流平台(a distributed streaming platform).这到底意味着什么? 我们认为,一个流处理平台应该具有三个关键 ...
《Apache Velocity用户指南》官方文档
http://ifeve.com/apache-velocity-dev/ <Apache Velocity用户指南>官方文档原文链接译文连接译者:小村长校对:方腾飞 Qui ...
转 spring官方文档中文版
转 http://blog.csdn.net/tangtong1/article/details/51326887另附码云地址 https://gitee.com/free/spring-framew ...
《Spring 5官方文档》 Spring AOP的经典用法
原文链接在本附录中,我们会讨论一些初级的Spring AOP接口,以及在Spring 1.2应用中所使用的AOP支持. 对于新的应用,我们推荐使用 Spring AOP 2.0来支持,在AOP章节有 ...

随机推荐

CentOS 7安装MongoDB
1 下载安装包 wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-3.2.4.tgz 2 解压 .tgz 3 将解压包 ...
Flask 构建微电影视频网站(四)
后台管理实现后台管理系统使用flask sqlalchemy结合mysql数据库进行增删改查操作.分页的使用.路由装饰器定义.模板中变量调用.登录会话机制.上传文件.flask wtforms表单使 ...
Django+Vue打造购物网站(四)
首页商品类别数据显示商品分类接口大概需要两个,一个显示三个类别一个显示类别及类别下的全部商品现在开始写商品的接口首先编写三个分类的serializer class CategorySeria ...
洛谷P4178 Tree (算竞进阶习题)
点分治还是一道点分治,和前面那道题不同的是求所有距离小于等于k的点对. 如果只是等于k,我们可以把重心的每个子树分开处理,统计之后再合并,这样可以避免答案重复(也就是再同一个子树中出现路径之和为k的 ...
适配相关：viewpoint，@media，vw/vh，em/rem
从网易与淘宝的font-size思考前端设计稿与工作流: http://www.cnblogs.com/lyzg/p/4877277.html Rem布局的原理解析: https://yanhaiji ...
Awesome CLI
请移步https://github.com/zhuxiaoxi/awesome-online-tools 欢迎一同维护这个列表 jq JSON工具 shellcheck 更好用的Shell语法检查 c ...
jpg、png格式的图片转换成webp后颜色失真的问题
今天简单的试用了一下 cweb.exe 将 jpg, png 格式的图片转换成 webp 格式. 我今天下载的是当前最新版:1.0.0 cwebp 3.jpg -q 85 -o 3.webp 发现图 ...
Cucumber环境配置
1.JDK下载和配置 2.Maven下载和环境配置 3.IDEA下载和Cucumber插件安装下载地址官网,一般IDEA自带cucumber插件如果没有安装过的话,点击以下进行搜索安装,安装完成后 ...
全基因组关联分析（GWAS）扫不出信号怎么办（文献解读）
假如你的GWAS结果出现如下图的时候,怎么办呢?GWAS没有如预期般的扫出完美的显著信号,也就没法继续发挥后续研究的套路了. 最近,nature发表了一篇文献“Common genetic varia ...
集合的遍历以及在Spring中的注入
(一)遍历 list:foreach循环 set:foreach循环 map:先用set集合得到所有key值,然后循环key得到所有vale Map<String,String> map ...

提取C3D视频特征(官方文档&实践)