mobienet, shufflenet

参考github上各位大神的代码

mobilenet和shufflenet，实现起来感觉还是各种问题。

mobilenet目前使用的代码来自这里：https://github.com/BVLC/caffe/pull/5665/files。而shufflenet我用的是：https://github.com/farmingyard/ShuffleNet

之前用官方的caffe训练mobilenet，速度超级慢，而且官方的caffe不知道为什么，minibatch只能为1，显存没有优化好的问题caffe一直是诟病啊。后来用了我们自己的版本，显存可以上去了，但是速度依然很忙。而训练结束后，inference也超慢。而且根据caffe的forloop的实现方式，group conv的group越多，速度会越慢，而mobilenet是group最多的，因此速度很慢很慢。后来参考上面的代码，重新训练了一次，mobilenet速度一下子快多了。具体就是矩阵计算的优化其实，但是我其实就知道单纯的forloop肯定不行的，这年头不并行怎么可以啊。而且GPU有自己的forloop优化，还有就是其实GPU卡的矩阵计算，利用sharememory等，速度可以快不少的。

目前训练mobilenet40万次了，调学习率前，52%的top1，76的top5.不知道调完学习率能不能增加10个点，如果可以的话，那说明代码还靠谱的。而要说的是inference比起来官方的group conv快太多了，1s大概能测试100张吧。

shufflenet因为里面有group conv，其实用的也是caffe自己的，但是group取3时速度还可以接受，不像mobilenet，group和outputnum一样，速度奇慢。目前shufflenet的效果应该也还可以，但是能不能像文章中说的，还需要测试。

不怎么做优化工作，持续关注。打算去看看mobilenet的速度优化。

mobienet, shufflenet的更多相关文章

ShuffleNet总结
在2017年末,Face++发了一篇论文ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devic ...
机器视觉：MobileNet 和 ShuffleNet
虽然很多CNN模型在图像识别领域取得了巨大的成功,但是一个越来越突出的问题就是模型的复杂度太高,无法在手机端使用,为了能在手机端将CNN模型跑起来,并且能取得不错的效果,有很多研究人员做了很多有意义的 ...
轻量架构ShuffleNet V2：从理论复杂度到实用设计准则
转自:机器之心近日,旷视科技提出针对移动端深度学习的第二代卷积神经网络 ShuffleNet V2.研究者指出过去在网络架构设计上仅注重间接指标 FLOPs 的不足,并提出两个基本原则和四项准则来指 ...
【论文阅读】ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices
ShuffleNet: An Extremely Efficient Convolutional Neural Network for MobileDevices
面向移动端的轻量级神经网络模型mobilenet、ShuffleNet
翻译: http://baijiahao.baidu.com/s?id=1565832713111936&wfr=spider&for=pc http://baijiahao.baid ...
ShuffleNet
ShuffleNet (An Extremely Efficient Convolutional Neural Network for Mobile Devices) —— Face++ shuffl ...
从Inception v1,v2,v3,v4,RexNeXt到Xception再到MobileNets,ShuffleNet,MobileNetV2
from:https://blog.csdn.net/qq_14845119/article/details/73648100 Inception v1的网络,主要提出了Inceptionmodule ...
图像分类丨浅析轻量级网络「SqueezeNet、MobileNet、ShuffleNet」
前言深度卷积网络除了准确度,计算复杂度也是考虑的重要指标.本文列出了近年主流的轻量级网络,简单地阐述了它们的思想.由于本人水平有限,对这部分的理解还不够深入,还需要继续学习和完善. 最后我参考部分列 ...
ShuffleNet：
ShuffleNet算法详解论文:ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices ...

随机推荐

mongo 多条件or
or语句 or b=2 > db.XXX.find({"$or":[{"a":1}, {"b":2}]}); 等于java mong ...
Java Mail邮件发送的简单实现
1.什么是java mail JAVA MAIL是利用现有的邮件账户发送邮件的工具,通过JAVA Mail的操控,让程序自动的使用设置的邮箱发送邮件. 这一机制被广泛的用在注册激活和垃圾邮件的发送等方 ...
EFCodeFirst 各种命令整理
1.Enable-Migrations (创建迁移目录:Migrations,如果有多个数据上下文可以用 -ContextTypeName 命令迁移对应的数据上下文 ) 2.Add-Migratio ...
JS中绑定事件顺序（事件冒泡与事件捕获区别）
在JS中,绑定的事件默认的执行时间是在冒泡阶段执行,而非在捕获阶段(重要),这也是为什么当父类和子类都绑定了某个事件,会先调用子类绑定的事件,后调用父类的事件.直接看下面实例 <!Doctype ...
UITableViewCell 分割线如何满屏
在iOS7中,UITableViewCell左侧会有默认15像素的空白.设置setSeparatorInset:UIEdgeInsetsZero 能将空白去掉. 但是在iOS8中,设置setSepar ...
Android NestedScrollView与RecyclerView嵌套,以及NestedScrollView不会滚动到屏幕顶部解决
①NestedScrollView与RecyclerView嵌套,导致滚动惯性消失解决:mRecyclerView.setNestedScrollingEnabled(false); ②Nested ...
blog test
try my first blog by cnblog. i will record my learn experence in the future.
escape，unescape与encodeURIComponent，decodeURIComponent
escape:将string转成unicode字符串 escape('
c++11之为什么C++11引入了std::ref？
C++本身有引用(&),为什么C++11又引入了std::ref? 主要是考虑函数式编程(如std::bind)在使用时,是对参数直接拷贝,而不是引用.如下例子: #include <f ...
js、Jquery处理自动计算的输入框事件
js在处理的时候可以使用oninput去获取当前输入框输入的值, jquery的时候使用了keypress和keydown但是发现都不能在输入后触发事件去获取输入框的值,这时候需要使用 ‘input ...

mobienet, shufflenet

mobienet, shufflenet的更多相关文章

随机推荐

热门专题