常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet
常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet
一.概述
近几年来,深度学习的研究和应用的热潮持续高涨,各种开源深度学习框架层出不穷,包括TensorFlow,Keras,MXNet,PyTorch,CNTK,Theano,Caffe,DeepLearning4,Lasagne,Neon,等等。Google,Microsoft等商业巨头都加入了这场深度学习框架大战,当下最主流的框架当属TensorFlow,Keras,MXNet,PyTorch,Caffe接下来对这四种主流的深度学习框架从几个不同的方面进行简单的对比。
选择框架,建议几个点考虑:
1)框架能不能解决你的问题。比如某些框架对rnn或者lstm支持不足。
这个是必要条件。下面的都附加条件。
2)框架的资源是否足够。比如文档,社区,开源的项目支持。
3)框架是否易于上手,学习曲线如何。这个就因人而异了。
4)框架应用是否和现有系统匹配。这个也是根据你自己的具体情况了。
二. Caffe
Caffe作为入门级的深度学习框架,对于一般的深度学习任务,如图像分类/ 目标检测/ 实例分割等,存在已有的代码供大家参考,使得上手很快,需要新手修改的地方一般为配置文件,基本不需要书写代码。而且Caffe是基于C++的代码,因此训练方面很快。因此,作为新手入门这是一个很好的框架。适合新手作为入门,了解深度学习,以及深度学习任务中的各参数。
1) 优点
i). 上手快,无需编写大量代码,即可迁移到自己的数据集
ii). 能快速了解入门深度学习
iii). 基于C++的开发,训练速度快
但是Caffe的不足也很严重,主要有一下几个方面:
2) 不足
i) 首先,虽然能较快入门,但对深度学习的细节认识不深,如果要深入理解,需要阅读源码,相比其他框架,比较困难
ii) 如果要修改代码,需要对CPU版和GPU版同时修改,而且修改代码的时间相对较长,不利于快速实现新的想法
iii) 最后,最让人头疼的是GPU版本的安装问题
对于Caffe的安装,很是让人头疼,如果感兴趣,可以参考的博客: Caffe 安装 ubuntu14 + CUDA8.0 + CUDNN5.0(基于anaconda的环境)。
三. Keras
Keras是基于Theano或者TensorFlow的高级深度学习框架,使用Keras有助于快速构建神经网络。不需要去理会TensorFlow底层基于权值和偏值的构建。Keras是一个用Python编写的开源神经网络库,它能够在TensorFlow,CNTK,Theano或MXNet上运行。旨在实现深度神经网络的快速实验,它专注于用户友好,模块化和可扩展性。其主要作者和维护者是Google工程师FrançoisChollet。
1) 优点
i) 快速构建网络,实现自己的想法
ii) 不用拘泥于底层的一些细节
2) 不足
i) 对于新的领域,可能更新较慢,此时自己写一些层或者其他东西,比较困难,如权值的共享,比较困难
ii) 训练速度相对较慢
四. TensorFlow
TensorFlow是Google Brain基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理,于2015年11月9日在Apache 2.0开源许可证下发布,并于2017年12月份预发布动态图机制Eager Execution。 TensorFlow有高级的API,也有从零开始新建的权值和偏值,适合深入理解学习。
1) 优点
i) 既有高级的API,可以快速建立网络,如将Keras整合到TensorFlow中,tf.keras,也有TFLearn/
Slim等高级API供使用
ii) 又能基于底层开始构建神经网络,适合深入学习,和添加一些新的网络层或者建立新的Loss函数
iii) Google的大力支持,所以有很多学习资源
2) 不足
i) 网络基于静态图,所有资源的计算都在图中计算,调试较麻烦,不容易找bug
ii) 个人感觉TensorFlow中对于同一个功能的函数存在多个,可能会导致新手学习时,不知所措
iii) 国内IP不能访问英文版TensorFlow官网,将导致不能查看API,这个很难受
五. PyTorch
PyTorch是Facebook于2017年1月18日发布的python端的开源的深度学习库,基于Torch。支持动态计算图,提供很好的灵活性。在2018年五月份的开发者大会上,Facebook宣布实现PyTorch与Caffe2无缝结合的PyTorch1.0版本。
PyTorch,封装得很好,构建自己的网络较快,适合新手。
1) 优点
i) 能较快构建网络,新手入手较快
ii) 将代码迁移至GPU较快,功能封装高
2) 不足
封装过于高级,导致函数调用不清楚,不利于深入理解
MXNet:
MXNet是DMLC(Distributed Machine Learning Community)开发的一款开源的、轻量级、可移植的、灵活的深度学习库,它让用户可以混合使用符号编程模式和指令式编程模式来最大化效率和灵活性,目前已经是AWS官方推荐的深度学习框架。MXNet的很多作者都是中国人,其最大的贡献组织为百度。
优点:
灵活性以及使用的语言比较喜欢python,它可以使用命令式编程,它自己有很好的一些模型训练工具以及优化工具。
缺点
文档不够详细。
六.性能对标
各个框架的相关属性
基于DAQUAR数据集的视觉问答问题 。模型:卷积神经网络+LSTM,具体如下图所示:
将数据缩放至50*50,进行训练5epoches。对上述实验三中224*224数据进行实验,对比四种框架对于硬件(GPU)的利用率。结果如下表所示:
框架(TF和Keras设置为按需占用显存) |
GPU占用(MB) |
每次迭代时间(s) |
tensorflow |
8345 |
644.5518 |
Keras(tf) |
10930 |
827.2875 |
MXNet |
6526 |
470.7210 |
PyTorch |
6570 |
630.9932 |
框架 |
CPU(s) |
GPU(s) |
tensorflow |
Nan |
90.1354 |
Keras(tf) |
Nan |
108.6438 |
MXNet |
Nan |
85.3432 |
PyTorch |
Nan |
87.5231 |
七. 总结
新手可以使用Caffe快速进行训练,新手使用Keras或者PyTorch进行快速构建自己的网络,想深入了解或者修改代码的可以学习TensorFlow。当然如果对C++情有独钟,学习Caffe是个不错的选择。
常用深度学习框——Caffe/ TensorFlow / Keras/ PyTorch/MXNet的更多相关文章
- Ubuntu16.04深度学习基本环境搭建,tensorflow , keras , pytorch , cuda
Ubuntu16.04深度学习基本环境搭建,tensorflow , keras , pytorch , cuda Ubuntu16.04安装 参考https://blog.csdn.net/flyy ...
- 深度学习(六)keras常用函数学习
原文作者:aircraft 原文链接:https://www.cnblogs.com/DOMLX/p/9769301.html Keras是什么? Keras:基于Theano和TensorFlow的 ...
- 问题集录--新手入门深度学习,选择TensorFlow 好吗?
新手入门深度学习,选择 TensorFlow 有哪些益处? 佟达:首先,对于新手来说,TensorFlow的环境配置包装得真心非常好.相较之下,安装Caffe要痛苦的多,如果还要再CUDA环境下配合O ...
- 深度学习利器:TensorFlow在智能终端中的应用——智能边缘计算,云端生成模型给移动端下载,然后用该模型进行预测
前言 深度学习在图像处理.语音识别.自然语言处理领域的应用取得了巨大成功,但是它通常在功能强大的服务器端进行运算.如果智能手机通过网络远程连接服务器,也可以利用深度学习技术,但这样可能会很慢,而且只有 ...
- 深度学习利器: TensorFlow系统架构及高性能程序设计
2015年11月9日谷歌开源了人工智能平台TensorFlow,同时成为2015年最受关注的开源项目之一.经历了从v0.1到v0.12的12个版本迭代后,谷歌于2017年2月15日发布了TensorF ...
- (转) 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ
特别棒的一篇文章,仍不住转一下,留着以后需要时阅读 基于Theano的深度学习(Deep Learning)框架Keras学习随笔-01-FAQ
- 深度学习框架Caffe的编译安装
深度学习框架caffe特点,富有表达性.快速.模块化.下面介绍caffe如何在Ubuntu上编译安装. 1. 前提条件 安装依赖的软件包: CUDA 用来使用GPU模式计算. 建议使用 7.0 以上最 ...
- 深度学习框架-caffe安装-环境[Mac OSX 10.12]
深度学习框架-caffe安装 [Mac OSX 10.12] [参考资源] 1.英文原文:(使用GPU) [http://hoondy.com/2015/04/03/how-to-install-ca ...
- 深度学习框架-caffe安装-Mac OSX 10.12
p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px ".PingFang SC"; color: #454545 } p.p2 ...
随机推荐
- hdu4915 判断括号匹配
题意: 问你括号匹配是否唯一,三种字符'(','?',')',问号可以变成任何字符. 思路: 首先我们要学会判断当前串是否成立?怎么判断?我的方法是跑两遍,开三个变变量 s1 ...
- MSF和CobaltStrike联动
目录 当获取了CobaltStrike类型的session后,想派生一个MSF类型的shell
- drbd虚拟机宕机恢复方法
问题现象 云南计算节点YN-ec-compute-19因系统盘损坏宕机且操作系统无法恢复,其上本地虚拟机无法疏散且无法迁移 拟采用drbd备份的数据对compute19上的虚拟机进行恢复 恢复方法 1 ...
- 【antd Vue】封装upload图片上传组件(返回Base64)
最近需要把上传的图片信息存储到数据库,以base64的方式,需要重新封装一下antd的upload组件 1. 使用方法 引入组件然后配置一下即可使用,配置项包括 defaultImageList,需要 ...
- 修复火狐主页被篡改成hao123的办法
1:问题描述: 网上下载了某绿色小工具使用,火狐浏览器的主页被篡改为 https://www.hao123.com/?tn=96895497_hao_pg,网上找了很多主页修复工具包括火狐的解决方法以 ...
- 敏捷史话(十七):维基(Wiki)背后的灵感来源—— Ward Cunningham
在软件开发领域, Ward Cunningham 有许多独到的见解与成就. 1949年,Ward Cunningham 出生于印第安纳州的密歇根市,并在莱克县的一个小镇中长大.怀揣着对计算机浓厚的兴趣 ...
- Django(17)orm查询操作
前言 查找是数据库操作中一个非常重要的技术.查询一般就是使用filter.exclude以及get三个方法来实现.我们可以在调用这些方法的时候传递不同的参数来实现查询需求.在ORM层面,这些查询条件都 ...
- [Django框架之路由层匹配、有名 无名分组、反向解析、路由分发、名称空间、伪静态、本地虚拟环境、django版本区别]
[Django框架之路由层匹配.有名 无名分组.反向解析.路由分发.名称空间.伪静态.本地虚拟环境.django版本区别] 路由层 路由即请求地址与视图函数的映射关系,如果把网站比喻成一本书,那路由就 ...
- [bug] PowerDesigner的association按钮灰色不能使用
参考 https://blog.csdn.net/markely/article/details/44873301
- Win7通过cmd进入d盘的方法
Win7通过cmd进入d盘的方法 时间:2016-05-13 15:06:03 作者:yunchun 来源:系统之家 手机查看 评论 我们在使用Win7系统过程中,对于经常使用DOS程序的朋友们来说 ...