深度学习开发环境搭建教程(Mac篇)
本文将指导你如何在自己的Mac上部署Theano + Keras的深度学习开发环境。
如果你的Mac不自带NVIDIA的独立显卡(例如15寸以下或者17年新款的Macbook。具体可以在“关于本机->系统报告->图形卡/显示器”里查看),那么你可能无法在这台Mac上使用GPU训练深度学习模型。不过这并不值得遗憾。事实上,我在自己的Macbook上(15-inch,Early 2013,NVIDIA GeForce GT 650M 1024 MB)做了一个简单的测试:在mnist数据集上训练CNN模型时,GPU模式相对于CPU模式仅节省了1/3的时间。这可能要归咎于Mac上赢弱的显卡。相比之下,我更推荐购买一台有着强劲性能的显卡的PC本(比如某些游戏本)来搭建深度学习的开发环境,或者是直接租赁AWS的Instance服务。
下面步入正题。
安装GPU开发环境
几乎所有的主流深度学习框架在使用GPU进行模型训练时都依赖于两个底层环境:CUDA和cuDNN。前者是一个使用GPU进行并行计算的平台,后者是一个封装了使用GPU加速神经网络计算的library。
安装CUDA
确保你的显卡被CUDA所兼容。前往CUDA-capable GPU检查可用的显卡型号。
接下来,安装xcode(通过App Store)和命令行工具:
xcode-select --install
。这一步会自动安装clang编译器,可以在命令行里输入:/usr/bin/cc --version
进行验证。
clang编译器也是安装Theano的预备环境之一。前往官网下载并安装CUDA8.0(dmg安装包)。注意选择相应的平台。这一步会同时安装CUDA driver和CUDA toolkit。
配置环境变量。打开
~/.bash_profile
,输入四行命令:export CUDA_ROOT=/Developer/NVIDIA/CUDA-8.0
export PATH=\(CUDA_ROOT/bin\){PATH:+:\({PATH}}
export DYLD_LIBRARY_PATH=\)CUDA_ROOT/lib\({DYLD_LIBRARY_PATH:+:\){DYLD_LIBRARY_PATH}}
export LD_LIBRARY_PATH=\(CUDA_ROOT/lib:\)LD_LIBRARY_PATH
```
其中,环境变量CUDA_ROOT给Theano指定了CUDA的安装目录,也可以被设置为`/usr/local/cuda`(这两个路径下的文件均通过软链接被link到了一起)。
配置完成后,退出编辑器,`source ~/.bash_profile`并执行`nvcc -V`验证CUDA的安装是否正常。
安装cuDNN
前往官网下载cuDNN压缩包。注意选择合适的平台。我下载的是cuDNN5.1 for CUDA8.0(截止到17年4月,Theano尚不支持cuDNN6.0)。
解压缩下载的文件,将
include
目录下的*.h
文件复制到$CUDA_ROOT/include
目录下;将lib
目录下的*.so
文件复制到$CUDA_ROOT/lib
目录下。
至此,完成了GPU开发环境的基本部署。
安装Theano
Theano的安装极其简单:
首先,前往Miniconda安装Conda
使用Conda安装第三方依赖(“<>”里为可选包):
conda install numpy scipy mkl <nose> <sphinx> <pydot-ng>
使用Conda安装Theano(如果出现网络连接异常,也可以使用pip进行安装。参见官网安装指南):
conda install theano pygpu
安装Keras
Keras是一个建立在Theano和TensorFlow基础上,封装了大量底层接口,方便研究人员快速搭建模型原型的深度学习开发框架。它提供了pip和从源码直接安装两种方式。
使用pip安装:
sudo pip install keras
从源码直接安装:
git clone https://github.com/fchollet/keras.git
cd keras
sudo python setup.py install
Keras默认以TensorFlow为底层计算引擎。第一次执行import keras
命令后,会生成~/.keras/keras.json
文件。打开这个文件,将"backend": "tensorflow"
修改为"backend": "theano"
,即完成了后端计算引擎到Theano的切换。
至此,一个基本的深度学习开发环境已搭建完成。重启电脑以确保所有配置均已生效。
环境测试
我们可以运行一些demo来测试环境的安装是否正常。
从Github上下载Keras的源码,进入examples
子目录,输入命令:
THEANO_FLAGS=mode=FAST_RUN python mnist_cnn.py
该命令将以CPU模式在mnist数据集上训练CNN模型。
输入命令:
THEANO_FLAGS='mode=FAST_RUN,device=cuda,floatX=float32,optimizer_including=cudnn' python mnist_cnn.py
该命令将以GPU模式(并使用cudnn加速)在mnist数据集上训练CNN模型。
如果一切正常,你将看到类似下图的屏幕输出:
我在自己的Macbbok Pro(15寸,13年初,GT 650M的1024MB显卡)上分别测试了CPU,GPU,GPU with cuDNN三种模式下CNN模型(mnist数据集)的训练性能,其结果如下(单位:秒):
出乎意料的是,如果没有cuDNN的加速,Mac上GPU的计算性能远不如CPU!而即便使用了cuDNN的加速,模型的训练也只不过缩短了1/3的时间。因此,如果想认真地玩一玩深度学习模型,还是建议上高性能的显卡,或者直接用AWS的GPU服务吧!
深度学习开发环境搭建教程(Mac篇)的更多相关文章
- XE6移动开发环境搭建之IOS篇(7):在Mac OSX 10.8中安装XE6的PAServer(有图有真相)
XE6移动开发环境搭建之IOS篇(7):在Mac OSX 10.8中安装XE6的PAServer(有图有真相) 2014-08-22 21:06 网上能找到的关于Delphi XE系列的移动开发环境的 ...
- 人工智能之深度学习-初始环境搭建(安装Anaconda3和TensorFlow2步骤详解)
前言: 本篇文章主要讲解的是在学习人工智能之深度学习时所学到的知识和需要的环境配置(安装Anaconda3和TensorFlow2步骤详解),以及个人的心得体会,汇集成本篇文章,作为自己深度学习的总结 ...
- 虚拟机IOS开发环境搭建教程
来源:http://www.cnblogs.com/xiaoyaoju/archive/2013/05/21/3091171.html 安装条件: 硬件:一台拥有支持虚拟技术的64位双核处理器和2GB ...
- windows下vue.js开发环境搭建教程
这篇文章主要为大家详细介绍了windows下vue.js开发环境搭建教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 最近,vue.js越来越火.在这样的大浪潮下,我也开始进入vue的学习行列中 ...
- supervessel-免费云镜像︱GPU加速的Caffe深度学习开发环境
开发环境介绍 在SuperVessel云上,我们为大家免费提供当前火热的caffe深度学习开发环境.SuperVessel的Caffe有如下优点: 1) 免去了繁琐的Caffe环境的安装配置,即申请即 ...
- 从零开始在ubuntu上配置深度学习开发环境
从零开始在ubuntu上配置深度学习开发环境 昨天一不小心把原来配置好的台式机的开发环境破坏了,调了半天没有调回来,索性就重装一次ubuntu系统.这篇文章主要记录一个简单的.‘傻瓜式’教程. 一.U ...
- XE6移动开发环境搭建之IOS篇(2):安装虚拟机(有图有真相)
XE6移动开发环境搭建之IOS篇(2):安装虚拟机(有图有真相) 2014-08-15 22:04 网上能找到的关于Delphi XE系列的移动开发环境的相关文章甚少,本文尽量以详细的内容.傻瓜式的表 ...
- Web开发环境搭建 Eclipse-Java EE 篇
Web开发环境搭建 Eclipse-Java EE 篇 [原创内容,转载注名出处] 1. 下载和安装 1.1 下载JDK 在Java官方网站下载最新版本的 Java SE: http://www.o ...
- 转---详细的Android开发环境搭建教程
五步搞定Android开发环境部署——非常详细的Android开发环境搭建教程 引言 在windows安装Android的开发环境不简单也说不上算复杂,本文写给第一次想在自己Windows上建立A ...
随机推荐
- Overlay网络技术之vxvlan
了解云计算数据中心网络架构的过程中,看到这么一篇不错的关于大二层技术overlay的文章,转载分享给大家! 一. 传统网络面临的问题 随着企业业务的快速扩展需求,IT做为基础设施,快速部署和减少投入成 ...
- redis的数据类型 (一) 字符串
redis中存储方式是以键值对存储的,所以叫做字典试.redis(Remote dictionary server)远程字典服务器 每个redis数据类型,都会有增加.删除,查看的功能,用实例来学习命 ...
- mysql数据库的中文乱码问题的解决
今天终于解决了数据库中文乱码的问题,分享出来让更多的人作为参考,我们进入主题: 如果在搭建mysql数据库的时候没有设置它的编码格式,在以后的开发中,中文乱码会是一个令人头疼的问题,所以我在这里分享一 ...
- Asp.Net 常用工具类之Office-文档操作(6)
文档一直是老大难问题,君不知,代码用时方恨少!有一套成熟的文件帮助类能很大程度上减少寻找各种资料的时间. 记得以前做一个业务,需要导出协议,一份可编辑,一份不可编辑.那么Word和PDF是最好的选择, ...
- 基于Selenium2+Java的UI自动化(8)- 显式等待和隐式等待
一.隐式等待 package com.automation.waits; import java.util.concurrent.TimeUnit; import org.openqa.seleniu ...
- Android布局管理详解(1)—— LinearLayout 线性布局
Android的布局方式共有6种,分别是LinearLayout(线性布局).TableLayout(表格布局).FrameLayout(帧布局).RelativeLayout(相对布局).GridL ...
- DAX/PowerBI系列 - 参数表(Parameter Table)
DAX/PowerBI系列 - 参数表(Parameter Table) 难度: ★☆☆☆☆(1星) 适用范围: ★★★★☆(4星) 概况: 这个模式比较简单灵活,而且很实用.所用的DAX语句也比较简 ...
- springMVC中文乱码问题解决
1:表单提交controller获得中文参数后乱码解决方案 注意: jsp页面编码设置为UTF-8 form表单提交方式为必须为post,get方式下面spring编码过滤器不起效果 <%@ ...
- JDBC整合c3p0数据库连接池 解决Too many connections错误
前段时间,接手一个项目使用的是原始的jdbc作为数据库的访问,发布到服务器上在运行了一段时间之后总是会出现无法访问的情况,登录到服务器,查看tomcat日志发现总是报如下的错误. Caused by: ...
- Levenshtein distance 编辑距离
编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数.许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符 实现方案: 1. 找出最长 ...