scikit-learn 和pandas 基于windows单机机器学习环境的搭建
很多朋友想学习机器学习,却苦于环境的搭建,这里给出windows上scikit-learn研究开发环境的搭建步骤。
Step 1. Python的安装
python有2.x和3.x的版本之分,但是很多好的机器学习python库都不支持3.x,因此,推荐安装2.7版本的python。当前最新的python是2.7.12.链接如下:
https://www.python.org/downloads/release/python-2712/
里面可以看到有32位版和64位版的。如果你的机器是64位版的,那么32位和64位版的任选一个安装就可以了。如果机器是32位版的,就只能安装32位版的了。如果你搞不清楚你的机器的位数,那么就安装32位版的吧。也就是“Windows x86 MSI installer”。
| Windows x86-64 MSI installer | Windows | for AMD64/EM64T/x64, not Itanium processors | 8fa13925db87638aa472a3e794ca4ee3 | 19820544 | SIG |
| Windows x86 MSI installer | Windows | fe0ef5b8fd02722f32f7284324934f9d | 18907136 | SIG |
安装完毕后,可以设置下环境变量,把python目录加到PATH,比如我的Python装在 C:\Python27,那我就把C:\Python27\Scripts和C:\Python27加到环境变量。当然不加也可以。这样每次使用Python时加上python的全路径名。
安装完成后,在windows的命令行输入python,如果能出来python的基本信息说明安装成功。
Step 2. Python包管理工具pip的安装
我们需要包管理工具来方便python库的安装,包管理工具有很多,这里推荐我习惯使用的pip。
下载pip的安装脚本。链接如下。下载get-pip.py。然后到你的下载目录,在命令行输入"python get-pip.py",跑完即可安装成功。
https://pip.pypa.io/en/stable/installing/
下载完毕后,记得跑下这个命令“pip install -U pip”,一是看看pip能不能正常工作,二是把pip升级到最新版本。
Step 3. 安装 Visual C++ Compiler for Python
链接在这: https://www.microsoft.com/en-us/download/details.aspx?id=44266
这个不装后面很多科学计算的都会装不了。
Step 4. 安装numpy和scipy
这两哥们是科学计算和矩阵运算必备工具。
由于numpy和scipy直接用pip安装经常会出各种各样的问题,因此一般推荐下载离线版的whl来安装numpy和scipy。
首先安装离线版的numpy,这里我一般是在下面的链接下载numpy,当然scipy也是在这。
http://www.lfd.uci.edu/~gohlke/pythonlibs/#numpy
可以看到里面有很多版本的numpy可以下载,我们的python是2.7,windows 32位的,因此下载“numpy-1.11.2+mkl-cp27-cp27m-win32.whl”
下载完毕后进入下载目录,在命令行运行 "pip install numpy-1.11.2+mkl-cp27-cp27m-win32.whl" ,这样numpy就安装成功了。
用同样的方法安装scipy。在下面的链接下载scipy。
http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy
我们的python是2.7,windows 32位的,因此选择scipy-0.18.1-cp27-cp27m-win32.whl下载。
完了运行 "pip install scipy-0.18.1-cp27-cp27m-win32.whl"
这样numpy和scipy两个好基友就搞定了。
Step 4. 安装matplotlib,pandas和scikit-learn
这没有什么好说的,直接在命令行运行下面的命令即可。注意,先安装matplotlib再安装pandas
pip install -U matplotlib
pip install -U jinja2
pip install -U jsonschema
pip install -U pyzmq
pip install -U pandas
pip install -U scikit-learn
Step 5. 安装ipython和ipython notebook
ipython notebook是最常用的python交互式学习工具,当然,现在叫做Jupyter Notebook。scikit-learn官方的例子都给出了用ipython notebook运行的版本。
安装方式很简单:
pip install ipython
pip install jupyter
官网在这:http://ipython.org/notebook.html
安装完毕后,在命令行输入“jupyter-notebook”,输出会提示你notebook运行在http://localhost:8888
Step 6. Hello World!尝试运行一个scikit-learn机器学习程序
在scikit-learn官网下载一个机器学习的例子,比如: http://scikit-learn.org/stable/_downloads/plot_cv_predict.ipynb
然后在下载目录运行"jupyter notebook",接着浏览器打开http://localhost:8888。
可以在浏览器看到你下载目录的内容,我们打开刚下载的plot_cv_predict.ipynb这个文件链接,可以看到python程序的内容,这时我们可以点上面的三角形按钮,一步步的运行程序,如果没有报错,最后可以看到一个线性回归的预测图。
可以修改这个程序,重新一步步的跑,达到研究学习的目的。
以上就是scikit-learn和pandas环境的搭建过程。希望大家都可以搭建成功,来研究机器学习。
(欢迎转载,转载请注明出处。欢迎沟通交流: pinard.liu@ericsson.com)
scikit-learn 和pandas 基于windows单机机器学习环境的搭建的更多相关文章
- Windows下UEFI环境的搭建
Windows下UEFI环境的搭建 一.环境准备 1. 安装2012及以上VS https://visualstudio.microsoft.com/ 2.下载NASM 2.13.03 http:/ ...
- windows Android开发环境快速搭建和部署
windows安装Android的开发环境相对来说比较简单,本文写给第一次想在自己Windows上建立Android开发环境的朋友们,为了确保大家能顺利完成开发环境的搭建,文章写的尽量详细,希望对初级 ...
- 基于Windows下python环境变量配置
方法和Java环境变量配置是一样的,不懂的请移步这里 虽然这样说,还是唠唠叨叨几句吧QAQ 默认情况下,在windows下安装python之后,系统并不会自动添加相应的环境变量.此时不能在命令行直接使 ...
- 基于Windows服务器,从0开始搭建一个基于RTSP协议的直播平台
作案工具下载 EasyDarwin 服务端程序,用来接受推流和拉流 FFmpeg 可以用来推流视频数据到服务端,也可以从服务端拉流下来播放,也可以从一个服务端拉流下来,转推到另一个服务端去. Easy ...
- Windows Phone 开发环境的搭建
1. 系统 系统:Windows 7(32 位).Windows 7(64 位).Windows Vista SP2(32 位)和 Windows Vista(64 位)或者更高版本. 不支持 :Wi ...
- Windows和Linux环境下搭建SVN服务器
--------------------------Windows下搭建SVN服务器----------------------------- 一.安装SVN服务端 软件包Setup-Subversi ...
- Windows下Python环境的搭建
我刚开始接触Python没多久,当然这也是为初学者来更好的去入门Python,我电脑上既跑着Windows也跑着Red Hat的Linux,相比较而言,开发我还是更青睐于Linux系统,很多开发工具红 ...
- Windows平台kafka环境的搭建
注意:Kafka的运行依赖于Zookeeper,所以在运行Kafka之前我们需要安装并运行Zookeeper 下载安装文件: http://kafka.apache.org/downloads.htm ...
- windows下wordpress环境快速搭建
所需要软件下载网址:https://bitnami.com/ 安装使用说明网址:http://www.websoft9.com/wp-content/plugins/documente/documen ...
随机推荐
- Allegro之测量时显示两种单位(mil & mm)
首先确认你工程默认的单位是mil还是mm 例子为mils 在下面的选项中选择另外一项mm即可(如本身是mm,这里选择mils) 点击Apply,然后OK,操作测量功能,如下图所以效果:
- [转]定位占用oracle数据库cpu过高的sql
今天在吃饭的时候我的朋友的数据库出现了问题,cpu占用率为97%,当我看到这个问题的时候我就想到了或许是sql导致的此问题,由于忍不住吃饭,暂时没有帮他看这个问题,这是我饭后自己模拟的故障,进行的分析 ...
- JS图片上传预览
HTML部分: <img id="avatar" class="editable img-responsive" alt="头像" s ...
- 【JSOI2007】【Bzoj1029】建筑抢修
贪心... 按照T2来进行排序,用堆来进行维护.循环一遍,如果循环时间加上已用时间不超过截止时间,那就ANS++.否则,将它与堆顶判断,如果小于堆顶就把堆顶踢出,把它加入. #include<c ...
- PowerDesigner PDM生成sql脚本时:表的名称和表里面的字段名称都有引号解决。。。
PowerDesigner PDM生成sql脚本时:表的名称和表里面的字段名称都有引号解决... 1.当你的PowerDesigner 是新安装时,你得设置可能就会出现一些问题,在这里比如:PDM生成 ...
- CYQ.Data 快速开发之UI(赋值、取值、绑定)原理
昨夜园子猴子问了几个我CYQ.Data使用的小问题,经过简单解答后,他表示“妈妈再也不用担心我的学习",并于事后以资鼓励,希望这框架越走越好. 除了技术上的交流,双方在生活,S上面的问题上也 ...
- 浅谈WEB跨域的实现(前端向)
同源策略/SOP(Same origin policy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,浏览器很容易受到XSS.CSFR等攻击(可以参考我的这篇文章). SOP要求 ...
- 元素的click与dblclick
JavaScript与HTML之间的交互是通过事件实现的.事件,就是文档或浏览器窗口中发生的一些特定的交互瞬间,是用户或浏览器自身执行的某种动作.诸如click.load.mousemover,都是事 ...
- NoSQL初探之人人都爱Redis:(2)Redis API与常用数据类型简介
一.Redis API For .Net 首先,不得不说Redis官方提供了众多的API开发包,但是目前Redis官方版本不支持.Net直接进行连接,需要使用一些第三方的开源类库.目前最流行的就是Se ...
- 利用Hexo搭建个人博客-环境搭建篇
我是一个爱写博客进行总结分享的人.然而,有着热爱写博客并且深知写博客好处的我,却没有好好的把这个习惯坚持下来.如今毕业已经一年多了吧,每一次与师弟师妹们聊天,我总会意味深长的建议他们,一定要定期梳理总 ...