python数据分析工具安装集合
用python做数据分析离不开几个好的轮子(或称为科学棧/第三方包等),比如matplotlib,numpy, scipy, pandas, scikit-learn, gensim等,这些包的功能强大,丰富,包括含了绘图,机器学习,爬虫,数据分析等等。而开发工具推荐使用pycharm或者Jupyter notebook(ipython notebook)。开发起来的样子是这样的。
此方法,同时适用于windows和linux(也许mac也行,没实践过)。我的环境是ubuntu16.04,64位,python2.7.12,python3.5.1+。不过,这次的记录安装方式跟系统关系不大,linux和windows实践方式相同,只不过,windows用户打开CMD后,输入的命令不带sudo,也不需要另行安装pip(windows自带)
1.安装Jupyter notebook(或者安装pycharm直接下载安装皆可,linux和windows同样适用)
#如果是ubuntu16.04 默认已经安装了python2和python3
#需要另行安装pip,python2的pip安装
sudo apt-get python-pip
#如果安装python3的pip
sudo apt-get python3-pip
#安装开发工具Jupyter notebook
sudo pip3 install jupyter
注意,只能安装一个jupyter notebook,默认只能包含一个内核,如python3或者python2,请根据自己开发需求。
特殊需求:
需要python3和python2共存的,请看我另几篇文章。Windows下Python多版本共存
2.在线安装(windows/linux)主要的数据分析工具(轮子)
注意:Ubuntn中,默认的pip 是指python2的,pip3才是python3的,如果安装python3的轮子,请将pip替换成pip3,反之亦然。
数据分析(为了避免依赖冲突,请按顺序安装)
sudo pip3 install numpy
sudo pip3 install pandas
#安装matplotlib需要先安装libpng和freetype
sudo apt-get install libpng-dev
#如果不知到需要下载工具的全称,可以用来查找需要工具的关键词sudo apt search freetype
sudo apt-get install libfreetype6-dev
sudo pip3 install matplotlib
sudo pip3 install scipy
#文本处理工具
sudo pip3 install gensim
#机器学习
sudo pip3 install scikit-learn
安装完成某个轮子之后,应该是这样的
以此方法安装,随着知识领域的扩展和经验的增加,我们会发现更多更有趣的轮子。
查看已经安装的轮子
pip3 list
3.离线安装(windows/linux)数据分析工具(轮子)
直接在上述网址下载对应的.whl(虽然本网址http://www.lfd.uci.edu/~gohlke/pythonlibs/只有win的= =,但是方法适合任何平台,离线包可以去官网下载,如https://pypi.python.org/pypi/scipy/)
pip3 install 下载的本地路径/numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl
pip3 install 下载的本地路径/numpy-1.11.1-cp27-cp27mu-manylinux1_x86_64.whl
4.主要的大数据分析轮子介绍
博主比较懒,已经存在的介绍就不赘述了,直接上送包下载地址,且该地址对包有了大意的介绍。
送上python包地址http://www.lfd.uci.edu/~gohlke/pythonlibs/
python数据分析工具安装集合的更多相关文章
- Python数据分析--工具安装及Numpy介绍(1)
Anaconda 是一个跨平台的版本,通过命令行来管理安装包.进行大规模数据处理.预测分析和科学计算.它包括近 200 个工具包,大数据处理需要用到的常见包有 NumPy . SciPy . pand ...
- Python数据分析工具:Pandas之Series
Python数据分析工具:Pandas之Series Pandas概述Pandas是Python的一个数据分析包,该工具为解决数据分析任务而创建.Pandas纳入大量库和标准数据模型,提供高效的操作数 ...
- python数据分析工具 | pandas
pandas是python下强大的数据分析和探索工具,是的python在处理数据时非常快速.简单.它是构建在numpy之上的,包含丰富的数据处理函数,支持时间序列分析功能,支持灵活处理缺失数据. pa ...
- python数据分析工具 | matplotlib
不论是数据挖掘还是数学建模,都免不了数据可视化的问题.对于 Python 来说,matplotlib 是最著名的绘图库,它主要用于二维绘图,当然也可以进行简单的三维绘图.它不但提供了一整套和 Matl ...
- python数据分析工具——Pandas、StatsModels、Scikit-Learn
Pandas Pandas是 Python下最强大的数据分析和探索工具.它包含高级的数据结构和精巧的工具,使得在 Python中处理数据非常快速和简单. Pandas构建在 Numpy之上,它使得以 ...
- python 数据分析工具之 numpy pandas matplotlib
作为一个网络技术人员,机器学习是一种很有必要学习的技术,在这个数据爆炸的时代更是如此. python做数据分析,最常用以下几个库 numpy pandas matplotlib 一.Numpy库 为了 ...
- python数据分析工具 | numpy
Python中没有提供数组功能,虽然列表可以完成基本的数组功能,但并不是真正的数组,而且在数据量较大时,使用列表的速度回非常慢.因此,Numpy提供了真正的数组功能,以及对数据进行快速处理的函数.Nu ...
- Python数据分析工具
1.Numpy 安装:pip install numpy [root@kvm work]# cat numpy_test.py #!/usr/bin/env python #coding:utf-8 ...
- Python开发工具安装
v阅读目录 v写在前面 v基本概念 vWindows搭建python开发环境 v从Hello World开始 v博客总结 v博客前言 从大学开始玩python到现在参加工作,已经有5年了,现在的公司是 ...
随机推荐
- shell-006:检测80端口的存活情况
注意细节问题,如下图所示 #!/bin/bash # 检测80端口是否存在 while : do n=`netstat -lnpt |grep ':80 ' |wc -l` if [ $n -eq ] ...
- LeetCode8. 字符串转整数 (atoi)
8. 字符串转整数 (atoi) 描述 实现 atoi,将字符串转为整数. 在找到第一个非空字符之前,需要移除掉字符串中的空格字符.如果第一个非空字符是正号或负号,选取该符号,并将其与后面尽可能多的连 ...
- Luogu P1108 低价购买 DP
第一问求最长下降子序列,不提: 第二问:借鉴了最短路的方法??? 我们求出来了每个位置的最长下降子序列的长度,那么刻意这样这样转移 if f[i]==f[j]+1&&a[i]<a ...
- 简单易懂的VS-CODE C++环境配置(ACM向)
网上教程比较繁琐,他们似乎要把vs-code变得无所不能,而我只是想代替dev进行简单的输入输出 所以大概花了1个多小时找到了能用的方法(中途还搞了个ubuntu子系统发现没啥用) 这里随便说下 1. ...
- ZOJ - 3623 完全背包变种
题意理解有误导致方程建歪,题意是n种类型的船造成至少L伤害的最小时间,攻击过程是不必同步的 #include<iostream> #include<algorithm> #in ...
- HDU - 4763 找出特殊规律的串
在一个Text串中找出Pattern串E以满足EAEBE,A B可以是任意串 看一眼觉得woc好难,后来看一下样例AB为空也可以 找观察一下E既是前缀也是后缀,很容易联想到next 最优情况EEE,那 ...
- BZOJ - 2457 思維+貪心
//為什麼我的Chrome OS更新後變成強制繁體了?? 題目要求使用最少的雙端隊列來維護一個單調非降序列 先來看下規律 首先,val肯定是單調非降的,在相等val範圍內的id可以xjb亂放不影響 其 ...
- 深度优先搜索(DFS) — 20180926
用DFS的场景: 找出所有方案:DFS找出所有方案总数 可能是动态规划 DFS时间复杂度:答案个数*构造每个答案的时间 动态规划时间复杂度:状态个数*计算每个状态时间 二叉树时间复杂度:节点数*处理每 ...
- shell编程下
第1章 Whicle 1.1 while循环语句 在编程语言中,while循环(英语:while loop)是一种控制流程的陈述.利用一个返回结果为布林值(Boolean)的表达式作为循环条件,当这个 ...
- PIE SDK彩色空间变换
1. 算法功能简介 使用彩色空间变换工具可以将三波段红.绿.蓝图像变换到一个特定的彩色空间,并且能从所选彩色空间变换回 RGB.两次变换之间,通过对比度拉伸,可以生成一个色彩增强的彩色合成图像.此外, ...