Python模块简介及安装 [numpy,pandas,matplotlib,scipy,statsmodels,Gensim,sklearn,keras]


https://pan.baidu.com/s/1bpVv3Ef 67bd 模块安装文件下载地址
pip install "numpy-1.12.0b+mkl-cp35-cp35m-win_amd64.whl" 注意 安装带mkl的包
pip install pandas
matplotlib
statsmodels (使用这种方式并没有正确的安装成功)
首先更新了vc++ 的各种版本 ,然后参照的这篇文章 https://blog.csdn.net/EaShion1994/article/details/56671269。安装成功
最后发现,其实这种方法适用于各种安装不成功的情况
Gensim
import numpy
#创建数组
x=numpy.array(["a","b","",""])#一维数组
y=numpy.array([[3,4,8,1],[2,3,6,11],[9,3,0,6]])#二维数组
x[2]#
y[1][2]#
x.sort()#排序sort() array(['8', '9', 'a', 'b'])
y1=y.max()#取最大值 11
y2=y.min()#取最小值 0
#切片
x1=x[1:3]#array(['9','a'])
x2=x[:2]#array['8','9'])
x3=x[1:]#array(['9','a','b'])
numpy数组操作
import pandas as pda
#Series 某一串数字
a=pda.Series([8,9,2,1])
b=pda.Series([8,9,2,1],index=["one","two","three","four"]) #指定索引
#DataFrame 数据框
d=pda.DataFrame([[5,6,2,3],[8,4,5,3],[13,76,23,91]],columns=["one","two","three","four"]#指定列名
e=pda.DataFrame({ #根据字典形式创建,按列创建
"one":4,#如果下面有3个数字,那么补全为[4,4,4]
"two":[6,2,3,],
"three":list(str(982))#将一串字符串转化为3个元素
})
d.head(2) #取前几行,默认取前5行
d.tail(2) #尾部数据,默认后5行
d.describle()#统计
d.T #转置 行变成列,列变成行
pandas 基本操作
import pandas as pda
#导入csv
i=pda.read_csv("c:/路径")
i.describe()
i.sort_values(by="第一列的值")#例如第一列是1,2,3,4 。如果按4排序就是by=4 #导入excel
j=pda.read_excel("c:/路径") #导入mysql中的数据
import pymysql
conn=pymysql.connect("host=127.0.0.1",user="root",passwd="root",db="db_name")
sql="select * from db_name"
k=pda.read_sql(sql,conn); #加载html 中的 表格read_html(),首先安装html5lib,beautifulsoup4
o=pda.read_html()#可以是本地的html文件,也可以是网址,会读取其中的table标签的内容 #倒入文本的数据
pda.read_table("c:/路径")
Python 数据导入[csv,excel,mysql,html,文本]
#折线图/散点图 plot
import matplotlib.pylab as pyl
import numpy as npy
x=[1,2,3,4,8]
y=[5,7,2,1,5]
pyl.plot(x,y,"o")#plot(x轴数据,y轴数据,展现形式)
pyl.title("图表名")#图表名
pyl.ylable("y轴的名")#y轴的名
pyl.xlable("x轴的名")#x轴的名
pyl.xlim(0,20)#x轴的范围
pyl.ylim(0,15)#y轴的范围
#显示两个图表
x2=[8,4,2,11,15,22]
y2=[5,32,0,6,12,16]
pyl.plot(x2,y2)#这样就可以显示两个线了
pyl.show()
'''
第三个参数可以同时添加的
pyl.plot(x,y,"oy")
#颜色
c-cyan--青色
r-red--红色
m-magente--品红
g-green--绿色
b-blue--蓝色
y-yello--黄色
k-black--黑色
w-white--白色 #线条
pyl.plot(x,y,"--")
- 直线
-- 虚线
-. -.的形式
: 细小虚线 #点的样式
pyl.plot(x,y,"*")
s-- 方形
h-- 六角形
H-- 另一种六角形
*-- 星型
+ -- 加号
x-- x型
d-- 细薄菱形
D-- 正常菱形
p-- 五角形
'''
matplotlib基础[折线图,散点图,直方图]
#随机数的生成
import numpy as npy
npy.random.rndom_integers()#生产随机数(最小值,最大值,个数) #具有 正态分布 的随机数
#正太分布,越接近平均值的地方,数量越大
npy.random.normal(5,0,10)#参数(均数,西格玛,个数) #直方图hist
data3=npy.random.normal(10.0,1.0,1000)
pyl.hist(data3)#建立直方图
sty=npy.arange(2,17,4)#2到17的范围 每个宽度为4
pyl.hist(data3,sty,histtype='stepfilled')#(数据,样式,取消了直方图轮廓)
pyl.show()#显示直方图
随机数+直方图
#在同一个图片内绘制多个图片
pyl.subplot(2,2,3)#(拆成多少行,拆成多少列,当前区域) 2行2列第三个区域
pyl.show()
Python模块简介及安装 [numpy,pandas,matplotlib,scipy,statsmodels,Gensim,sklearn,keras]的更多相关文章
- 常用统计分析python包开源学习代码 numpy pandas matplotlib
常用统计分析python包开源学习代码 numpy pandas matplotlib 待办 https://github.com/zmzhouXJTU/Python-Data-Analysis
- Numpy, Pandas, Matplotlib, Scipy 初步
Numpy: 计算基础, 以类似于matlab的矩阵计算为基础. 底层以C实现, 速度快. Pandas: 以numpy为基础, 扩充了很多统计工具. 重点是数据统计分析. Matplotlib: ...
- win7系统下python安装numpy,matplotlib,scipy和scikit-learn
1.安装numpy,matplotlib,scipy和scikit-learn win7系统下直接采用pip或者下载源文件进行安装numpy,matplotlib,scipy时会遇到各种问题,这是因为 ...
- python 数据分析工具之 numpy pandas matplotlib
作为一个网络技术人员,机器学习是一种很有必要学习的技术,在这个数据爆炸的时代更是如此. python做数据分析,最常用以下几个库 numpy pandas matplotlib 一.Numpy库 为了 ...
- 第一章:AI人工智能 の 数据预处理编程实战 Numpy, Pandas, Matplotlib, Scikit-Learn
本课主题 数据中 Independent 变量和 Dependent 变量 Python 数据预处理的三大神器:Numpy.Pandas.Matplotlib Scikit-Learn 的机器学习实战 ...
- 安装Numpy和matplotlib
(1)测试程序 这是我从网上(http://www.open-open.com/lib/view/open1393488232380.html)找到的一个使用Numpy和matplotlib的 ...
- python 安装anaconda, numpy, pandas, matplotlib 等
如果没安装anaconda,则这样安装这些库: pip install numpy pip install pandas pip install matplotlib sudo apt-get ins ...
- numpy+pandas+ matplotlib模块(day18)
目录 numpy模块 二维数组 numpy数组的属性 T 数组的装置 dtype 数组元素的数据类型 size 数组元素的个数 ndim 数组的维数 shape数组的维度大小 astype 类型转换 ...
- linux下安装numpy,pandas,scipy,matplotlib,scikit-learn
python在数据科学方面需要用到的库: a.Numpy:科学计算库.提供矩阵运算的库. b.Pandas:数据分析处理库 c.scipy:数值计算库.提供数值积分和常微分方程组求解算法.提供了一个非 ...
随机推荐
- scala quick check
Scala 特性 面向对象特性 函数式编程 Scala也是一种函数式语言,其函数也能当成值来使用.Scala提供了轻量级的语法用以定义匿名函数,支持高阶函数,允许嵌套多层函数,并支持柯里化.Sca ...
- logminer实战之生产环境写入数据字典,dg环境查询拷贝日志,测试环境进行挖掘,输出结果
应客户需要,对某一天的日志进行挖掘,分析日均归档日志切换数量20增长至40的原因,是什么表的dml操作导致的日志量剧增,最终定位某个应用(需要客户自己进行甄别) 操作说明及介绍: 1.客户10.2.0 ...
- CodeForces - 1100F:Ivan and Burgers (线性基&贪心)(离线 在线)
题意:给定N个数,Q次询问,求区间最大异或和. 思路:一开始想的线性基+线段树.单次线性基合并的复杂度为20*20,结合线段树,复杂度为O(NlogN*20*20):显然,超时. 超时代码: #inc ...
- 20155208 2006-2007-2 《Java程序设计》第1周学习总结
20155208徐子涵 2016-2017-2 <Java程序设计>第1周学习总结 教材学习内容总结 浏览教材 每章提出自己存在的问题 chapter1:JDK和JRE的区别体现在什么地方 ...
- TP thinkphp 权限管理 权限认证 功能
(如有打扰,请忽略)阿里云ECS大羊群,2U4G低至1.4折,限实名新用户,需要的点吧https://promotion.aliyun.com/ntms/act/vm/aliyun-group/tea ...
- 安装排错 max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
https://blog.csdn.net/cookzrk/article/details/80179006 转载:https://my.oschina.net/u/2510243/blog/8105 ...
- 组合数据类型,英文词频统计 python
练习: 总结列表,元组,字典,集合的联系与区别.列表,元组,字典,集合的遍历. 区别: 一.列表:列表给大家的印象是索引,有了索引就是有序,想要存储有序的项目,用列表是再好不过的选择了.在python ...
- 【Disruptor】之Ringbuffer
一.Ringbuffer的概念 =>是一个环形数据队列的数据结构 =>嗯,正如名字所说的一样,它是一个环(首尾相接的环),你可以把它用做在不同上下文(线程)间传递数据的buffer. =& ...
- url和资源的再理解
元数据管理系统中, 确实是所有的静态资源都放在WebContent 不在dgs这个主项目中,通过url访问了 下面的这个项目在dgs中
- centos 7.0 lnmp成功安装过程(很乱)
下载nginx [root@localhost src]# wget http://nginx.org/download/nginx-1.7.9.tar.gz --2015-01-24 12:55:2 ...