模块简介与matplotlib基础
模块简介与matplotlib基础
1、基本概念
1.1数据分析
对已知的数据进行分析,提取出一些有价值的信息。
1.2数据挖掘
对大量的数据进行分析与挖掘,得到一些未知的,有价值的信息。
1.3数据挖掘过程
定义目标
获取数据(爬虫采集或下载统计网站发布的数据)
数据探索
数据预处理(数据清洗【去掉脏数据】、数据集成【集中】、数据变换【规范化】、数据规约【精简】)
数据建模(分类、聚类、关联、预测)
模型评价与发布
1.4模块简介
numpy可以高效的处理数据、提供数组支持
pandas主要用于数据探索和数据分析
matplotlib作图模块,解决可视化问题
scipy主要进行数据计算,同时支持矩阵运算,提供很多高等处理功能,比如积分、傅里叶变化等
statsnodels用于统计分析
Gensim文本挖掘
sklearn、keras前者机器学习,后者深度学习
1.5模块基本操作
'''numpy'''
import numpy
#创建一维数组格式
#numpy.array([元素1,元素2,...,元素n])
x=numpy.array(["a","b","c"])
#创建二维数据格式
#numpy.array([[元素1,元素2,...,元素n],[元素1,元素2,...,元素n],[元素1,元素2,...,元素n],...,[元素1,元素2,...,元素n]])
y=numpy.array([[1,2,3],[4,5,6],[7,8,9]])
#排序sort
x.sort()
y.sort()
#取最大值和最小值
y1=y.max()
y2=y.min()
#切片
#数组[起始下标:最终下标+1]
x[1:3]#取得就是数组的1-2,相当于取得是左闭右开区间的。如果右边不写则取到最后,若左边不写,则从最开始取
'''pandas'''
import pandas #若import pandas as pda,则之后可以使用pd代替pandas
'''
Series #index索引
DataFrame
'''
a=pandas.Series([8,9,2,1])
b=pandas.Series([8,9,2,1],index=[1,2,3,4])#index里面的值可以自由指定
c=pandas.DataFrame([[5,6,2,3],[8,4,6,3],[6,4,31,2]])
d=pandas.DataFrame([[5,6,2,3],[8,4,6,3],[6,4,31,2]],columns=["one","two","three","four"])
e=pandas.DataFrame({
"one":3, #生成3个3,自动补全
"two":[6,2,3],
"three":list(str(982)) #生成9、8、2
})
d.head()#头部数据,默认前五行
#d.head(行数)
d.tail()#尾部数据,默认后五行
#d.tail(行数)
d.describe()#展示数据统计信息
d.T#对d转置
1.6数据导入
1.6.1导入csv数据
csv是一种常见的数据存储格式,可以使用pandas导入csv数据
import pandas as pd
i=pd.read_csv("文件地址")
i.sort_value(by="某列的第一个数据") #表示按照某列排序
j=pd.read_excel(文件地址导入Excel文件
1.6.2导入HTML数据
使用pandas可以直接从HTML网页中加载对应table表格中的数据
l=pd.read_html("网址或者本地网页的地址")
1.6.3导入TXT文本数据
m=pd.read_table("TXT文件地址")
2、折线图、散点图和直方图的绘制
折线图和散点图用plot,直方图用hist

下面是直方图的绘制:

模块简介与matplotlib基础的更多相关文章
- Python模块简介及安装 [numpy,pandas,matplotlib,scipy,statsmodels,Gensim,sklearn,keras]
https://pan.baidu.com/s/1bpVv3Ef 67bd 模块安装文件下载地址 pip install "numpy-1.12.0b+mkl-cp35- ...
- Qt5模块简介
原文链接:Qt5 模块简介 无意中看到这篇文章,虽然讲的不是经常用的东西,但是看了这篇文章之后,可以对qt有个大致的了解,能够清晰的知道自己想要什么,应该关注那一部分,学习了,相信以后会又很大 ...
- Qt 学习之路 2(6):Qt 模块简介
Home / Qt 学习之路 2 / Qt 学习之路 2(6):Qt 模块简介 豆子 2012年8月26日 Qt 学习之路 2 20条评论 Qt 5 与 Qt 4 最大的一个区别之一是底层架构 ...
- Python::OS 模块 -- 简介
OS 模块简介 OS模块是Python标准库中的一个用于访问操作系统功能的模块,OS模块提供了一种可移植的方法使用操作系统的功能.使用OS模块中提供的接口,可以实现跨平台访问.但是在OS模块中的接口并 ...
- 数据分析与展示——Matplotlib基础绘图函数示例
Matplotlib库入门 Matplotlib基础绘图函数示例 pyplot基础图表函数概述 函数 说明 plt.plot(x,y,fmt, ...) 绘制一个坐标图 plt.boxplot(dat ...
- Python 的 six模块简介
Python 的 six模块简介 six : Six is a Python 2 and 3 compatibility library Six没有托管在Github上,而是托管在了Bitbucket ...
- Python开发【模块】:matplotlib 绘制折线图
matplotlib 1.安装matplotlib ① linux系统安装 # 安装matplotlib模块 $ sudo apt-get install python3-matplotlib # 如 ...
- signal模块简介
signal模块简介 最近在看Linux signal 相关内容,signal可以被用来进程间通信和异步处理.Python标准库提供了signal包可以用来处理信号相关.这里讨论的是Unix系统中Py ...
- socketserver模块简介
1. socketserver模块简介 在python的socket编程中,实用socket模块的时候,是不能实现多个连接的,当然如果加入其 它的模块是可以的,例如select模块,在这里见到的介绍下 ...
随机推荐
- Arm开发板+Qt学习之路-qt线程执行完毕发送signal主动释放线程内存
header: #ifndef SENDCANMSGTHREAD_H#define SENDCANMSGTHREAD_H #include <QThread>#include " ...
- C语言程序转汇编代码
最近在学着写bootloader,由于汇编太繁杂,希望可以使用C语言完成一部分,然后转成NASM汇编代码,经过摸索,最终找到了一个解决方案,记录于此,留作参考. 核心步骤 使用gcc编译得到.o文件 ...
- GitHub当作私密的版本控制系统远端版本库私有化
目的 我打算把所有服务器的配置文件用git管理起来,这样可以记录配置变更状况. 但是有一个问题是,如何多人协作?服务器配置信息非常敏感,如果这个版本库泄漏,整个公司的服务器架构就彻底泄漏了. 这个版本 ...
- MySQL必知必会--分 组 数 据
数据分组 目前为止的所有计算都是在表的所有数据或匹配特定的 WHERE 子句的 数据上进行的.提示一下,下面的例子返回供应商 1003 提供的产品数目 但如果要返回每个供应商提供的产品数目怎么办?或者 ...
- 802.11有线等效加密WEP
有线等效加密(WEP)标准是802.11无线安全早期的解决方案,WEP并不安全. 既然WEP并不安全,为什么还要学习WEP呢? WEP简单,相比后续出现的加密协议,它不要求有多么强大的计算能力.一些老 ...
- PHP将图片base64编码传输
PHP函数源码 function imgToBase64($img_file) { $img_base64 = ''; if (file_exists($img_file)) { $app_img_f ...
- 关于PHP连接上MySQL但不能插入数据
出现这种情况,有三种可能 1.SQL语句有问题 insert into table_name(field1,field2...) values(value1,value2...); 先在MySQL中粘 ...
- Nginx 和Apache 中的虚拟主机的概念
在部署环境的时候,有时候会引用到虚拟主机的概念,什么是虚拟主机呢,博主之前一直把虚拟主机的概念没搞清楚,导致在部署的时候,一直动不动就404 ,或者500,或者服务器不通 所以,什么是虚拟主机呢? 虚 ...
- Django2.2 静态文件的上传显示,遇到的坑点-------已解决
前情提要:这里虽说是Django2.2 ,但经过测试发现Django 的其他版本也可以用此方法解决 一.项目根目录下的static文件的路由显示问题 在项目根目录下创建静态文件时发现,即使我配置了se ...
- SQL server 游标用法
declare @EmpCode varchar(50), @EmpName varchar(50), @EmpAddress varchar(200);declare curEmployee cur ...