模块简介与matplotlib基础

1、基本概念

1.1数据分析

  对已知的数据进行分析,提取出一些有价值的信息。

1.2数据挖掘

  对大量的数据进行分析与挖掘,得到一些未知的,有价值的信息。

1.3数据挖掘过程

  定义目标

  获取数据(爬虫采集或下载统计网站发布的数据)

  数据探索

  数据预处理(数据清洗【去掉脏数据】、数据集成【集中】、数据变换【规范化】、数据规约【精简】)

  数据建模(分类、聚类、关联、预测)

  模型评价与发布

1.4模块简介

  numpy可以高效的处理数据、提供数组支持

  pandas主要用于数据探索和数据分析

  matplotlib作图模块,解决可视化问题

  scipy主要进行数据计算,同时支持矩阵运算,提供很多高等处理功能,比如积分、傅里叶变化等

  statsnodels用于统计分析

  Gensim文本挖掘

  sklearn、keras前者机器学习,后者深度学习

1.5模块基本操作

  '''numpy'''

  import numpy

  #创建一维数组格式

  #numpy.array([元素1,元素2,...,元素n])

  x=numpy.array(["a","b","c"])

  #创建二维数据格式

  #numpy.array([[元素1,元素2,...,元素n],[元素1,元素2,...,元素n],[元素1,元素2,...,元素n],...,[元素1,元素2,...,元素n]])

  y=numpy.array([[1,2,3],[4,5,6],[7,8,9]])

  #排序sort

  x.sort()

  y.sort()

  #取最大值和最小值

  y1=y.max()

  y2=y.min()

  #切片

  #数组[起始下标:最终下标+1]

  x[1:3]#取得就是数组的1-2,相当于取得是左闭右开区间的。如果右边不写则取到最后,若左边不写,则从最开始取

  '''pandas'''

  import pandas   #若import pandas as pda,则之后可以使用pd代替pandas

  '''

  Series #index索引

  DataFrame

  '''

  a=pandas.Series([8,9,2,1])

  b=pandas.Series([8,9,2,1],index=[1,2,3,4])#index里面的值可以自由指定

  c=pandas.DataFrame([[5,6,2,3],[8,4,6,3],[6,4,31,2]])

  d=pandas.DataFrame([[5,6,2,3],[8,4,6,3],[6,4,31,2]],columns=["one","two","three","four"])

  e=pandas.DataFrame({

"one":3, #生成3个3,自动补全

"two":[6,2,3],

"three":list(str(982))  #生成9、8、2

  })

  d.head()#头部数据,默认前五行

  #d.head(行数)

  d.tail()#尾部数据,默认后五行

  #d.tail(行数)

  d.describe()#展示数据统计信息

  d.T#对d转置

1.6数据导入

1.6.1导入csv数据

  csv是一种常见的数据存储格式,可以使用pandas导入csv数据

  import pandas as pd

  i=pd.read_csv("文件地址")

  i.sort_value(by="某列的第一个数据") #表示按照某列排序

  j=pd.read_excel(文件地址导入Excel文件

1.6.2导入HTML数据

  使用pandas可以直接从HTML网页中加载对应table表格中的数据

  l=pd.read_html("网址或者本地网页的地址")

1.6.3导入TXT文本数据

  m=pd.read_table("TXT文件地址")

2、折线图、散点图和直方图的绘制

  折线图和散点图用plot,直方图用hist

  下面是直方图的绘制:

模块简介与matplotlib基础的更多相关文章

  1. Python模块简介及安装 [numpy,pandas,matplotlib,scipy,statsmodels,Gensim,sklearn,keras]

    https://pan.baidu.com/s/1bpVv3Ef  67bd          模块安装文件下载地址 pip install "numpy-1.12.0b+mkl-cp35- ...

  2. Qt5模块简介

        原文链接:Qt5 模块简介 无意中看到这篇文章,虽然讲的不是经常用的东西,但是看了这篇文章之后,可以对qt有个大致的了解,能够清晰的知道自己想要什么,应该关注那一部分,学习了,相信以后会又很大 ...

  3. Qt 学习之路 2(6):Qt 模块简介

    Home / Qt 学习之路 2 / Qt 学习之路 2(6):Qt 模块简介  豆子  2012年8月26日  Qt 学习之路 2  20条评论 Qt 5 与 Qt 4 最大的一个区别之一是底层架构 ...

  4. Python::OS 模块 -- 简介

    OS 模块简介 OS模块是Python标准库中的一个用于访问操作系统功能的模块,OS模块提供了一种可移植的方法使用操作系统的功能.使用OS模块中提供的接口,可以实现跨平台访问.但是在OS模块中的接口并 ...

  5. 数据分析与展示——Matplotlib基础绘图函数示例

    Matplotlib库入门 Matplotlib基础绘图函数示例 pyplot基础图表函数概述 函数 说明 plt.plot(x,y,fmt, ...) 绘制一个坐标图 plt.boxplot(dat ...

  6. Python 的 six模块简介

    Python 的 six模块简介 six : Six is a Python 2 and 3 compatibility library Six没有托管在Github上,而是托管在了Bitbucket ...

  7. Python开发【模块】:matplotlib 绘制折线图

    matplotlib 1.安装matplotlib ① linux系统安装 # 安装matplotlib模块 $ sudo apt-get install python3-matplotlib # 如 ...

  8. signal模块简介

    signal模块简介 最近在看Linux signal 相关内容,signal可以被用来进程间通信和异步处理.Python标准库提供了signal包可以用来处理信号相关.这里讨论的是Unix系统中Py ...

  9. socketserver模块简介

    1. socketserver模块简介 在python的socket编程中,实用socket模块的时候,是不能实现多个连接的,当然如果加入其 它的模块是可以的,例如select模块,在这里见到的介绍下 ...

随机推荐

  1. VS2015中使用qt开发客户端,QPluginLoader加载dll为null的解决办法

    1,问题重现: 使用vs2015开发一款qt软件,使用了QPluginLoader动态加载插件的方式,调试的时候,发现dll模块没有加载进来,debug发现QPluginLoader的instance ...

  2. jq模糊匹配(qq:2798641729)

    图灵学院--Java高级架构师-互联网企业级实战VIP课程(价值6380)(qq:1324981084) jq是一般程序员在前台开发的时候都会使用的技术,其中模糊匹配查询在动态添加标签的时候经常用到, ...

  3. ASP .NET CORE 源码地址

    ASP .NET CORE 源码地址:https://github.com/dotnet/ 下拉可以查找相应的源码信息, 例如:查找 ASP .NET CORE Microsoft.Extension ...

  4. jmeter-json提取器提取的内容含”引号

    这时如果直接赋值会报错  解决方法: 1.用vars.get("Object")提取变量的值 2.用代码提取,最后把提取到的Object或Array转为String

  5. KVM-virsh 创建虚拟网络

    创建网络 创建配置文件 vim /etc/libvirt/qemu/networks/nfsnobody.xml #创建一个名为nfsnobody的虚拟网络 <network> <n ...

  6. cmake 指定编译特定可执行文件

    最近进行编译项目,但是项目中有很多可执行文件:每次编译起来比较费时,下面一组代码可以指定特定的编译目标进行编译,而不用编译所有目标: #!/bin/bash # 通过传递第一个参数,表示要编译的目标: ...

  7. cf1280B

    题意:给出一个n*m的矩阵,矩阵中的元素要么P要么是A 每次可以选择一个的子矩形,然后将矩阵中每一行都变为第一行,或者将矩阵中每一列都变为第一列 要求用最少的次数将矩阵中所有元素都变成A 题解:分类讨 ...

  8. minio gateway 代理s3 存储

    以前有写过使用minio gataway 代理nas 的,实际上还可以代理s3 ,hdfs....,以下是一个gatway 带来nas 以及s3 集成的模式 环境准备 docker-compose文件 ...

  9. 38.Python自定义计算时间过滤器

    在写自定义的过滤器时,因为django.template.Library.filter()本身可以作为一个装饰器,所以可以使用: register = django.template.Library( ...

  10. 关于vector的描述

    对于有些编译器而言,使用vector<vector<int>> vec;并不能通过,必须采用vector<vector<int> >vec才可以通过.两 ...