python 中常用可视化工具库

a、Numpy常用属性及方法

为什么用它：它可以方便的使用数组，矩阵进行计算，包含线性代数。傅里叶变换、随机数生成等大量函数（处理数值型的数组）

import numpy as np

Numpy生成array的属性：

import numpy as np

x=np.array([1,2,3,4,5,6,7,8]) # 一维

x.shape  #(8,) 

X=np.array([[1,2,3,4],[5,6,7,8]]) # 二维数组

X.shape  #(2,4)

#规律：从外往里数元素个数

操作函数

import numpy as np

A=np.arange(10).reshape(2,5) # np.arrage(10)--> array([0,1,2,3,4,5,6,7,8,9])

A.shape  # (2,5)  A=[[0,1,2,3,4],[5,6,7,8,9]]

test1=A+1  # array([[1,2,3,4,5],[6,7,8,9,10]])

test2=A+3  #array([[0,3,6,9,12],[15,18,21,24,27]])

#......

B=np.arange(1,11).reshape(2,5)

test3=A+B  #test3=[[1,3,5,7,9],[11,13,15,17,19]]

test4=B-A  #test4=[[1,1,1,1,1],[1,1,1,1,1]]

索引查询

# array[:10] 取前10个数

# array[-3:] 去最后3个数

# 

import numpy as np

C=np.random.randint(1,100,10)

#C[-3:]=10#[77  1 30  3 31 10 92 10 10 10]

# 获取数组中最大的前N个数字、

#argsort() 传回排序后的索引下标

print(C[C.argsort()])#排序[ 5 11 31 39 53 53 85 88 95 99]

print(C[C.argsort()[-3:]])#取最大的3个元素[88 95 99]

Numpy中的数学统计函数

	import numpy as np

    t = np.array([1, 2, 3, 4, 5])

    t1=t.sum()#15求和

    t2 = t.mean()#3.0 平均值

    t3=t.min()#1 最小值

    t4=np.median(t)  #3.0 中位数

    t5 = t.var()  # 2.0 方差

    t6=t.std()#1.4142135623730951 标准差

Numpy的向量化操作

	t = np.array([1, 2, 3, 4, 5])

    n=t[t>3].size  #注意！没有括号  当然len(t[t>3])也能实现，但是t[t>3].size性能更好，所有时间更短

    print(n)

Numpy数组合并

	t1=np.array([1,2,3,4])

    #t2=np.array([5,6,7,8])

    t2=np.array([[5,6,7,8],

                 [9,10,11,12]])

    t3=np.vstack([t1,t2])   #[[1 2 3 4],[5 6 7 8]]

    #t4=np.hstack([t1,t2])   #[1,2,3,4,5,6,7,8]

#注意：

#1.vstack：使用是必须保持每个一维数组里的元素里的个数相同

#即：t1=np.array([1,2,3,4])

#    t2=np.array([[5,6,7,8],

#                [9,10,11,12]])

#    这种情况下使用vstack会报错

#ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 1, the array at index 0 has size 3 and the array at index 1 has size 4

#2.同理：hstack使用是必须保持每个二维数组里的一维数组个数相同

#即：t1=np.array([1,2,3,4])

#   t2=np.array([[5,6,7,8],

#                [9,10,11,12]])

#  此时np.hstack([t1,t2]) 会报错

#ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1 dimension(s) and the array at index 1 has 2 dimension(s)

案例二：

	t1=np.array([[1,2,3,4],

                 [5,6,7,8]])

    t2=np.array([[5,6,7,8],

                 [1,2,3,4]])

    t3=np.vstack([t1,t2])

    t4=np.hstack([t1,t2])

    print(t3)

    #[[1 2 3 4]

     #[5 6 7 8]

     #[5 6 7 8]

     #[1 2 3 4]]

    print(t4)

    #[[1 2 3 4 5 6 7 8]

 #	  [5 6 7 8 1 2 3 4]]

b、pandas

为什么用pandas:它能帮我们处理数值（基于numpy）和字符串及时间序列

pandas的常用方法

Series与DataFrame

	data1=[{"name":"黄勇","age":20,"sex":"男"},{"name":"小勇子","age":21,"sex":"男"}]

    data2={"name":["hy","xyz"],"age":[20,19],"sex":["男","男"]}

    r1=pd.Series(data1)

    """0 {'name': '黄勇', 'age': 20, 'sex': '男'}

      1 {'name': '小勇子', 'age': 21, 'sex': '男'}

    dtype: object

    """

    df1=pd.DataFrame(data1)

    '''

              name  age sex

        0   黄勇   20   男

        1  小勇子   21   男

    '''

    r3 = pd.Series(data2)

    '''

        name    [hy, xyz]

        age      [20, 19]

        sex        [男, 男]

        dtype: object

    '''

    df2 = pd.DataFrame(data2)

    '''

          name  age sex

        0   hy   20   男

        1  xyz   19   男

    '''

    r5=np.vstack([df1,df2])

    '''

        [['黄勇' 20 '男']

         ['小勇子' 21 '男']

         ['hy' 20 '男']

         ['xyz' 19 '男']]

    '''

    #print(df1["name"].values.reshape(-1, 1).shape)   #(2,1)  [[""],[""]]

    r6=np.hstack([df1["name"].values.reshape(-1,1),df2["age"].values.reshape(-1,1)])

    '''

        [['黄勇' 20]

         ['小勇子' 19]]

    '''

#选择多少行多少列

'''

data.csv

是否客栈,评论数,房间数,酒店总间夜

0,686,127,223

0,354,128,64

1,58,50,3

0,65,168,43

0,303,97,69

0,31,314,229'''

    data= pd.read_csv("data/data_hotel_mult.csv")

    x=data.iloc[:,:-1]#取所有行到最后一列，不包含最后一列

'''

    是否客栈   评论数  房间数

0      0   686  127

1      0   354  128

2      1    58   50

3      0    65  168

4      0   303   97

5      0    31  314

'''

c、sklearn

逻辑回归

d、matplotlib

为什么用它：它能将数据进行可视化，将数据更直观的呈现，使数据更加客观，更具说服力

使用：

# 导包

from matplotlib import pyplot as plt

绘图类型：

函数名称	描述
Bar	绘制条形图（柱状图）
Plot	在坐标轴上画线或者标记
Scatter	绘制x与y的散点图
hist	绘制直方图

画图步骤：

	#修改matplotlib默认的字体（需要显示中文就设置）

    matplotlib.rc("font",family="KaiTi",weight="bold",size="18")

    a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]

    b=  [0,0,0,0,0,0,0,0,1,1,1,1,1,1,2,2,2,1,1,1]

    plt.figure(figsize=(20,8))

    x=[i for i in range(11,31)]

    #设置图名称

    plt.title("我与同桌女朋友个数对比")

	#设置轴名称

    plt.xlabel("年龄")

    plt.ylabel("女朋友个数")

    #设置网格alpha为不透明度

    plt.grid(alpha=0.3)

    #label设置这条折线的图例名称

    plt.plot(x,b,label="自己",lineStyle="dashed")  #折线图

    plt.plot(x,a,label="同桌")

    #图例（显示图例,必须放在plot下）

    plt.legend(loc="upper left")

    # 设置x轴刻度

    _xtick_labels = [f"{i}岁" for i in x]

    plt.xticks(x,_xtick_labels)

    plt.show()

各图中属性配置

plot()函数是绘制二维图形的最基本函数。用于画图它可以绘制点和线，语法格式如下：

# 常用语法

plot(x, y,ls='--',c='r',lw='12.5')

#解释：ls=lineStyle,c=color,lw=lineWidth

#有几条线，就调用几次plot()

marker 可以定义的符号如下：

标记	符号	描述
"."		点
"None", " " or ""		没有任何标记
"*"		星号

线类型：

线类型标记	描述
'-'	实线
':'	点虚线
'--'	破折线（dashed）
'-.'	点划线

颜色类型：

颜色标记	描述
'r'	红色
'g'	绿色
'b'	蓝色
'c'	青色
'm'	品红
'y'	黄色
'k'	黑色
'w'	白色

柱状图：

#水平柱状图：

plt.bar(x,y,width=0.8,color='r')

#垂直柱状图：

plt.barh(x,y)

散点图：

color='r' #所有点同一个颜色

color=['r','b'...] #定义每一个点的颜色

plt.scatter(x,y,c=color,s=30.4)

解释：s=size

直方图：

a=[131,98,125, 131, 124, 138, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119,128,121]

    #组距

    d=4

    m=max(a)

    n=min(a)

    #画布

    plt.figure(figsize=(20,8),dpi=80)

    plt.hist(a)

    plt.grid(alpha=0.3)

    #设置刻度

    plt.xticks(range(n,m+d,d))

    plt.show()

python 中常用可视化工具库的更多相关文章

python中常用的导包的方法和常用的库
python中常用的导包的方法导入包和包名的方法:1.import package.module 2.from package.module import * 例一: ...
Python中导入第三方声源库Acoular的逻辑解释以及Acoular的下载
[声明]欢迎转载,但请保留文章原始出处→_→ 秦学苦练:http://www.cnblogs.com/Qinstudy/ 文章来源:http://www.cnblogs.com/Qinstudy/p/ ...
【转】python 历险记（四）— python 中常用的 json 操作
[转]python 历险记(四)— python 中常用的 json 操作目录引言基础知识什么是 JSON? JSON 的语法 JSON 对象有哪些特点? JSON 数组有哪些特点? 什么是编 ...
使用ctypes在Python中调用C++动态库
使用ctypes在Python中调用C++动态库入门操作使用ctypes库可以直接调用C语言编写的动态库,而如果是调用C++编写的动态库,需要使用extern关键字对动态库的函数进行声明: #in ...
java中常用的工具类（一）
我们java程序员在开发项目的是常常会用到一些工具类.今天我汇总了一下java中常用的工具方法.大家可以在项目中使用.可以收藏!加入IT江湖官方群:383126909 我们一起成长一.String工 ...
python中常用的九种数据预处理方法分享
Spyder Ctrl + 4/5: 块注释/块反注释本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(St ...
python中常用的模块二
一.序列化指:在我们存储数据的时候,需要对我们的对象进行处理,把对象处理成方便存储和传输的数据格式,这个就是序列化, 不同的序列化结果不同,但目的是一样的,都是为了存储和传输. 一,pickle.可 ...
Python中的测试工具
当我们在写程序的时候,我们需要通过测试来验证程序是否出错或者存在问题,但是,编写大量的测试来确保程序的每个细节都没问题会显得很繁琐.在Python中,我们可以借助一些标准模块来帮助我们自动完成测试 ...
shell编程系列7--shell中常用的工具find、locate、which、whereis
shell编程系列7--shell中常用的工具find.locate.which.whereis .文件查找之find命令语法格式:find [路径] [选项] [操作] 选项 -name 根据文件 ...
python中常用的九种预处理方法
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal ...

随机推荐

ajax 获取json值
请求后台获取json: {"success":true,"datamap":{"rebackName":"振勋"}} a ...
oracle 中模糊查询对like的代替insrt()函数可以做到效率节约一倍以上
昨天在处理一个字符拆分的功能时,用用到了insrt()函数,偶然发现其实特可以代替模糊查询的like,经多次测试可节约效率一倍以上. 代码如下: select distinct(a.deptname) ...
day27 CSS浮动、溢出 & js基本语法 & DOM文档流操作
接day26CSS=>CSS定位 overflow属性值描述示例 visible 默认值,内容不会被修剪,会呈现在元素框之外 hidden 内容会被修剪,并且其余内容是不可见的 overf ...
在windows下导入react项目并且打包编译后部署到nginx上
在windows下导入react项目并且打包编译后部署到nginx上一.安装npm 二.创建react项目三.安装nginx 四.总结最近接手了公司的一个django项目,这是应该前后端分离的项 ...
hook详解和应用
一.hook的作用区域 1.客户端的过程链接服务器拿回资源渲染(解析资源)资源初始化(自执行) 页面逻辑等待用户输入加密数据提交数据 2.hook的本质在这些流程任意环节中插入自己的代 ...
C#不提升自己程序的权限实现操作注册表
1. 绪论当我们编写了自己的C#程序,有程序自定义的文件类型时,通常希望它满足以下需求: 双击自定义文件打开自定义程序自定义文件有着自己的图标此时,在网上检索可以发现,大多数回答是使用Micro ...
1.5.5 HDFS读写解析-hadoop-最全最完整的保姆级的java大数据学习资料
目录 1.5.5 HDFS读写解析 1.5.5.1 HDFS读数据流程 1.5.5.2 HDFS写数据流程 1.5.5 HDFS读写解析 1.5.5.1 HDFS读数据流程客户端通过Distribu ...
Kubernetes(k8s)存储管理之数据卷volumes(二)：hostPath数据卷
目录一.系统环境二.前言三.hostPath数据卷 3.1 hostPath数据卷概览 3.2 创建有hostPath卷的pod 一.系统环境服务器版本 docker软件版本 Kubernet ...
ORM执行sql语句双下划线外键字段创建 ORM跨表查询
目录模型层之ORM执行SQL语句方式1一方式二方式三神奇的双下划线查询 ORM外键字段的创建 1.创建基础表 2.确定外键关系 3.表的查看数据的录入外键字段相关操作针对一对多 ''' ...
pycharm 小技巧
ctrl键 + B 查看定义源代码 alt键 + enter键查看帮助 ctrl键 + shift键 + -号所有代码隐藏 ctrl键 + shift键 + +号所有代码展示 ctrl键 + D ...

python 中常用可视化工具库

python 中常用可视化工具库

a、Numpy常用属性及方法

b、pandas

c、sklearn

逻辑回归

d、matplotlib

各图中属性配置

python 中常用可视化工具库的更多相关文章

随机推荐

热门专题