python 中常用可视化工具库

a、Numpy常用属性及方法

为什么用它：它可以方便的使用数组，矩阵进行计算，包含线性代数。傅里叶变换、随机数生成等大量函数（处理数值型的数组）

import numpy as np

Numpy生成array的属性：

import numpy as np

x=np.array([1,2,3,4,5,6,7,8]) # 一维

x.shape  #(8,) 

X=np.array([[1,2,3,4],[5,6,7,8]]) # 二维数组

X.shape  #(2,4)

#规律：从外往里数元素个数

操作函数

import numpy as np

A=np.arange(10).reshape(2,5) # np.arrage(10)--> array([0,1,2,3,4,5,6,7,8,9])

A.shape  # (2,5)  A=[[0,1,2,3,4],[5,6,7,8,9]]

test1=A+1  # array([[1,2,3,4,5],[6,7,8,9,10]])

test2=A+3  #array([[0,3,6,9,12],[15,18,21,24,27]])

#......

B=np.arange(1,11).reshape(2,5)

test3=A+B  #test3=[[1,3,5,7,9],[11,13,15,17,19]]

test4=B-A  #test4=[[1,1,1,1,1],[1,1,1,1,1]]

索引查询

# array[:10] 取前10个数

# array[-3:] 去最后3个数

# 

import numpy as np

C=np.random.randint(1,100,10)

#C[-3:]=10#[77  1 30  3 31 10 92 10 10 10]

# 获取数组中最大的前N个数字、

#argsort() 传回排序后的索引下标

print(C[C.argsort()])#排序[ 5 11 31 39 53 53 85 88 95 99]

print(C[C.argsort()[-3:]])#取最大的3个元素[88 95 99]

Numpy中的数学统计函数

	import numpy as np

    t = np.array([1, 2, 3, 4, 5])

    t1=t.sum()#15求和

    t2 = t.mean()#3.0 平均值

    t3=t.min()#1 最小值

    t4=np.median(t)  #3.0 中位数

    t5 = t.var()  # 2.0 方差

    t6=t.std()#1.4142135623730951 标准差

Numpy的向量化操作

	t = np.array([1, 2, 3, 4, 5])

    n=t[t>3].size  #注意！没有括号  当然len(t[t>3])也能实现，但是t[t>3].size性能更好，所有时间更短

    print(n)

Numpy数组合并

	t1=np.array([1,2,3,4])

    #t2=np.array([5,6,7,8])

    t2=np.array([[5,6,7,8],

                 [9,10,11,12]])

    t3=np.vstack([t1,t2])   #[[1 2 3 4],[5 6 7 8]]

    #t4=np.hstack([t1,t2])   #[1,2,3,4,5,6,7,8]

#注意：

#1.vstack：使用是必须保持每个一维数组里的元素里的个数相同

#即：t1=np.array([1,2,3,4])

#    t2=np.array([[5,6,7,8],

#                [9,10,11,12]])

#    这种情况下使用vstack会报错

#ValueError: all the input array dimensions for the concatenation axis must match exactly, but along dimension 1, the array at index 0 has size 3 and the array at index 1 has size 4

#2.同理：hstack使用是必须保持每个二维数组里的一维数组个数相同

#即：t1=np.array([1,2,3,4])

#   t2=np.array([[5,6,7,8],

#                [9,10,11,12]])

#  此时np.hstack([t1,t2]) 会报错

#ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 1 dimension(s) and the array at index 1 has 2 dimension(s)

案例二：

	t1=np.array([[1,2,3,4],

                 [5,6,7,8]])

    t2=np.array([[5,6,7,8],

                 [1,2,3,4]])

    t3=np.vstack([t1,t2])

    t4=np.hstack([t1,t2])

    print(t3)

    #[[1 2 3 4]

     #[5 6 7 8]

     #[5 6 7 8]

     #[1 2 3 4]]

    print(t4)

    #[[1 2 3 4 5 6 7 8]

 #	  [5 6 7 8 1 2 3 4]]

b、pandas

为什么用pandas:它能帮我们处理数值（基于numpy）和字符串及时间序列

pandas的常用方法

Series与DataFrame

	data1=[{"name":"黄勇","age":20,"sex":"男"},{"name":"小勇子","age":21,"sex":"男"}]

    data2={"name":["hy","xyz"],"age":[20,19],"sex":["男","男"]}

    r1=pd.Series(data1)

    """0 {'name': '黄勇', 'age': 20, 'sex': '男'}

      1 {'name': '小勇子', 'age': 21, 'sex': '男'}

    dtype: object

    """

    df1=pd.DataFrame(data1)

    '''

              name  age sex

        0   黄勇   20   男

        1  小勇子   21   男

    '''

    r3 = pd.Series(data2)

    '''

        name    [hy, xyz]

        age      [20, 19]

        sex        [男, 男]

        dtype: object

    '''

    df2 = pd.DataFrame(data2)

    '''

          name  age sex

        0   hy   20   男

        1  xyz   19   男

    '''

    r5=np.vstack([df1,df2])

    '''

        [['黄勇' 20 '男']

         ['小勇子' 21 '男']

         ['hy' 20 '男']

         ['xyz' 19 '男']]

    '''

    #print(df1["name"].values.reshape(-1, 1).shape)   #(2,1)  [[""],[""]]

    r6=np.hstack([df1["name"].values.reshape(-1,1),df2["age"].values.reshape(-1,1)])

    '''

        [['黄勇' 20]

         ['小勇子' 19]]

    '''

#选择多少行多少列

'''

data.csv

是否客栈,评论数,房间数,酒店总间夜

0,686,127,223

0,354,128,64

1,58,50,3

0,65,168,43

0,303,97,69

0,31,314,229'''

    data= pd.read_csv("data/data_hotel_mult.csv")

    x=data.iloc[:,:-1]#取所有行到最后一列，不包含最后一列

'''

    是否客栈   评论数  房间数

0      0   686  127

1      0   354  128

2      1    58   50

3      0    65  168

4      0   303   97

5      0    31  314

'''

c、sklearn

逻辑回归

d、matplotlib

为什么用它：它能将数据进行可视化，将数据更直观的呈现，使数据更加客观，更具说服力

使用：

# 导包

from matplotlib import pyplot as plt

绘图类型：

函数名称	描述
Bar	绘制条形图（柱状图）
Plot	在坐标轴上画线或者标记
Scatter	绘制x与y的散点图
hist	绘制直方图

画图步骤：

	#修改matplotlib默认的字体（需要显示中文就设置）

    matplotlib.rc("font",family="KaiTi",weight="bold",size="18")

    a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]

    b=  [0,0,0,0,0,0,0,0,1,1,1,1,1,1,2,2,2,1,1,1]

    plt.figure(figsize=(20,8))

    x=[i for i in range(11,31)]

    #设置图名称

    plt.title("我与同桌女朋友个数对比")

	#设置轴名称

    plt.xlabel("年龄")

    plt.ylabel("女朋友个数")

    #设置网格alpha为不透明度

    plt.grid(alpha=0.3)

    #label设置这条折线的图例名称

    plt.plot(x,b,label="自己",lineStyle="dashed")  #折线图

    plt.plot(x,a,label="同桌")

    #图例（显示图例,必须放在plot下）

    plt.legend(loc="upper left")

    # 设置x轴刻度

    _xtick_labels = [f"{i}岁" for i in x]

    plt.xticks(x,_xtick_labels)

    plt.show()

各图中属性配置

plot()函数是绘制二维图形的最基本函数。用于画图它可以绘制点和线，语法格式如下：

# 常用语法

plot(x, y,ls='--',c='r',lw='12.5')

#解释：ls=lineStyle,c=color,lw=lineWidth

#有几条线，就调用几次plot()

marker 可以定义的符号如下：

标记	符号	描述
"."		点
"None", " " or ""		没有任何标记
"*"		星号

线类型：

线类型标记	描述
'-'	实线
':'	点虚线
'--'	破折线（dashed）
'-.'	点划线

颜色类型：

颜色标记	描述
'r'	红色
'g'	绿色
'b'	蓝色
'c'	青色
'm'	品红
'y'	黄色
'k'	黑色
'w'	白色

柱状图：

#水平柱状图：

plt.bar(x,y,width=0.8,color='r')

#垂直柱状图：

plt.barh(x,y)

散点图：

color='r' #所有点同一个颜色

color=['r','b'...] #定义每一个点的颜色

plt.scatter(x,y,c=color,s=30.4)

解释：s=size

直方图：

a=[131,98,125, 131, 124, 138, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119,128,121]

    #组距

    d=4

    m=max(a)

    n=min(a)

    #画布

    plt.figure(figsize=(20,8),dpi=80)

    plt.hist(a)

    plt.grid(alpha=0.3)

    #设置刻度

    plt.xticks(range(n,m+d,d))

    plt.show()

python 中常用可视化工具库的更多相关文章

python中常用的导包的方法和常用的库
python中常用的导包的方法导入包和包名的方法:1.import package.module 2.from package.module import * 例一: ...
Python中导入第三方声源库Acoular的逻辑解释以及Acoular的下载
[声明]欢迎转载,但请保留文章原始出处→_→ 秦学苦练:http://www.cnblogs.com/Qinstudy/ 文章来源:http://www.cnblogs.com/Qinstudy/p/ ...
【转】python 历险记（四）— python 中常用的 json 操作
[转]python 历险记(四)— python 中常用的 json 操作目录引言基础知识什么是 JSON? JSON 的语法 JSON 对象有哪些特点? JSON 数组有哪些特点? 什么是编 ...
使用ctypes在Python中调用C++动态库
使用ctypes在Python中调用C++动态库入门操作使用ctypes库可以直接调用C语言编写的动态库,而如果是调用C++编写的动态库,需要使用extern关键字对动态库的函数进行声明: #in ...
java中常用的工具类（一）
我们java程序员在开发项目的是常常会用到一些工具类.今天我汇总了一下java中常用的工具方法.大家可以在项目中使用.可以收藏!加入IT江湖官方群:383126909 我们一起成长一.String工 ...
python中常用的九种数据预处理方法分享
Spyder Ctrl + 4/5: 块注释/块反注释本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(St ...
python中常用的模块二
一.序列化指:在我们存储数据的时候,需要对我们的对象进行处理,把对象处理成方便存储和传输的数据格式,这个就是序列化, 不同的序列化结果不同,但目的是一样的,都是为了存储和传输. 一,pickle.可 ...
Python中的测试工具
当我们在写程序的时候,我们需要通过测试来验证程序是否出错或者存在问题,但是,编写大量的测试来确保程序的每个细节都没问题会显得很繁琐.在Python中,我们可以借助一些标准模块来帮助我们自动完成测试 ...
shell编程系列7--shell中常用的工具find、locate、which、whereis
shell编程系列7--shell中常用的工具find.locate.which.whereis .文件查找之find命令语法格式:find [路径] [选项] [操作] 选项 -name 根据文件 ...
python中常用的九种预处理方法
本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍; 1. 标准化(Standardization or Mean Removal ...

随机推荐

Android网络请求(3) 网络请求框架OkHttp
Android网络请求(3) 网络请求框架OkHttp 本节我们来讲解OkHtpp网络请求框架什么是网络请求框架在我的理解中,网络请求框架是为了方便我们更加便捷规范的进行网络请求所建的类,我们通过 ...
c++题目：切香肠
c++题目:切香肠题目题目描述有 n 条香肠,每条香肠的长度相等.我们打算将这些香肠切开后全部分给 k 名客人,且要求每名客人获得一样多的香肠.请问最少需要切几刀?注意一刀只能切断一条香肠,每个 ...
ST表优化区间gcd
ST表的使用需要所求区间答案具有可重复性(询问时需要用到两个区间重叠来覆盖询问区间) 此题要求gcd为x的区间个数可以用ST表处理出所有区间的\(gcd\) \(O(nlogn)\) 将区间的左端点 ...
记一次 .NET 某工控软件内存泄露分析
一:背景 1.讲故事上个月 .NET调试训练营里的一位老朋友给我发了一个 8G 的dump文件,说他的程序内存泄露了,一时也没找出来是哪里的问题,让我帮忙看下到底是怎么回事,毕竟有了一些调试功底也 ...
MIT6.828学习笔记3(Lab3)
Lab 3: User Environments 在这个lab中我们需要创建一个用户环境(UNIX中的进程,它们的接口和实现不同),加载一个程序并运行,并使内核能够处理一些常用的中断请求. Part ...
[百度营]AI studio用法提醒(自用)
持久化安装需要设置持久化路径: !mkdir /home/aistudio/external-libraries !pip install beautifulsoup4 -t /home/aistu ...
kestrel网络编程--开发redis服务器
1 文章目的本文讲解基于kestrel开发实现了部分redis命令的redis伪服务器的过程,让读者了解kestrel网络编程的完整步骤,其中redis通讯协议需要读者自行查阅,文章里不做具体解析. ...
JavaScript：对象：对象和属性的内存结构是什么样的？
在说变量的时候,大致画了变量的内存结构,现在来看一下对象的内存结构是什么样的,有助于我们理解传参的各种情况,只是大致的画一下内存模型,不代表实际内存情况. 我们可以用一段代码,来判断一下,是不是这样的 ...
[python] 基于diagrams库绘制系统架构图
Python的Diagrams库允许通过简单的Python代码绘制云系统架构,实现对新的系统架构进行原型设计.Diagrams的官方仓库地址见:diagrams.Diagrams的官方文档和使用示例见 ...
网络安全之frp内网穿透
前言内网穿透,也即 NAT 穿透,进行 NAT 穿透是为了使具有某一个特定源 IP 地址和源端口号的数据包不被 NAT 设备屏蔽而正确路由到内网主机环境需求一台公网服务器(linux操作系统) ...

python 中常用可视化工具库

python 中常用可视化工具库

a、Numpy常用属性及方法

b、pandas

c、sklearn

逻辑回归

d、matplotlib

各图中属性配置

python 中常用可视化工具库的更多相关文章

随机推荐

热门专题