数据分析---numpy模块
前戏
NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。
快捷键的使用:
- 添加cell:a或者b
- 删除:x
- 修改cell的模式:
- m:修改成markdown模式
- y:修改成code模式
- 执行cell:
- shift+enter
- tab:自动补全
- 代开帮助文档:shift+tab
1. numpy模块的创建
点击查看代码
import numpy as np
arr = np.array()
arr
# 输出结果<details>
array([1, 2, 3])
2.使用numpy创建一个一维数组
点击查看代码
import numpy as np
arr = np.array([1,2,3])
arr
# 输出结果
array([1, 2, 3])
3.numpy创建一个多维数组
点击查看代码
import numpy as np
arr = np.array([[1,2,3],[4,5,6]])
arr
# 输出结果
array(
[[1, 2, 3],
[4, 5, 6]])
4.数组和列表的区别
- 数组中存储的数据元素类型必须是统一类型
- 优先级;
- 字符串 > 浮点数 > 整数
举例:将外部的一张图片加载到numpy数组中,然后尝试改变数组元素的数值查看原始图片的影响
点击查看代码
import matplotlib.pyplot as plt
img_arr = plt.imread('./1.jpg')
img_arr # 这里生成的是图片的数组
plt.imshow(img_arr) # 将图片数组i女性可视化展示
5.numpy 5个基本功能
- zeros()
- ones()
- linespace()
- arange()
- random()系列
点击查看代码
import numpy as np
arr = np.zeros(shape=(3,4)) # 创建一个3行4列的数组,并用0来填充
arr1 = np.ones(shape=(2,3)) # 创建一个2行3列的数组,并用1来填充
arr2 = np.linespace(0,100,num=20) # 创建一个0到100之间,20个数字但他们是等差数列的数组
arr3 = np.arange(10,50,step=2) # 创建一个10-50之间的,d为2的等差数列数组
arr4 = np.random.randint(0,100,size=(5,3)) # 创建一个0到100之间,5行3列的随机数字数组
6.numpy的常用属性
- shape
- ndim
- size
- dtype
点击查看代码
import numpy as np
arr = np.random.randint(0,100,size = (3,4)) # 创建一个0到100之间,3行4列的随机数字数组
arr.shape # 获取arr这个数组的几行几列(返回的是数组的形状)
arr.ndim # 返回的是数组的维度
arr.size # 返回的是数组元素的个数
arr.dtype #返回的是数组元素的类型
arr.dtype = 'uint8' #修改数组的元素类型
7.numpy的索引(重点)
点击查看代码
import numpy as np
arr = np.random.randint(1,100,size=(5,6))
arr
- array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88]])
arr[1] # 取出了numpy数组中的下标为1的行数据
- array([37, 57, 26, 92, 91, 34])
arr[[1,3,4]] # 取出多行
- arr[[1,3,4]] #取出多行
8.numpy的切片操作
- 切片操作
- 切出前两列数据
- 切出前两行数据
- 切出前两行的前两列的数据
- 数组数据翻转
- 练习:将一张图片上下左右进行翻转操作
- 练习:将图片进行指定区域的裁剪
点击查看代码
array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88]])
# 切出arr数组的前两行的数据
arr[0:2] #arr[行切片]
- array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34]])
# 切出arr数组中的前两列
arr[:,0:2] #arr[行切片,列切片]
- array([[69, 80],
[37, 57],
[13, 16],
[ 5, 16],
[54, 63]])
# 切出前两行的前两列的数据
arr[0:2,0:2]
- array([[69, 80],
[37, 57]])
array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88]])
#将数组的行倒置
arr[::-1]
- array([[54, 63, 20, 11, 94, 88],
[ 5, 16, 47, 66, 51, 12],
[13, 16, 93, 54, 87, 34],
[37, 57, 26, 92, 91, 34],
[69, 80, 7, 90, 31, 44]])
#将数组的列倒置
arr[:,::-1]
- array([[44, 31, 90, 7, 80, 69],
[34, 91, 92, 26, 57, 37],
[34, 87, 54, 93, 16, 13],
[12, 51, 66, 47, 16, 5],
[88, 94, 11, 20, 63, 54]])
#所有元素倒置
arr[::-1,::-1]
- array([[88, 94, 11, 20, 63, 54],
[12, 51, 66, 47, 16, 5],
[34, 87, 54, 93, 16, 13],
[34, 91, 92, 26, 57, 37],
[44, 31, 90, 7, 80, 69]])
# 将一张图片进行左右翻转
img_arr = plt.imread('./1.jpg')
plt.imshow(img_arr)
img_arr.shape
- (300, 450, 3)
# 左右翻转
plt.imshow(img_arr[:,::-1,:]) #img_arr[行,列,颜色]
# 图片上下翻转
plt.imshow(img_arr[::-1,:,:])
#图片裁剪的功能
plt.imshow(img_arr[66:200,78:300,:])
9.变形reshape
点击查看代码
arr **是一个5行6列的二维数组**
array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88]])
#将二维的数组变形成1维
arr_1 = arr.reshape((30,))
#将一维变形成多维
arr_1.reshape((6,5))
10.级联操作
- 将多个numpy数组进行横向或者纵向的拼接
- axis轴向的理解
- 0:列
- 1:行
- 问题:
- 级联的两个数组维度一样,但是行列个数不一样会如何?
- axis轴向的理解
点击查看代码
# 将两个数组级联,行级联
np.concatenate((arr,arr),axis=1)
- array([[69, 80, 7, 90, 31, 44, 69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34, 37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34, 13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12, 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88, 54, 63, 20, 11, 94, 88]])
# 将三张图片进行级联,列级联
arr_3 = np.concatenate((img_arr,img_arr,img_arr),axis=0)
plt.imshow(arr_3)
11.常用的聚合操作
- sum,max,min,mean
点击查看代码
array([[69, 80, 7, 90, 31, 44],
[37, 57, 26, 92, 91, 34],
[13, 16, 93, 54, 87, 34],
[ 5, 16, 47, 66, 51, 12],
[54, 63, 20, 11, 94, 88]])
# 行相加
arr.sum(axis=1)
- array([321, 337, 297, 197, 330])
# 每行的最大值
arr.max(axis=1)
- array([90, 92, 93, 66, 94])
12.常用的数学函数
- NumPy 提供了标准的三角函数:sin()、cos()、tan()
- numpy.around(a,decimals) 函数返回指定数字的四舍五入值。
- 参数说明:
- a: 数组
- decimals: 舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置
- 参数说明:
点击查看代码
np.sin(2.5)
0.5984721441039564
np.around(3.84,2)
3.84
13.常用的统计函数
- numpy.amin() 和 numpy.amax(),用于计算数组中的元素沿指定轴的最小、最大值。
- numpy.ptp():计算数组中元素最大值与最小值的差(最大值 - 最小值)。
- numpy.median() 函数用于计算数组 a 中元素的中位数(中值)
- 标准差std():标准差是一组数据平均值分散程度的一种度量。
- 公式:std = sqrt(mean((x - x.mean())**2))
- 如果数组是 [1,2,3,4],则其平均值为 2.5。 因此,差的平方是 [2.25,0.25,0.25,2.25],并且其平均值的平方根除以 4,即 sqrt(5/4) ,结果为 1.1180339887498949。
- 方差var():统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数,即 mean((x - x.mean())** 2)。换句话说,标准差是方差的平方根。
点击查看代码
arr[1].std()
26.66718749491384
arr[1].var()
711.138888888889
12.矩阵相关
- NumPy 中包含了一个矩阵库 numpy.matlib,该模块中的函数返回的是一个矩阵,而不是 ndarray 对象。一个 的矩阵是一个由行(row)列(column)元素排列成的矩形阵列。
- numpy.matlib.identity() 函数返回给定大小的单位矩阵。单位矩阵是个方阵,从左上角到右下角的对角线(称为主对角线)上的元素均为 1,除此以外全都为 0。
点击查看代码
# eye返回一个标准的单位矩阵
np.eye(6)
- array([[1., 0., 0., 0., 0., 0.],
[0., 1., 0., 0., 0., 0.],
[0., 0., 1., 0., 0., 0.],
[0., 0., 0., 1., 0., 0.],
[0., 0., 0., 0., 1., 0.],
[0., 0., 0., 0., 0., 1.]])
- 转置矩阵
- .T
arr.T
- array([[69, 37, 13, 5, 54],
[80, 57, 16, 16, 63],
[ 7, 26, 93, 47, 20],
[90, 92, 54, 66, 11],
[31, 91, 87, 51, 94],
[44, 34, 34, 12, 88]])
13.矩阵相乘
- 矩阵相乘
- numpy.dot(a, b, out=None)
- a : ndarray 数组
- b : ndarray 数组
- 第一个矩阵第一行的每个数字(2和1),各自乘以第二个矩阵第一列对应位置的数字(1和1),然后将乘积相加( 2 x 1 + 1 x 1),得到结果矩阵左上角的那个值3。也就是说,结果矩阵第m行与第n列交叉位置的那个值,等于第一个矩阵第m行与第二个矩阵第n列,对应位置的每个值的乘积之和。
- 线性代数基于矩阵的推导:
- numpy.dot(a, b, out=None)
点击查看代码
a1 = np.array([[2,1],[4,3]])
a2 = np.array([[1,2],[1,0]])
np.dot(a1,a2)
array([[3, 4],
[7, 8]])
数据分析---numpy模块的更多相关文章
- 数据分析 - numpy 模块
numpy 概述 ▨ Numerical Python. 补充了python所欠缺的数值计算能力 ▨ Numpy是其他数据分析及机器学习库的底层库 ▨ Numpy完全标准C语言实现,运行效率充分 ...
- Python数据分析-Numpy数值计算
Numpy介绍: NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: 1)ndarray,一个多维数组结构,高效且节省空间 2)无需循环对整组 ...
- 数据分析01 /numpy模块
数据分析01 /数据分析之numpy模块 目录 数据分析01 /数据分析之numpy模块 1. numpy简介 2. numpy的创建 3. numpy的方法 4. numpy的常用属性 5. num ...
- 【Python 数据分析】Numpy模块
Numpy模块可以高效的处理数据,提供数组支持.很多模块都依赖他,比如:pandas.scipy.matplotlib 安装Numpy 首先到网站:https://www.lfd.uci.edu/~g ...
- 开发技术--Numpy模块
开发|Numpy模块 Numpy模块是数据分析基础包,所以还是很重要的,耐心去体会Numpy这个工具可以做什么,我将从源码与 地产呢个实现方式说起,祝大家阅读愉快! Numpy模块提供了两个重要对象: ...
- numpy模块常用函数解析
https://blog.csdn.net/lm_is_dc/article/details/81098805 numpy模块以下命令都是在浏览器中输入. cmd命令窗口输入:jupyter note ...
- numpy模块、matplotlib模块、pandas模块
目录 1. numpy模块 2. matplotlib模块 3. pandas模块 1. numpy模块 numpy模块的作用 用来做数据分析,对numpy数组(既有行又有列)--矩阵进行科学计算 实 ...
- pandas、matplotlib、Numpy模块的简单学习
目录 一.pandas模块 二.matplotlib模块 1.条形图 2. 直方图 3.折线图 4.散点图+直线图 三.numpy 一.pandas模块 pandas是BSD许可的开源库,为Pytho ...
- Python之路-numpy模块
这里是首先需要安装好Anaconda Anaconda的安装参考Python之路-初识python及环境搭建并测试 配置好环境之后开始使用Jupyter Notebook 1.打开cmd,输入 jup ...
- numpy模块(详解)
重点 索引和切片 级联 聚合操作 统计操作 矩阵 什么是数据分析 是把隐藏在一些看似杂乱无章的数据背后的信息提炼出来,总结出所研究对象的内在规律 数据分析是用适当的方法对收集来的大量数据进行分析,帮助 ...
随机推荐
- k8s 深入篇———— 守护容器[九]
前言 守护容器,也叫做deamonset, 只做整理 正文 顾名思义,DaemonSet 的主要作用,是让你在 Kubernetes 集群里,运行一个 Daemon Pod. 所以,这个 Pod 有如 ...
- 微软自带的Hyper-V虚拟机使用、VMware16安装Win10虚拟机介绍
一.首先介绍VMware虚拟机. 安装WIN10统虚拟机推荐用VMware16. 1.镜像网址: MSD网址传送门1:https://msdn.itellyou.cn MSD新网址传送门2:https ...
- 直播回顾 | 云原生混部系统 Koordinator 架构详解(附完整PPT)
简介: 近期,来自 Koordinator 社区的两位技术专家从项目的架构和特性出发,分享了 Koordinator 是如何应对混部场景下的挑战,特别是提升混部场景下工作负载的运行的效率和稳定性,以及 ...
- Elastic与阿里云助力汽车及出行产业数字化转型
简介:目前,阿里云和Elastic在全国已经有很多的项目正在开展合作,而在移动出行领域与享道出行的合作案例,则是代表性的. 在汽车产业变革逐步深入的当下,云计算.大数据等信息技术成为了汽车企业经历数 ...
- DTCC 2020 | 阿里云梁高中:DAS之基于Workload的全局自动优化实践
简介: 第十一届中国数据库技术大会(DTCC2020),在北京隆重召开.在12.23日性能优化与SQL审计专场上,邀请了阿里巴巴数据库技术团队高级技术专家梁高中为大家介绍DAS之基于Workload的 ...
- PolarDB for PostgreSQL 内核解读 :HTAP架构介绍
简介:在 PolarDB 存储计算分离的架构基础上我们研发了基于共享存储的MPP架构步具备了 HTAP 的能力,对一套 TP的数据支持两套执行引擎:单机执行引擎用于处理高并发的 OLTP:MPP跨机分 ...
- 函数计算GB镜像秒级启动:下一代软硬件架构协同优化揭秘
简介: 优化镜像加速冷启动大致分为两种做法:降低绝对延迟和降低冷启动概率.自容器镜像上线以来我们已经通过镜像加速技术,分阶段降低了绝对延迟.本文在此基础上,介绍借助函数计算下一代IaaS底座神龙裸金属 ...
- 使用友盟+的APM服务实现对移动端APP的性能监控
简介: 对于信息系统服务,一般我们的重点监控对象都是核心的后端服务,通常会采用一些主流的APM(Application Performance Management)框架进行监控.告警.分析.那么对 ...
- [FAQ] Edge/Chrome 网络请求的编辑并重发
1. 在网络请求上面右键,复制为fetch. 2. 切换到Console控制台,粘贴并回车. fetch 是javascript中一个网络请求的函数或者工具,Chrome在我们 Copy as fet ...
- WPF 简单实现一个支持删除自身的应用
我准备写一个逗比的应用,然而我担心被小伙伴看到这个应用的文件从而知道是我写的,于是我就需要实现让应用能自删除的功能.核心实现方法就是调用 cmd 传入命令行,等待几秒之后删除文件 应用程序在运行时,是 ...