Python数据分析 numpy 笔记

B站课链接:【Python数据分析三剑客:NumPy、Pandas与Matplotlib】 https://www.bilibili.com/video/BV1Yb4y1g7SV/?p=16&share_source=copy_web&vd_source=e883bdf439c7a2e47e9145990387a56b
014,开始使用numpy
(1),numpy介绍

(2),导入numpy库,并查看numpy版本
#数据分析三剑客
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
np.__version__

(3)实例:读取猫图片的数据
#我自己电脑上的图片(猫咪1.jpg),注意路径是 / ,只有一个/
#图片:其实是数字组成的,三维数组
# RGB 红Red,绿Green,蓝Blue
# RGB 范围:0~255
# plt.imread : 读取图片的数据
cat = plt.imread('C:/Users/romantic/Pictures/Saved Pictures/猫咪1.jpg')
cat

type(cat)
# numpy.ndarray : 多维数组
# nd : n维度,多维
# array : 数组

#查看形状:三维
# (540, 960, 3)
# 高度:540行
# 宽度:960列
# 3 表示的RGB(red,green,blue)的值
cat.shape

#显示图片
plt.imshow(cat)
# (540, 960, 3)

# 图片:3维数据(彩色)
# 2维数据(黑白)
# 视频:4维数据
# (x,540, 960, 3),x表示多少张图片 #一切皆数据,一切皆矩阵(在数据中)
015,创建ndarray数组

ndarray是numpy中表示数组的重要类型
(1),使用np.array() 创建
参数为列表:[1,4,2,5,3]

I = [1,4,2,3,5,6]
n = np.array(I)
n

type(n) #类型
# numpy.ndarray

n.shape #形状,6表示一维数组里有6个元素
# I.shape # 列表没有shape

# 优先级:str>float>int
n = np.array([3.14,2,"hello"])
n

(2),使用np的routines函数创建
(2.1)ones

n = np.ones(shape=(3,4)) #3行4列
n

n = np.ones(shape=(3,4,5),dtype=np.int16) # 3个二维数组,每个二维数组是4行5列,类型为整型
# n = np.ones(shape=(3,4,5),dtype=int)
n

(2.2)zeros

n = np.zeros((5,5),dtype=np.int16) # 5行5列,类型为整型
n

(2.3)full

n = np.full(shape=(3,4),fill_value=2) # 3行4列,所有元素都为2
n

(2.4)eye

#对角线为1,其他位置为0的二维数组
#单位矩阵:主对角线都是1,其他都是0
n = np.eye(6,6,dtype=np.int8) # 6行6列,类型为整型
n

# k=2:向右偏移2个位置
n = np.eye(6,6,k=2,dtype=np.int8)
n

# k=-2:向左偏移2个位置
n = np.eye(6,6,k=-2,dtype=np.int8)
n

(2.5)linspace

#等差数列
# 1,3,5,7,9
n = np.linspace(0,100,num=51,dtype=np.int16) #0~2占了一份,其他2~100中间有50份
n

# endpoint=False
n = np.linspace(0,100,num=51,endpoint=False)# 不包含100
n

#retstep=True : 显示步长
n = np.linspace(0,100,num=51,retstep=True)
n

(2.6)arange

n = np.arange(10) # 0~9,不包含10
n

n = np.arange(2,10) # 2~9,不包含10
n

n = np.arange(2,10,2) # 2~9,不包含10,步长为2
n

(2.7)random.randint

# 随机整数,范围:[0,3]
n = np.random.randint(3)
n

# 随机整数,范围:[3,10]
n = np.random.randint(3,10)
n

# 随机整数:一维,一维数组里有6个元素
n = np.random.randint(3,10,size=6)
n

# 随机整数:二维,3行4列
n = np.random.randint(3,10,size=(3,4))
n

# 随机整数:三维,也可以理解为:3个二维数组,每个二维数组是4行5列
n = np.random.randint(3,10,size=(3,4,5))
n

(2.8)random.random

n = np.random.random(size=(3,4))
n

017,ndarray常用属性

cat.shape # 三维数组
# (540, 960, 3)
# 第一个维度:540
# 第二个维度:960
# 第三个维度:3
# 有几个数字就表示几维

cat.ndim # 维度

cat.size # 总数据量 540*960*3

cat.dtype # 元素类型
# uint8:无符号整数

018,索引操作(以下代码直接截图了)




根据索引修改数据



019,切片操作
一维与列表完全一致,多维同理




020,翻转操作


021,数组变形reshape
使用reshape函数


022,数组的级联合并
(22.1)np.concatenate()
- 参数是列表或元组
- 级联的数组维度必须相同
- 可通过axis参数改变级联的方向

(22.2)np.hstack 与 np.vstack
- 水平级联与垂直级联

023,数组的拆分/切分/分割





025,聚合函数




(25.1)np.sum 和 np.nansum (nan:not a number)
- nan:数值类型,not a number:不是一个正常的数值,表示空
- np.nan:float类型

029,数组的快速排序


030,文件IO操作
(30.1)保存数组
- save:保存ndarray到一个npy文件
- savez:将多个array保存到一个npz文件中

生成的文件

(30.2)读取数组

(30.3)csv,txt文件的读写操作

031,练习题讲解1

(31.1)创建一个长度为10的一维全为0的ndarray对象,然后让第5个元素等于1

(31.2)创建一个元素为从10到49的ndarray对象

(31.3)将第2题的所有元素位置反转

(31.4)使用np.random.random创建一个10*10的ndarray对象,并打印出最大最小元素

(31.5)创建一个10*10的ndarray对象,且矩阵边界全为1,里面全为0
第1种方法

第2种方法

(31.6)创建一个每一行都是从0到4的5*5矩阵

032,练习题讲解2
(32.1)给定一个4维矩阵,如何得到最后两维的和?

(32.2)给定数组[1,2,3,4,5],如何得到在这个数组的每个元素之间插入3个0后的新数组

(32.3)给定一个二维矩阵,如何交换其中两行的元素?

(32.4)矩阵的每一行的元素都减去该行的平均值

(32.5)打印出如下矩阵(要求使用np.zeros创建8*8的矩阵)


Python数据分析 numpy 笔记的更多相关文章
- Python数据分析-Numpy数值计算
Numpy介绍: NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: 1)ndarray,一个多维数组结构,高效且节省空间 2)无需循环对整组 ...
- python数据分析Numpy(二)
Numpy (Numerical Python) 高性能科学计算和数据分析的基础包: ndarray,多维数组(矩阵),具有矢量运算能力,快速.节省空间: 矩阵运算,无需循环,可以完成类似Matlab ...
- 《Python 数据分析》笔记——pandas
Pandas pandas是一个流行的开源Python项目,其名称取panel data(面板数据)与Python data analysis(Python 数据分析)之意. pandas有两个重要的 ...
- Python数据分析——numpy基础简介
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:基因学苑 NumPy(Numerical Python的简称)是高性 ...
- 《Python数据分析》笔记1 ——Numpy
Numpy数组 1.Numpy数组对象 Numpy中的多维数组称为ndarray,他有两个组成部分. 1.数据本身 2.描述数据的元数据 2.Numpy的数值类型 bool: 布尔型 inti:其长度 ...
- Python数据分析:Numpy学习笔记
Numpy学习笔记 ndarray多维数组 创建 import numpy as np np.array([1,2,3,4]) np.array([1,2,3,4,],[5,6,7,8]) np.ze ...
- python数据分析 Numpy基础 数组和矢量计算
NumPy(Numerical Python的简称)是Python数值计算最重要的基础包.大多数提供科学计算的包都是用NumPy的数组作为构建基础. NumPy的部分功能如下: ndarray,一个具 ...
- python数据分析入门笔记[1]
1.Numpy: Numpy是python科学计算的基础包,它提供以下功能(不限于此): (1)快速高效的多维数组对象naarray (2)用于对数组执行元素级计算以及直接对数组执行数学运算的函数 ( ...
- Python数据分析numpy库
1.简介 Numpy库是进行数据分析的基础库,panda库就是基于Numpy库的,在计算多维数组与大型数组方面使用最广,还提供多个函数操作起来效率也高 2.Numpy库的安装 linux(Ubuntu ...
- python 数据分析----numpy
NumPy是高性能科学计算和数据分析的基础包.它是pandas等其他各种工具的基础. NumPy的主要功能: ndarray,一个多维数组结构,高效且节省空间 无需循环对整组数据进行快速运算的数学函数 ...
随机推荐
- Java 常用类 于 StringBuffer 和 StringBuilder的使用 + String三者的异同
1 package com.bytezero.stringclass; 2 3 import org.junit.Test; 4 5 /** 6 * 关于 StringBuffer 和 StringB ...
- Java 线程通信的应用:经典例题:生产者/消费者问题
1 package bytezero.threadcommunication; 2 3 /** 4 * 线程通信的应用:经典例题:生产者/消费者问题 5 * 6 * 7 * 8 * @author B ...
- 基于centos7 创建一个jdk8的镜像
前言: 直接使用docker拉取jdk8镜像因有时区问题,设置后也不生效,所以干脆自己做一个 以下是Dockerfile文件 FROM centos:7 RUN ln -snf /usr/share/ ...
- idea导入spring源码运行缺失cglib和objenesis的jar包的办法【亲测有效】
idea导入spring源码运行缺失cglib和objenesis的jar包的办法[亲测有效] 亲测有效,网上说的大多废话 上图,操作如下,运行gradle
- Spring事务(四)-事务失效场景
有时候,我们明明在类或者方法上添加了@Transactional注解,却发现方法并没有按事务处理.其实,以下场景会导致事务失效. 1.事务方法所在的类没有加载到Spring IOC容器中. Sprin ...
- python queue join task_done的概念及实例解析
一 概念 Queue.task_done() 在完成一项工作之后,Queue.task_done()函数向任务已经完成的队列发送一个信号 Queue.join() 实际上意味着等到队列为空,再执行别的 ...
- K8S容器环境下资源限制与jvm内存回收
一.k8s中的java资源限制与可能的问题 与以前单机跑单服务的情况相比,在k8s.docker容器化环境下的宿主机内存.cpu相对更大,所以当运行java类程序的时候,就必然有必要对容器进行内存限制 ...
- linux命令行下使用代理
有两种方法: 1.curl -x <proxy_ip>:<proxy_port> <real_website> 举例:curl -x 12.99.109.52:80 ...
- Java加密技术(一)——BASE64与单向加密算法MD5&SHA&MAC
Javabase64macmd5sha 加密解密,曾经是我一个毕业设计的重要组件.在工作了多年以后回想当时那个加密.解密算法,实在是太单纯了. 言归正传,这里我们主要描述Java已经实 ...
- iBatis查询API
"一切皆Socket!" 话虽些许夸张,但是事实也是,现在的网络编程几乎都是用的socket. --有感于实际编程和开源项目研究. 我们深谙信息交流的价值,那网络中进程之间如何通信 ...