[学习笔记] Numpy基础

上专业选修《数据分析程序设计》课程,老师串讲了Numpy基础,边听边用jupyter敲了下——理解+笔记。

老师讲的很全很系统,有些点没有记录,在PPT里就不搬了。

环境:python3.6 vscode+jupyter扩展

#%%
#------------------------------2019.9.23 NumPy-----------------------------
import numpy as np
# 1.NumPy在一个连续的内存块中存储数据
# 2.性能差异
my_arr = np.arange(100000)
my_list = list(range(10000))
print(my_arr) #%%
# 1.ndarry:一种多维数组对象
data = np.random.randn(2,3)
print(data,'\n')
print(data*10,'\n')
print(data+data,'\n')
# 1.1.ndarry通用的同构数据多为容器——所有元素必须是相同类型的
# .shape 返回表示各维度大小的元组
# .dtype 返回类型
print(data.shape)
print(data.dtype) #%%
# 1.2.创建ndarry
# 1.2.1.用array函数直接创建,dtype自动判定 data_list = [1,1.5,2]
arr1 = np.array(data_list)
print(arr1)
data2 = [[1,2,3,4],[5,6,7,8]]
arr2 = np.array(data2)
print(arr2.dtype) # 可以用属性ndim和shape验证
arr2.ndim #只返回维数
# eg:arr_empty = np.empty((2,3,4,2))
# arr_empty为4 #%%
#一般numpy创建的数组类型为浮点数
# 1.2.2特定函数创建数组,传入表示形状的元组即可。
# zeros
# ones
# empty 创建一个没有任何具体值的数组
arr_zero = np.zeros(10)
arr_one = np.ones((2,3))
arr_empty = np.empty((2,3,4,2))
print(arr_zero)
print(arr_one)
print(arr_empty)
print(arr_empty.ndim)
# arange
np.arange(15)
# 位矩阵 #%%
# 1.3类型 # 创建时指定
arr3 = np.array([1,2,3])
arr4 = np.array([1,2,3],dtype='float64')
print(arr3.dtype)
print(arr4.dtype) # 转换类型
arr3 = arr3.astype(np.float64)
print(arr3.dtype) # 浮点型转整数——舍弃小数点后
arr_float = np.random.rand(1,10)*10
print(arr_float)
arr_float = arr_float.astype(np.int32)
print(arr_float) # 某字符串数组表示的全是数字,可以直接用astype转为数值形式
arr_string = np.array(['1.0','2.0','3.0'])
print(arr_string.dtype)
arr_string = arr_string.astype(np.float64)
print(arr_string.dtype)
print(arr_string)
#adtype总会创建一个数据备份,即使现类型和目标类型相同 #%%
# 1.4运算
arr = np.array([[1.,2.,3.], [4.,5.,6.]])
print(arr)
print(arr-arr)
print(arr*arr)
print(1/arr)
print(arr**0.5) #和标量运算,数组每个元素都和此标量运算
arr_compare = np.array([ [0,4,1], [7,2,12] ])
print(arr_compare > arr) #%%
# 1.5切片、索引
# 对数字切片的修改,是直接对数组本身修改(python的list列表不是,是对副本操作)
# 对ndarray切片的副本操作:arr[5:8].cpoy()。这样不更改原数组
arr_sl = np.arange(10)
print(arr_sl)
arr_sl[3:6] = 999 #广播
print(arr_sl)
arr_slice = arr_sl[3:6]
arr_slice[:] = 888
print(arr_sl) li = list(range(10))
list_slice = li[2:8]
list_slice[0] = 666
print(list_slice)
print(li) arr2d = np.array([[1.,2.,3.], [4.,5.,6.]])
#索引
print(arr2d[0][1])
#同
print(arr2d[0,1])
#多维数组中,若省略了后面的索引,则返回对象是一个维度低一点的ndarray
arr3d = np.array([ [ [1,2,3],[4,5,6] ], [ [7,8,9],[10,11,12] ] ])
print(arr3d.shape)
print(arr3d)
print(arr3d[0,1]) # 访问索引已(0,1)开头的那些值
arr3d[0] = 999
print(arr3d) #%%
#1.6布尔
# 布尔型索引选取数组中的数据,总是创建副本,即使返回一模一样的数组也是
names = np.array(['Bob','Peter','Bob','Jenny'])
data_arr = np.random.randn(4,7)
print(data_arr)
arr_bool = names=='Bob'
print(arr_bool) #[ True False True False]
print(data_arr[arr_bool])
print('------------------------')
print(data_arr[names=='Bob',5:]) #选取Bob,并索引列 #%%
# 1.6.2 布尔取反
# way1:
names!='Bob'
# way2:
data_arr[~(names=='Bob')] #%%
# 1.6.3 布尔组合
mask = (names=='Bob')|(names=='Peter')
data_arr[mask] data_arr[data_arr>1] #%%
# 1.7花式索引
# 为了按特定顺序选中数据,那么传入表示顺序的[]即可
data = np.arange(80).reshape((8,10))
data[[3,1,4]] data[[1,5,3],[0,3,2]] #返回(1,0),(5,3),(3,2)位置的数据
data[[1,5,7,2]][:,[0,3,1,2]] #列所有元素都输出,但按0 3 1 2的顺序
# 行 列 #%%
# 1.7.1花式索引的转置
# 花式索引和切片不一样,它总是副本
# 转置不是副本,是本身
arr = np.arange(15).reshape((3,5))
arr.T
# transpose 高维数组转置 #%%
# 2.通用数组
arr = np.arange(10)
print(np.sqrt(arr))
print(arr) # 每个位置上,最大的那个
# np.maximum(x,y) # 分别返回小数部分、整数部分
remainder, whole_part = np.modf(arr)
print(remainder)
print(whole_part) # abs
# square
# exp
# log log10 log2 log1p
# ... #%%
# 3利用数组进行数据处理 # 3.1
points = np.arange(-5,5,0.01)
xs,ys = np.meshgrid(points,points) # 生成网格点坐标矩阵
ys # 3.2 np.where
arr = np.random.randn(3,4)
print(arr)
print(np.where(arr>0,2,-2)) # 3.3数学和统计方法
# 既可以当实例方法,也可以当顶级numpy函数用
print(arr.mean()) # 对特定轴向
arr.mean(axis=0) #对列求
# 或
arr.mean(0) arr.sort(1) #对行排序就地排序 np.unique(arr) #删除重复的元素 # cumsum对特定轴
arr = np.arange(9).reshape(3,3)
print(arr)
print(arr.cumsum(1))
# 同理 cumprod 累乘 # 对布尔型
arr = np.random.randn(100)
print( (arr>0).sum() )
# any() 检查数组中是否存在>=1个True
# all() 检查数组中是否全为True #%%
# 4.线性代数
# x.dot(y) 同 np.dot(x,y) # diag 返回对角线矩阵
# trace
# det
# eig
# inv
# pinv
# qr
# svd #%%
# 5.伪随机数生成
# 正态分布
samples = np.random.normal(size=(3,3))
# 标准整体分布
ss = np.random.randn(3)
# 给定上下限随机整数
sss = np.random.randint(10,size=(4)) # [4 6 4 1]

[学习笔记] Numpy基础 系统学习的更多相关文章

  1. Linux学习笔记之——基础命令学习

    1.find 按照名字查找:find / -name file_name   2.zip压缩 1) 我想把一个文件repartition.txt和一个目录invader压缩成为amateur.zip: ...

  2. Python学习笔记之基础篇(-)python介绍与安装

    Python学习笔记之基础篇(-)初识python Python的理念:崇尚优美.清晰.简单,是一个优秀并广泛使用的语言. python的历史: 1989年,为了打发圣诞节假期,作者Guido开始写P ...

  3. MyBatis:学习笔记(1)——基础知识

    MyBatis:学习笔记(1)--基础知识 引入MyBatis JDBC编程的问题及解决设想 ☐ 数据库连接使用时创建,不使用时就释放,频繁开启和关闭,造成数据库资源浪费,影响数据库性能. ☐ 使用数 ...

  4. C#学习笔记(基础知识回顾)之值类型和引用类型

    一:C#把数据类型分为值类型和引用类型 1.1:从概念上来看,其区别是值类型直接存储值,而引用类型存储对值的引用. 1.2:这两种类型在内存的不同地方,值类型存储在堆栈中,而引用类型存储在托管对上.存 ...

  5. mybatis学习笔记之基础复习(3)

    mybatis学习笔记之基础复习(3) mybatis是什么? mybatis是一个持久层框架,mybatis是一个不完全的ORM框架.sql语句需要程序员自己编写, 但是mybatis也是有映射(输 ...

  6. Quartz学习笔记:基础知识

    Quartz学习笔记:基础知识 引入Quartz 关于任务调度 关于任务调度,Java.util.Timer是最简单的一种实现任务调度的方法,简单的使用如下: import java.util.Tim ...

  7. ELK-6.5.3学习笔记–elk基础环境安装

    本文预计阅读时间 13 分钟 文章目录[隐藏] 1,准备工作. 2,安装elasticsearch. 3,安装logstash. 4,安装kibana 以往都是纸上谈兵,毕竟事情也都由部门其他小伙伴承 ...

  8. Java后端高频知识点学习笔记1---Java基础

    Java后端高频知识点学习笔记1---Java基础 参考地址:牛_客_网 https://www.nowcoder.com/discuss/819297 1.重载和重写的区别 重载:同一类中多个同名方 ...

  9. bootstrap学习笔记之基础导航条 http://www.imooc.com/code/3111

    基础导航条 在Bootstrap框中,导航条和导航从外观上差别不是太多,但在实际使用中导航条要比导航复杂得多.我们先来看导航条中最基础的一个--基础导航条. 使用方法: 在制作一个基础导航条时,主要分 ...

随机推荐

  1. oracle创建Javasource实现数据库备份

    因客户需求,需要在业务系统中,菜单中的网页中的按钮中加入一个按钮,用于点击备份数据库 (环境:只配置了数据源连接oralce ,应用服务器和数据服务器不在一台机器,且数据库机器oracle操作系统账号 ...

  2. 一次HTTP请求服务的完整过程-请求处理过程

    0.DNS域名解析:递归查询.迭代查询 递归查询:客户端向第一个服务器查询,给最终结果 迭代查询:第一个服务器向根查询 1 .建立连接:接收或拒绝连接请求:三次握手的过程 提高HTTP 连接性能: 并 ...

  3. Trie——解决字符串搜索、异或最值问题

    Trie--解决字符串搜索.异或最值问题 在说到Trie之前,我们设想如下问题: 给我们1e5个由小写字母构成的不重复的字符串,每个字符串长度不超过6,之后是1e5次查询操作,每次给我们一个字符串,要 ...

  4. Linux常用命令归类总结

    文件相关 创建文件 touch: touch README.md ">"重定向: echo 'study and share' > README.md vi & ...

  5. 用Python把20年的GDP、人口以及房价数据进行了可视化

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:CDA数据分析师 提到一线城市,大家马上会想到北上广深这四个超级大都 ...

  6. 【Floyd算法+贪心】 travel 计蒜客 - 45275

    题目: 有 n 个景点,从一个景点 i 旅行到另一个景点 j 要花费 Ai,j=Aj,i(n≤100),现在给出由 m(≤1e5) 个景点的组成序列 A,求:在所有 "有子序列 A 的序列中 ...

  7. “Python的单例模式有四种写法,你知道么?”——孔乙己

    什么是单例模式 单例模式(Singleton Pattern)是最简单的设计模式之一.这种类型的设计模式属于创建型模式,它提供了一种创建对象的最佳方式. 这种模式涉及到一个单一的类,该类负责创建自己的 ...

  8. vue的自定义指令。directive

    在vue中有很多vue自带的指令,比如v-heml.v-for.v-if,v-on.v-bind.v-else.v-show. 但是这些指令还不够我们使用的.就有了directive这个对象. 这个使 ...

  9. ReentrantLock以及AQS实现原理

    什么是可重入锁? ReentrantLock是可重入锁,什么是可重入锁呢?可重入锁就是当前持有该锁的线程能够多次获取该锁,无需等待.可重入锁是如何实现的呢?这要从ReentrantLock的一个内部类 ...

  10. 关于页面布局中,如何让一个div水平和垂直居中的五个方案

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...