《Python数据分析》笔记2——统计学与线性代数
统计学与线性代数
用Numpy进行简单的描述性统计计算
import numpy as np
from scipy.stats import scoreatpercentile
data=np.loadtxt("mdrtb_2012.csv",delimiter=',',usecols=(1,),skiprows=1,uppack=True)
#加载数据 print("Max method",data.max())
print("Max function",np.max(data)) print("Min method",data.min())
print("Min function",np.min(data)) print("Mean method",data.mean())
print("Mean function",np.mean(data)) print("Std method",data.std())
print("Std function",np.mean(data)) print("Median",np.median(data))
print("Score at percentile 50",scoreatpercentile(data,50))
用Numpy进行线性代数运算
子程序包numpy.linalg提供了许多线性代数例程,我们可以用它来计算矩阵的逆、计算特征值、求解线性方程或计算行列式。对于Numpy来说,矩阵可以用ndarray的一个子类来表示。
import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
inverse=np.linalg.inv(A)
print("inverse of A\n",inverse)
注意:np.mat的构造
用Numpy解线性方程组
矩阵可以通过线性方式把一个向量变换成另一个向量,因此从数值计算的角度看,这种操作对应于一个线性方程组。Numpy.linalg中的solve()子例程可以求解类似Ax=b这种形式的线性方程组,其中A是一个矩阵,b是一维或者二维数组,而x是未知量。
import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
b=np.array([0,8,-9])
print("b\n",b)
#调用solve()函数
x=np.linalg.solve(A,b)
print("solution",x)
#利用dot()函数进行验算
print("check\n",np.dot(A,x))
用Numpy计算特征值和特征向量
特征值是方程式Ax=ax的标量解,其中A是一个二维矩阵,而x是一维向量。特征向量实际上就是表示特征值的向量。
可以用子程序包numpy.linalg的eigvals()和eig()函数来获得矩阵的特征值和特征向量,并通过dot()函数来验算结果。
import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
#利用eig()函数计算特征值
print("Eigenvalues",np.linalg.eigvals(A))
#利用eig()函数取得特征值和特征向量
eigenvalues,eigenvectors=np.linalg.eig(A)
print("First tuple of eig ", eigenvalues)
print("second tuple of eig",eigenvectors)
Numpy随机数
对于Numpy,与随机数有关的函数都在random子程序包中。
我们既可以生成连续分布的随机数,也可以生成非连续分布的随机数。分布函数有一个可选的size参数,它能通知Numpy要创建多少个数字。我们可以用整型或者元祖来给这个参数赋值,这时会得到相应形状的数组,其值由随机数填充。离散分布包括几何分布、超几何分布和二项式分布。连续分布包括正态分布和对数正态分布。
用二项分布:np.random.binomial()函数
用正态分布:np.random.normal()函数
创建掩码式Numpy数组
数据常常是凌乱的,并且含有空白项或者无法处理的字符,好在掩码式数组可以忽略残缺的或无效的数据点。numpy.ma子程序包提供的掩码式数组隶属于ndarray,带有一个掩码。
这里以lena的相片为数据源,假设某些数据已经损坏。下面用掩码处理
1.创建一个掩码
为了得到一个掩码式数组,必须规定一个掩码。
random_mask=np.random.randint(0,2,size=lena.shape)
2创建一个掩码式数组
下面应用掩码来创建一个掩码式数组
masked_array=np.ma.array(lena,mask=random_mask)
《Python数据分析》笔记2——统计学与线性代数的更多相关文章
- python数据分析笔记——数据加载与整理]
		
[ python数据分析笔记——数据加载与整理] https://mp.weixin.qq.com/s?__biz=MjM5MDM3Nzg0NA==&mid=2651588899&id ...
 - Python数据分析笔记
		
最近在看Python数据分析这本书,随手记录一下读书笔记. 工作环境 本书中推荐了edm和ipython作为数据分析的环境,我还是刚开始使用这种集成的环境,觉得交互方面,比传统的命令行方式提高了不少. ...
 - python数据分析笔记中panda(1)
		
1 例子1 from pandas import read_csv; df = read_csv('H://pythonCode//4.1//1.csv') df 截图 1.1 修改表的内容编码 df ...
 - Python数据分析笔记目录
		
速查笔记 使用实例 Pandas-数据导入 (未完成) Pandas-数据探索 基础属性 shape indexs columns values dtype/dtypes 汇总和计算描述统计 coun ...
 - python数据分析笔记中panda(3)
		
1 按照空格将一列的内容分为两列 from pandas import Series; from pandas import DataFrame; from pandas import read_cs ...
 - python数据分析笔记中panda(2)
		
1 将手机号码分开为运营商,地区和号码段 from pandas import read_csv; df = read_csv("H:\\pythonCode\\4.6\\data.csv& ...
 - 【读书笔记与思考】《python数据分析与挖掘实战》-张良均
		
[读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...
 - 《Python数据分析与挖掘实战》读书笔记
		
大致扫了一遍,具体的代码基本都没看了,毕竟我还不懂python,并且在手机端的排版,这些代码没法看. 有收获,至少了解到以下几点: 一. Python的语法挺有意思的 有一些类似于JavaSc ...
 - 《Python 数据分析》笔记——pandas
		
Pandas pandas是一个流行的开源Python项目,其名称取panel data(面板数据)与Python data analysis(Python 数据分析)之意. pandas有两个重要的 ...
 
随机推荐
- Atitit. Derby的使用总结attilax
			
Atitit. Derby的使用总结attilax 1. Derby数据库的存储结构1 2. Derby gui工具1 3. 代码读写derby2 4. 与sqlite db4o的对比4 5. 参考5 ...
 - 183.Wood Cut【hard】
			
183.Wood Cut[hard] Given n pieces of wood with length L[i] (integer array). Cut them into small piec ...
 - 手动grub引导redhat
			
grub是redhat默认的引导程序,在安装redhat时会提示是否安装bootloader,但自己手贱选择不安装,待系统重启时就是grub命令行界面,不能直接进系统.瞬时感觉麻烦大了,只能手动输入咯 ...
 - hdu 2217 Visit
			
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2217 题目解释:起始位置在原点,给你固定的时间,让你左右跑,求在规定的时间内你最多能跑多少个点: 解决 ...
 - iOS自定义转场动画实战讲解
			
iOS自定义转场动画实战讲解 转场动画这事,说简单也简单,可以通过presentViewController:animated:completion:和dismissViewControllerA ...
 - ToString(string format)输出格式简述
			
ToString说明 ToString 是 .NET Framework 中主要的格式化方法.它将对象转换为其字符串表现形式,使它适合于显示.(有关对 .NET Framework 中的格式设置支持的 ...
 - makefile变量定义应用到c语言
			
makefile是为组织程序工程的,其定义的宏怎样应用到c程序中呢? 我们知道Makefile中可定义变量或导出变量,make命令可定义变量:编译器(如gcc)可通过CFLAGS定义宏. 但如何才能使 ...
 - driver makefile
			
1.单模块单文件//*********************************************obj-m := hello.o KDIR := /home/akaedu/kernel/ ...
 - 基于JS实现回到页面顶部的五种写法(从实现到增强)
			
这篇文章主要介绍了基于JS实现回到页面顶部的五种写法(从实现到增强)的相关资料,本文介绍的非常详细,实用性也非常高,非常具有参考借鉴价值,需要的朋友可以参考下 写法 [1]锚点 使用锚点链接是一种 ...
 - es6中顶层对象属性≠全局属性
			
先思考一下下面代码的输出结果是什么 const a = { x:1, fn:()=>this.x+=1 } const x = 1 a.fn() console.log(a.x,x) 正确答案为 ...