统计学与线性代数

用Numpy进行简单的描述性统计计算

import numpy as np
from scipy.stats import scoreatpercentile
data=np.loadtxt("mdrtb_2012.csv",delimiter=',',usecols=(1,),skiprows=1,uppack=True)
#加载数据 print("Max method",data.max())
print("Max function",np.max(data)) print("Min method",data.min())
print("Min function",np.min(data)) print("Mean method",data.mean())
print("Mean function",np.mean(data)) print("Std method",data.std())
print("Std function",np.mean(data)) print("Median",np.median(data))
print("Score at percentile 50",scoreatpercentile(data,50))

用Numpy进行线性代数运算

子程序包numpy.linalg提供了许多线性代数例程,我们可以用它来计算矩阵的逆、计算特征值、求解线性方程或计算行列式。对于Numpy来说,矩阵可以用ndarray的一个子类来表示。

import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
inverse=np.linalg.inv(A)
print("inverse of A\n",inverse)

注意:np.mat的构造

用Numpy解线性方程组

矩阵可以通过线性方式把一个向量变换成另一个向量,因此从数值计算的角度看,这种操作对应于一个线性方程组。Numpy.linalg中的solve()子例程可以求解类似Ax=b这种形式的线性方程组,其中A是一个矩阵,b是一维或者二维数组,而x是未知量。

import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
b=np.array([0,8,-9])
print("b\n",b)
#调用solve()函数
x=np.linalg.solve(A,b)
print("solution",x)
#利用dot()函数进行验算
print("check\n",np.dot(A,x))

用Numpy计算特征值和特征向量

特征值是方程式Ax=ax的标量解,其中A是一个二维矩阵,而x是一维向量。特征向量实际上就是表示特征值的向量。

可以用子程序包numpy.linalg的eigvals()和eig()函数来获得矩阵的特征值和特征向量,并通过dot()函数来验算结果。

import numpy as np
A=np.mat("2 4 6;4 2 6;10 -4 18")
print("A\n",A)
#利用eig()函数计算特征值
print("Eigenvalues",np.linalg.eigvals(A))
#利用eig()函数取得特征值和特征向量
eigenvalues,eigenvectors=np.linalg.eig(A)
print("First tuple of eig ", eigenvalues)
print("second tuple of eig",eigenvectors)

Numpy随机数

对于Numpy,与随机数有关的函数都在random子程序包中。

我们既可以生成连续分布的随机数,也可以生成非连续分布的随机数。分布函数有一个可选的size参数,它能通知Numpy要创建多少个数字。我们可以用整型或者元祖来给这个参数赋值,这时会得到相应形状的数组,其值由随机数填充。离散分布包括几何分布、超几何分布和二项式分布。连续分布包括正态分布和对数正态分布。

用二项分布:np.random.binomial()函数

用正态分布:np.random.normal()函数

创建掩码式Numpy数组

数据常常是凌乱的,并且含有空白项或者无法处理的字符,好在掩码式数组可以忽略残缺的或无效的数据点。numpy.ma子程序包提供的掩码式数组隶属于ndarray,带有一个掩码。

这里以lena的相片为数据源,假设某些数据已经损坏。下面用掩码处理

1.创建一个掩码

为了得到一个掩码式数组,必须规定一个掩码。

random_mask=np.random.randint(0,2,size=lena.shape)

2创建一个掩码式数组

下面应用掩码来创建一个掩码式数组

masked_array=np.ma.array(lena,mask=random_mask)

《Python数据分析》笔记2——统计学与线性代数的更多相关文章

  1. python数据分析笔记——数据加载与整理]

    [ python数据分析笔记——数据加载与整理] https://mp.weixin.qq.com/s?__biz=MjM5MDM3Nzg0NA==&mid=2651588899&id ...

  2. Python数据分析笔记

    最近在看Python数据分析这本书,随手记录一下读书笔记. 工作环境 本书中推荐了edm和ipython作为数据分析的环境,我还是刚开始使用这种集成的环境,觉得交互方面,比传统的命令行方式提高了不少. ...

  3. python数据分析笔记中panda(1)

    1 例子1 from pandas import read_csv; df = read_csv('H://pythonCode//4.1//1.csv') df 截图 1.1 修改表的内容编码 df ...

  4. Python数据分析笔记目录

    速查笔记 使用实例 Pandas-数据导入 (未完成) Pandas-数据探索 基础属性 shape indexs columns values dtype/dtypes 汇总和计算描述统计 coun ...

  5. python数据分析笔记中panda(3)

    1 按照空格将一列的内容分为两列 from pandas import Series; from pandas import DataFrame; from pandas import read_cs ...

  6. python数据分析笔记中panda(2)

    1 将手机号码分开为运营商,地区和号码段 from pandas import read_csv; df = read_csv("H:\\pythonCode\\4.6\\data.csv& ...

  7. 【读书笔记与思考】《python数据分析与挖掘实战》-张良均

    [读书笔记与思考]<python数据分析与挖掘实战>-张良均 最近看一些机器学习相关书籍,主要是为了拓宽视野.在阅读这本书前最吸引我的地方是实战篇,我通读全书后给我印象最深的还是实战篇.基 ...

  8. 《Python数据分析与挖掘实战》读书笔记

    大致扫了一遍,具体的代码基本都没看了,毕竟我还不懂python,并且在手机端的排版,这些代码没法看. 有收获,至少了解到以下几点: 一. Python的语法挺有意思的     有一些类似于JavaSc ...

  9. 《Python 数据分析》笔记——pandas

    Pandas pandas是一个流行的开源Python项目,其名称取panel data(面板数据)与Python data analysis(Python 数据分析)之意. pandas有两个重要的 ...

随机推荐

  1. Atitit. Derby的使用总结attilax

    Atitit. Derby的使用总结attilax 1. Derby数据库的存储结构1 2. Derby gui工具1 3. 代码读写derby2 4. 与sqlite db4o的对比4 5. 参考5 ...

  2. 183.Wood Cut【hard】

    183.Wood Cut[hard] Given n pieces of wood with length L[i] (integer array). Cut them into small piec ...

  3. 手动grub引导redhat

    grub是redhat默认的引导程序,在安装redhat时会提示是否安装bootloader,但自己手贱选择不安装,待系统重启时就是grub命令行界面,不能直接进系统.瞬时感觉麻烦大了,只能手动输入咯 ...

  4. hdu 2217 Visit

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2217 题目解释:起始位置在原点,给你固定的时间,让你左右跑,求在规定的时间内你最多能跑多少个点: 解决 ...

  5. iOS自定义转场动画实战讲解

    iOS自定义转场动画实战讲解   转场动画这事,说简单也简单,可以通过presentViewController:animated:completion:和dismissViewControllerA ...

  6. ToString(string format)输出格式简述

    ToString说明 ToString 是 .NET Framework 中主要的格式化方法.它将对象转换为其字符串表现形式,使它适合于显示.(有关对 .NET Framework 中的格式设置支持的 ...

  7. makefile变量定义应用到c语言

    makefile是为组织程序工程的,其定义的宏怎样应用到c程序中呢? 我们知道Makefile中可定义变量或导出变量,make命令可定义变量:编译器(如gcc)可通过CFLAGS定义宏. 但如何才能使 ...

  8. driver makefile

    1.单模块单文件//*********************************************obj-m := hello.o KDIR := /home/akaedu/kernel/ ...

  9. 基于JS实现回到页面顶部的五种写法(从实现到增强)

    这篇文章主要介绍了基于JS实现回到页面顶部的五种写法(从实现到增强)的相关资料,本文介绍的非常详细,实用性也非常高,非常具有参考借鉴价值,需要的朋友可以参考下   写法 [1]锚点 使用锚点链接是一种 ...

  10. es6中顶层对象属性≠全局属性

    先思考一下下面代码的输出结果是什么 const a = { x:1, fn:()=>this.x+=1 } const x = 1 a.fn() console.log(a.x,x) 正确答案为 ...