数学期望

E(X) = ∑pixi,X为所有xi的集合,pi为xi对应的概率。

通常来说,xi都是离散的,除非像高斯分布,假设xi不是离散的,才用上式。

当xi是离散的,那么:

E(X) = 1 / n * ∑ xi,因为xi的概率都为 1 / n,这时数学期望相当于均值

(那么高斯分布,E(X) = ∫ p(x)*x dx,∫其实就是sum中的s,只不过每次x的变化是dx,无限小。所以对于∫的看法,近似看作∑操作)

方差

D(X) = E{ [ X - E (X) ]2}    (注:“{}”、“[]”只是代表括号的一个层次,不代表一种新的运算)

为了方便,令E(X) = μ

D(X) = E[ (X -μ )2]

等价于

D(X) =  ∑ pi * ( xi - μ )²

当X为离散集合时,等价于

D(X) =  1/ n ∑ ( xi - μ )²

使用矩阵运算,代替∑操作,等价于

D(x) = 1 / n * [ x- μ , x- μ ... x- μ ][ x- μ , x- μ ... x- μ ] T

(那么高斯分布,自然是 D(X) = ∫ f(x) * [ x - E(X) ]2 dx)

通常,令 σx= D(x), σx又叫中误差

数学意义:

1、仅仅考虑离散的时候,当 ( xi - μ )² ,相当于xi 偏离均值μ的距离平方

2、1/ n ∑ ( xi - μ )² ,相当于 【偏离均值的距离平方】的均值。本质依然是【偏离均值μ的距离平方】。(平均身高,依然还叫身高的意思)

3、对以上开根号,即:sqrt ( D(X) )或 σx,那么,相当于【偏离均值μ的距离】

4、可以想象,其中xj..xk 波动特别大,甚至符号相反, σx也会特别大(即使E(X)=0), 所以, σx 一般用来形容数据的稳定程度 )

5、在高斯分布中,x 落在 [ μ - σ , μ + σ] 的概率大概是0.68

协方差

参考:马同学 (matongxue.com)

假如有:

  X Y
样本1 152 45
样本2 160 54
样本3 172 44
样本4 175 64
样本5 180 80

如何表示这种数据?

表示一:

表示二:

协方差定义:

Cov(x,y) = Var(X) = σxy = E{ [ X - E(X) ] [ Y - E(Y) ] }   ((x,y)代表X和Y的集合,X代表样本点)

当XY均为离散点时:

σxy = 1 / n  ∑ ( xi - μx ) ( yi - μy ),(单位:x的单位*y的单位)

其中

( xi - μx ) ( yi - μy ) 正正是面积,分正负,那么σxy 视为加权面积和

相关系数

ρ = σxy / (σx σy) ,没有单位 ,   -1 ≤ ρ ≤ 1

协方差矩阵

协方差矩阵,其实和协方差不是同样的东西,它包含了方差、协方差的数据,正确来说,应该称为【方差-协方差矩阵】

xx的意思是,两个不同的集合

计算办法:

n为样本数量

XX 2*n = [ X,Y ]T = [ [x1,x2,...xn] , [y1,y2,...yn] ]T

X -  E(X)  = [ X - E(X) , Y - E(Y)] ,2 * n

Dxx  = E { [ X -  E(X) ][ X -  E(X) ]T }

降维 

SVD分解:SVD分解 - 耀礼士多德 - 博客园 (cnblogs.com)

奇异值分解,可视为:

Am*n = Um*nΣn*nVT n*m = σ1u1v1T + σ2u2v2T + σ3u3v3T +....

σ1 > σ2 > σ3

当σ1 >> σ2 时, Am*n ≈  σ1u1v1T

其中,u1 为 m*1向量,vT为 1 * n 向量 ,因此,对数据实现了降维,或者主成分提取

引用:(11 封私信 / 11 条消息) 如何通俗易懂地讲解什么是 PCA 主成分分析? - 知乎 (zhihu.com)

PCA

y = x,那么其实只要保留y就可以了

进行中心化,即 X = X - E(X)

达到了降维,注意,降维了之后,就不是“面积”、“房价”了。

( 直觉有一个向量是(1,1)或者(1,0),不知道这个向量是什么含义)

非理想降维

总有一组e1,e,正交单位向量,使得:

对于每个样本数据 ai = [ xi , yi ][ e, e]T = xie1 + yie2

注意:

1、a是一个向量,维度和样本点的维度是一样的。

2、无论e1,e2 是哪两个,只要附合正交单位向量,那么【a的长度】是固定的

3、【a的长度】,应该就是【降维】后的主元1,它的值恒等于一个值 di2 = xi2 + yi2

那么,降维的理想情况,要x尽量的大,即分配给e1尽量多,那么,在计算ai 时, yie2、 zie3 等等项,可以去掉。

最终要的成果是e1,以及降维后的一维数组[d1,d2,d3...]。

(如果多维,那么要e1,e2,以及两个数组D、E等)

设想:

(一)一个很扁的橄榄球,降维后只要一个平面,这个平面依然很像橄榄球。

(二)一堆二维点集,近似一条直线,降维后,只保留了D和e1,原来的数据量为 2 *n,现在只要 n + 2,d * e1依然看着是一条直线,只是部分偏离直线的样本失真了。

[X,Y]n*2 = [di] n*1e1, e1为 2*1的列向量

这里先考虑二维:

那么,有如下目标:  ∑ xi2 最大(等价于∑di2最大),i由1~n,表示有n个样本而且这里的xi,是以e1、e2为基的坐标。

(假设样本,在e1,e2基下的坐标,为(xi,yi))

e1 = [e11,e12]

xi2,其实就是各个样本中心化向量a、b、c、d,投影在e1 上的长度平方

假设有样本:

a = [a1,b1]T

b = [a2,b2]T

c = [a3,b3]T

(按照上边的原理,各个样本向量,应该是中心化后的)

∑ xi2 = (aTe1) 2 + (bTe1) +  (cTe1) 2

(aTe就是点积操作,点积的几何意义,ab = |a||b|cosθ,当|b|等于1时,就是a投影在b上的长度)

等价于

∑ xi2 = (a1e11 + b1e12)2 +(a2e11 + b2e12)2 + (a3e11 + b3e12)2

=( a12e112 + 2a1b1e11e12 + b12e122 ) + ( a22e11+ 2a2b2e11e12 + b22e12) + ( a32e11+ 2a3b3e11e12 + b32e12)

= ( a12 +  a22 + a32)e112 + 2 (a1b1 + a2b+a3b)e11e12 + (b12+b22+b32+)e122

等价于:

(ai = xi - μ , 相当于上面介绍的,就是X、Y的方差-协方差矩阵,只是没有乘以1/n,对于向量而然,各个分量乘以一个常数是不影响的)

那么,令中间的矩阵为P,因为P为【对称矩阵】,那么就可以对角化成:

P = UΣUT

U为正交矩阵

∑为对角矩阵,对角元素为 σ1, σ2 , 且 σ1 > σ2

三个都为2*2矩阵

代入P ,得到:

∑ xi =   e1TUΣUTe1 =(UTe1)T Σ (UTe1)

 N = [n1,n2]T = UTe1  = [u1,u2] [e11,e12]T 

(单位正交向量,被单位正交向量的分量线性组合,也是单位向量,也即是 |n| = 1)

∑ xi =  NΣ N =  σ1 n+ σ2 n2

综合上述,需要满足如下条件,求得e1 : (求得e1后,样本向量点积,就能求得各个xi,实现降维)

(目标是求 n1,n2,又从P = UΣUT得到向量u1、u2,就可以求得e11,e12了)

(1)∑ xi =  NΣ N =  σ1 n12 + σ2 n22最大

(2)σ> σ2

(3)|n| =1,也就是 n12 + n22 = 1

使用【拉格朗日乘数法】求【条件极值】:条件极值杀手——拉格朗日乘数法 - 知乎 (zhihu.com)

F =  σ1 n12 + σ2 n22

条件:

φ =  n12 + n22 - 1 = 0

解方程组:

F/dx +  λ φ/dx = 0

F/dy +  λ φ/dy = 0 

φ = 0 

解出x,y,λ,λ又叫【拉格朗日乘数】

当n1 =1 ,n2 =0 时 , 满足条件(怎么解以后再算)

那么:

n = [1,0]T  = UTe1  = [u1,u2] [e11,e12]T

Un =UUTe

因为U是正交单位阵,所以UU= I

因此:

e1 =  U[1,0]T

也就是e1, 取U的第一列,也就是奇异值最大的列。

(同理,如果令∑ xi2 最小,可以得到e2 

求得:

e1 =(-0.78,-0.62)T

e=(-0.62,0.78)T

然后,用点积操作   x1 = aTe1 = [a1,b1] e , y1= aTe2  = [a1,b1] e , 点积,求出在以(e1, e2)基下的坐标。

例如:

x = 5.4*(-0.78) + 4.4*(-0.62) = -6.94

x1*e1 = (-6.94*-0.78 , -6.94*-0.62)= (5.4132,4.3)≈ a

还原:

a = x1 e1 + y1 e2

a = (a1e11+b1e12)e1 + (a1e21 + b1e22) e2

现在可以忽略掉y1 e2 ,因为y1 是微小值,起不到什么作用,最终实现了降维,保留了新的X集合,以及最大奇异值对应的特征向量。

在几何上,e1 向量为直线方向,e2向量为垂直于直线方向。

测绘线性代数(四):数学期望、协方差、PCA的更多相关文章

  1. Lecture5_1&5_2.随机变量的数字特征(数学期望、方差、协方差)

    一.数学期望 1.离散型随机变量的数学期望 设X为离散随机变量,其概率分布为:P(X=xk)=pk 若无穷级数$\sum_{k=1}^{+\infty}x_kp_k$绝对收敛 (即满足$\sum_{k ...

  2. 【整理】简单的数学期望和概率DP

    数学期望 P=Σ每一种状态*对应的概率. 因为不可能枚举完所有的状态,有时也不可能枚举完,比如抛硬币,有可能一直是正面,etc.在没有接触数学期望时看到数学期望的题可能会觉得很阔怕(因为我高中就是这么 ...

  3. 动态规划之经典数学期望和概率DP

    起因:在一场训练赛上.有这么一题没做出来. 题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6829 题目大意:有三个人,他们分别有\(X,Y,Z\)块钱 ...

  4. [BZOJ 3143][HNOI2013]游走(数学期望)

    题目:http://www.lydsy.com:808/JudgeOnline/problem.php?id=3143 分析: 易得如果知道了每条边经过的数学期望,那就可以贪心着按每条边的期望的大小赋 ...

  5. Codeforces Round #259 (Div. 2) C - Little Pony and Expected Maximum (数学期望)

    题目链接 题意 : 一个m面的骰子,掷n次,问得到最大值的期望. 思路 : 数学期望,离散时的公式是E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) p(xi)的是 ...

  6. 数学期望和概率DP题目泛做(为了对应AD的课件)

    题1: Uva 1636 Headshot 题目大意: 给出一个000111序列,注意实际上是环状的.问是0出现的概率大,还是当前是0,下一个还是0的概率大. 问题比较简单,注意比较大小: A/C & ...

  7. [2013山东ACM]省赛 The number of steps (可能DP,数学期望)

    The number of steps nid=24#time" style="padding-bottom:0px; margin:0px; padding-left:0px; ...

  8. 【BZOJ2134】单位错选(数学期望,动态规划)

    [BZOJ2134]单位错选(数学期望,动态规划) 题面 BZOJ 题解 单独考虑相邻的两道题目的概率就好了 没了呀.. #include<iostream> #include<cs ...

  9. 【BZOJ1415】【NOI2005】聪聪和可可(动态规划,数学期望)

    [BZOJ1415][NOI2005]聪聪和可可(动态规划,数学期望) 题面 BZOJ 题解 先预处理出当可可在某个点,聪聪在某个点时 聪聪会往哪里走 然后记忆化搜索一下就好了 #include< ...

  10. 【Luogu1291】百事世界杯之旅(动态规划,数学期望)

    [Luogu1291]百事世界杯之旅(动态规划,数学期望) 题面 洛谷 题解 设\(f[i]\)表示已经集齐了\(i\)个名字的期望 现在有两种方法: 先说我自己的: \[f[i]=f[i-1]+1+ ...

随机推荐

  1. Vant中List列表下拉加载更多

    van-list上只有一层父级元素div,多了可能下拉加载出不来:或者更多 <template> <div class="scholl-declarepage"& ...

  2. ABP无法使用异步操作,但要调用异步方法

    使用 AsyncHelper.RunSync(() => _studentRepository.FirstOrDefaultAsync(x => x.Code == studentCode ...

  3. 深度学习应用篇-自然语言处理-命名实体识别[9]:BiLSTM+CRF实现命名实体识别、实体、关系、属性抽取实战项目合集(含智能标注)

    深度学习应用篇-自然语言处理-命名实体识别[9]:BiLSTM+CRF实现命名实体识别.实体.关系.属性抽取实战项目合集(含智能标注) 1.命名实体识别介绍 命名实体识别(Named Entity R ...

  4. Flask 框架:运用SocketIO实现WebSSH

    Flask 框架中如果想要实现WebSocket功能有许多种方式,运用SocketIO库来实现无疑是最简单的一种方式,Flask中封装了一个flask_socketio库该库可以直接通过pip仓库安装 ...

  5. C/C++中的可变参数和可变参数模板

    目录 1.说明 2.C语言中的可变参数 3.C++中的可变参数模板 2.1.使用递归的方式遍历 2.2.使用非递归的方式遍历 1.说明 不谈官方定义,就从个人理解上说,可变参数 就是函数传参的时候,不 ...

  6. 从CPU100%高危故障到稳定在10%:一个月的优化之旅,成功上线!

    引言 经过三个月的开发,项目通过了所有测试并上线,然而,我们发现项目的首页几乎无法打开,后台一直发生超时错误,导致CPU过度负荷.在这次项目开发过程中,我制定了一份详细的技术优化方案.考虑到客户无法提 ...

  7. ASP.NET Core分布式项目实战(课程介绍,MVP,瀑布与敏捷)--学习笔记

    任务1:课程介绍 课程目标: 1.进一步理解 ASP.NET Core 授权认证框架.MVC 管道 2.掌握 Oauth2,结合 Identity Sercer4 实现 OAuth2 和 OpenID ...

  8. CentOS7.5上Oracle19c离线rpm安装

    CentOS7.5上Oracle19c离线rpm安装 一.基础环境配置及依赖安装(1)关闭系统防火墙(如外网环境不能关闭防火墙自行开放相关需要使用的端口即可) systemctl stop firew ...

  9. Go语言的100个错误使用场景(30-40)|数据类型与字符串使用

    目录 前言 4. 控制结构 4.1 忽视元素在range循环中是拷贝(#30) 4.2 忽略在 range 循环中如何评估表达式(#31) 4.3 忽略在 range 中使用指针元素的影响(#32) ...

  10. Power BI 8 DAY

    目录 DAX 表达式扩展 IN NOT IN 时间智能函数 List.Dates TOTALMTD PREVIOUSMONTH DATEADD DAX 表达式扩展 IN in:属于在...中的...( ...