1、数学推导

根据上讲的思想,我们可以用下图来进行数学上的推导.

2、PCA的步骤

1)对原始数据进行标准化处理:对该指标变量进行标准化,

2)计算相关系数矩阵(协方差矩阵)

3)计算相关系数矩阵的特征值和特征向量,得到新的指标标量。

4)计算特征值的信息贡献率和累积贡献率,按一定规则选择主成分

5)以主成分的贡献率为权重,构建主成分综合评价模型,计算综合评价值和排名

3、应用实例——我国各地区普通高等教育发展综合评价

案例背景不再详述,在此我们选取10个指标来评价30个省市他们的普通高等教育发展。

数据:

1)将上述数据标准化,计算协方差矩阵

2)计算协方差矩阵的特征值和特征值贡献率

3)根据特征值贡献率选取前四个特征根对应的特征向量

由此可得四个主成分分别为:

4)分别以四个主成分的贡献率为权重,计算主成分综合得分:

计算的matlab程序:

 gj=[
5.96 44.36 2.2 ;
3.39 35.02 0.9 ;
2.35 38.4 0.86 ;
1.35 30.45 1.22 ;
1.5 34.3 0.54 ;
1.67 33.53 0.76 ;
1.17 35.22 0.58 ;
1.05 32.89 0.66 ;
0.95 31.54 0.39 ;
0.69 34.5 0.37 ;
0.56 32.62 0.55 ;
0.57 32.95 0.28 ;
0.71 28.13 0.73 ;
0.74 33.06 0.47 ;
0.86 29.94 0.25 ;
1.29 25.93 0.37 ;
1.04 29.01 0.29 ;
0.85 25.63 0.43 ;
0.81 29.82 0.31 ;
0.59 32.83 0.33 ;
0.66 28.55 0.48 ;
0.77 28.81 0.34 ;
0.7 27.34 0.28 ;
0.84 27.65 0.32 ;
1.69 12.1 ;
0.55 28.41 0.3 ;
0.6 31.93 0.24 ;
1.39 22.7 0.42 ;
0.64 28.12 0.34 ;
1.48 17.87 0.38 ;
];%原始数据
gj=zscore(gj); %数据标准化
r=corrcoef(gj); %计算相关系数矩阵
[e,lamda]=eig(r); %求相关系数矩阵的特征值和特征向量
lamda=sort(sum(lamda),'descend');%将特征值降序排列
attribute=lamda./sum(lamda); %各特征值的贡献率
cum_attribute=cumsum(attribute); %累计的贡献率
num=; %选取的主成分的个数
df=gj*e(:,:-:-num) %新指标下的样本值
score=attribute(:num)*df'; %计算综合得分
[stf,ind]=sort(score,'descend'); %把得分按照从高到低的次序排列
stf=stf', ind=ind'

统计知识选讲(二)——主成分分析(PCA)的推导和应用的更多相关文章

  1. 线性判别分析(LDA), 主成分分析(PCA)及其推导【转】

    前言: 如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了. 谈到LDA,就不得不谈谈PCA,PCA ...

  2. 统计知识选讲(一)——主成分分析(PCA)的思想

    主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,从而达到降维的目的.在原始数据“预处理”阶段通常要先对它们采用PCA ...

  3. 主成分分析(PCA)原理及推导

    原文:http://blog.csdn.net/zhongkejingwang/article/details/42264479 什么是PCA? 在数据挖掘或者图像处理等领域经常会用到主成分分析,这样 ...

  4. 机器学习 —— 基础整理(四)特征提取之线性方法:主成分分析PCA、独立成分分析ICA、线性判别分析LDA

    本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensiona ...

  5. 主成分分析PCA详解

    转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景 上完陈恩红老师的<机器学习与知识 ...

  6. 05-03 主成分分析(PCA)

    目录 主成分分析(PCA) 一.维数灾难和降维 二.主成分分析学习目标 三.主成分分析详解 3.1 主成分分析两个条件 3.2 基于最近重构性推导PCA 3.2.1 主成分分析目标函数 3.2.2 主 ...

  7. 机器学习之主成分分析PCA原理笔记

    1.    相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律.多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的 ...

  8. 主成分分析(PCA)原理详解_转载

    一.PCA简介 1. 相关背景 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律.多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上 ...

  9. 用scikit-learn学习主成分分析(PCA)

    在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维. 1. scikit-learn PCA类介绍 ...

随机推荐

  1. tinyxml 查找element

    下面这段代码是网上找来的,很是经典 bool GetNodePointerByName(TiXmlElement* pRootEle, const char* strNodeName,TiXmlEle ...

  2. C++中public,protected,private访问

    对于公有继承方式: (1)父类的public成员成为子类的public成员,允许类以外的代码访问这些成员:(2)父类的private成员仍旧是父类的private成员,子类成员不可以访问这些成员:(3 ...

  3. The Swift Programming Language-官方教程精译Swift(3)基本运算符

    运算符是检查, 改变, 合并值的特殊符号或短语. 例如, 加号 + 把计算两个数的和(如 let i = 1 + 2). 复杂些的运行算包括逻辑与&&(如 if enteredDoor ...

  4. IT见解

    IT见解 北京海淀区  2014-10-18   张俊浩 *域名的市值在走低,因其功能被新浪.腾讯微博.微信大V这种账号所代替 *小米将自己定位为互联网公司,而不是手机公司 *手机不远的未来会成为公共 ...

  5. POJ 3390 Print Words in Lines(DP)

    Print Words in Lines Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 1624 Accepted: 864 D ...

  6. InstallShield集成安装MSDE2000最小版本(二) fishout特许授权发布

    原文:InstallShield集成安装MSDE2000最小版本(二) fishout特许授权发布 原帖地址:http://blog.csdn.net/fishout/archive/2009/10/ ...

  7. PHP 生成唯一激活码

    <?php /** * 从来没有产生一个唯一的激活码 * @return string */ function create_guid($namespace = null) { static $ ...

  8. 增加VMWare开机画面时间,来防止快速跳过而无法进入BIOS

    用记事本打开xx.vmx,在里面添加一行: bios.bootDelay = "30000" 意思是开机后,在开机画面里停留30秒.

  9. MVC 分页1 标准的url分页

    一. 将mvcpager ddl 引用到web服务项目中. 二. 在view加入 <%@ Import Namespace="Webdiyer.WebControls.Mvc" ...

  10. swift 笔记 (二十) —— 泛型

    泛型 泛型是为了解决在针对不同数据类型.而做了同一种功能的操作导致的每一个类型我们都要写一份代码的问题. 有了泛型,我们能够仅仅写一份逻辑代码,而适应于不同的数据类型. func swapInt(in ...