1、数学推导

根据上讲的思想,我们可以用下图来进行数学上的推导.

2、PCA的步骤

1)对原始数据进行标准化处理:对该指标变量进行标准化,

2)计算相关系数矩阵(协方差矩阵)

3)计算相关系数矩阵的特征值和特征向量,得到新的指标标量。

4)计算特征值的信息贡献率和累积贡献率,按一定规则选择主成分

5)以主成分的贡献率为权重,构建主成分综合评价模型,计算综合评价值和排名

3、应用实例——我国各地区普通高等教育发展综合评价

案例背景不再详述,在此我们选取10个指标来评价30个省市他们的普通高等教育发展。

数据:

1)将上述数据标准化,计算协方差矩阵

2)计算协方差矩阵的特征值和特征值贡献率

3)根据特征值贡献率选取前四个特征根对应的特征向量

由此可得四个主成分分别为:

4)分别以四个主成分的贡献率为权重,计算主成分综合得分:

计算的matlab程序:

 gj=[
5.96 44.36 2.2 ;
3.39 35.02 0.9 ;
2.35 38.4 0.86 ;
1.35 30.45 1.22 ;
1.5 34.3 0.54 ;
1.67 33.53 0.76 ;
1.17 35.22 0.58 ;
1.05 32.89 0.66 ;
0.95 31.54 0.39 ;
0.69 34.5 0.37 ;
0.56 32.62 0.55 ;
0.57 32.95 0.28 ;
0.71 28.13 0.73 ;
0.74 33.06 0.47 ;
0.86 29.94 0.25 ;
1.29 25.93 0.37 ;
1.04 29.01 0.29 ;
0.85 25.63 0.43 ;
0.81 29.82 0.31 ;
0.59 32.83 0.33 ;
0.66 28.55 0.48 ;
0.77 28.81 0.34 ;
0.7 27.34 0.28 ;
0.84 27.65 0.32 ;
1.69 12.1 ;
0.55 28.41 0.3 ;
0.6 31.93 0.24 ;
1.39 22.7 0.42 ;
0.64 28.12 0.34 ;
1.48 17.87 0.38 ;
];%原始数据
gj=zscore(gj); %数据标准化
r=corrcoef(gj); %计算相关系数矩阵
[e,lamda]=eig(r); %求相关系数矩阵的特征值和特征向量
lamda=sort(sum(lamda),'descend');%将特征值降序排列
attribute=lamda./sum(lamda); %各特征值的贡献率
cum_attribute=cumsum(attribute); %累计的贡献率
num=; %选取的主成分的个数
df=gj*e(:,:-:-num) %新指标下的样本值
score=attribute(:num)*df'; %计算综合得分
[stf,ind]=sort(score,'descend'); %把得分按照从高到低的次序排列
stf=stf', ind=ind'

统计知识选讲(二)——主成分分析(PCA)的推导和应用的更多相关文章

  1. 线性判别分析(LDA), 主成分分析(PCA)及其推导【转】

    前言: 如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了. 谈到LDA,就不得不谈谈PCA,PCA ...

  2. 统计知识选讲(一)——主成分分析(PCA)的思想

    主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,从而达到降维的目的.在原始数据“预处理”阶段通常要先对它们采用PCA ...

  3. 主成分分析(PCA)原理及推导

    原文:http://blog.csdn.net/zhongkejingwang/article/details/42264479 什么是PCA? 在数据挖掘或者图像处理等领域经常会用到主成分分析,这样 ...

  4. 机器学习 —— 基础整理(四)特征提取之线性方法:主成分分析PCA、独立成分分析ICA、线性判别分析LDA

    本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensiona ...

  5. 主成分分析PCA详解

    转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401 一.PCA简介 1. 相关背景 上完陈恩红老师的<机器学习与知识 ...

  6. 05-03 主成分分析(PCA)

    目录 主成分分析(PCA) 一.维数灾难和降维 二.主成分分析学习目标 三.主成分分析详解 3.1 主成分分析两个条件 3.2 基于最近重构性推导PCA 3.2.1 主成分分析目标函数 3.2.2 主 ...

  7. 机器学习之主成分分析PCA原理笔记

    1.    相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律.多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的 ...

  8. 主成分分析(PCA)原理详解_转载

    一.PCA简介 1. 相关背景 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律.多变量大样本无疑会为研究和应用提供了丰富的信息,但也在一定程度上 ...

  9. 用scikit-learn学习主成分分析(PCA)

    在主成分分析(PCA)原理总结中,我们对主成分分析(以下简称PCA)的原理做了总结,下面我们就总结下如何使用scikit-learn工具来进行PCA降维. 1. scikit-learn PCA类介绍 ...

随机推荐

  1. IOS程序创建view

    在IOS程序中创建view有六种方式 首先创建一个GLViewController类,继承UIViewController. 然后进入GLAppDelegate.m,在- (BOOL)applicat ...

  2. 采用malloc分别分配2KB个人空间,然后,realloc调整到6KB、1MB、3MB、10MB场地,分别这五内存“A”、“B”、“C”、“D”、“E”灌装

    #include<stdio.h> #include<stdlib.h> #include<string.h> #include<malloc.h> i ...

  3. javascript通过数日两个日期之间的比较分离

    $(function () {  var starttime = transdate("2014-09-30 15:53:00");  var endtime = transdat ...

  4. C#备份还原MySql数据库

    原文:C#备份还原MySql数据库 项目结束,粘点代码出来让Google或Baidu一下,原因是现在还搜不到这么现成的 调用MySql的工具mysqldump来实现. 类Cmd来实现调用cmd命令, ...

  5. JavaScript重载解读

    在JavaScript有一个特殊的数据类型---Function种类,JavaScript每个功能Function的类型,例如可以.由于函数是对象.指针,不会与某个函数绑定. <pre name ...

  6. 记录一下Fedora21下安装Foundation5遇到的问题[尚有遗留问题]

    写在前面:之前安装过了gem,所以下面的步骤没有这一过程,再有就是忘记哪一步需要ruby中的一个.h文件.可以使用如下命令解决 sudo yum install ruby-devel ------ S ...

  7. WEB浏览器与服务器通讯过程

    以访问网页www.baidu.com为例,下面是使用Wireshark捕捉到的数据: 浏览器先发起一个TCP连接,然后发送GET报文给服务器,服务器之后返回一个Response报文. 从服务器端返回时 ...

  8. mcstructs-MircoCStructs用C语言实现的微型数据结构库

    以C语言的方式,我将逐步实现以下算法: 我的Github地址为:https://github.com/tfa2012/mcstructs 1 线性链表 2 环形缓冲区 3 Hash表

  9. JSON解析之Gson

    1.Gson简介 Gson是一个将Java对象转为JSON表示的开源类库,由Google提供,并且也可以讲JSON字符串转为对应的Java对象.虽然有一些其他的开源项目也支持将Java对象转为JSON ...

  10. leetcode第16题--3Sum Closest

    Problem:Given an array S of n integers, find three integers in S such that the sum is closest to a g ...