使用pca/lda降维

PCA主成分分析

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

# 用鸢尾花数据集 展示 降维的效果

from sklearn.datasets import load_iris

iris = load_iris()

data = iris.data  # 特征值

target = iris.target # 目标值

# 绘制平面散点图

plt.scatter(data[:,0],data[:,1],c=target)# 如果要想分类准确 需要考虑所有特征

from sklearn.model_selection import train_test_split

X_train,X_test,y_train,y_test = train_test_split(data,target,test_size=0.1)

from sklearn.neighbors import KNeighborsClassifier

X_train,X_test,y_train,y_test = train_test_split(data,target,test_size=0.1)

KNeighborsClassifier().fit(X_train,y_train).score(X_test,y_test)

如果只是打分一次会有很多偶然因素
所以应该做交叉验证

# 定义一个函数 调用函数 传入 模型 数据集的特征值和目标值

# 函数内部会按照 多个比例 对数据集进行切分 然后获取平均分

def cross_verify(model,data,target):

    scores = []

    # 按照不同比例去切分 训练集 和 测试集

    for i in np.arange(0.1,0.2,0.01):

        X_train,X_test,y_train,y_test = train_test_split(data,target,test_size=i)

        score = model.fit(X_train,y_train).score(X_test,y_test)

        # 把每次打分 加入到分数列表中

        scores.append(score)

    return np.array(scores).mean()

cross_verify(KNeighborsClassifier(),data,target)  # 94-97之间 # 0.981

使用PCA来对数据进行降维

# decomposition 分解

from sklearn.decomposition import PCA

# 获取

# n_components 用来控制保留多少个特征 可以传入整数表示保留特征的个数 还可以传入小数表示保留的特征的比例

pca = PCA(n_components=2)

# 训练模型

pca.fit(data)  # pca只是找当前数据自身内部的最大差异 不关心各种分类之间的差别 所以只传入data即可 target可以不传

data.shape  # 150个样本 4个特征

# 对高维度的数据 进行降维 转换

pca_data = pca.transform(data)

# pca.fit_transform

pca_data.shape  # 样本还是原来的样本 只是特征从4个压缩到了2个

对比散点图

plt.scatter(data[:,0],data[:,1],c=target)

plt.scatter(pca_data[:,0],pca_data[:,1],c=target)

cross_verify(KNeighborsClassifier(),pca_data,target)  # 降低维度是否会影响准确率呢 95-97 大部分情况下降维并不会影响准确率 而且会提高速度

LDA

# discriminant_analysis判别分析

# 线性判别分析 LinearDiscriminantAnalysis

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

lda = LinearDiscriminantAnalysis(n_components=2)

lda.fit(data,target)  # lda是要查看 各个分类之间的差异 所以需要传入各个样本的分类的目标值

lda_data = lda.transform(data)

# lda.fit_transform

对比散点图

plt.scatter(pca_data[:,0],pca_data[:,1],c=target)

plt.scatter(lda_data[:,0],lda_data[:,1],c=target)

cross_verify(KNeighborsClassifier(),lda_data,target) # 使用lda进行降维也不会对准确率产生很大影响

使用pca/lda降维的更多相关文章

用scikit-learn进行LDA降维
在线性判别分析LDA原理总结中,我们对LDA降维的原理做了总结,这里我们就对scikit-learn中LDA的降维使用做一个总结. 1. 对scikit-learn中LDA类概述在scikit-le ...
sklearn LDA降维算法
sklearn LDA降维算法 LDA(Linear Discriminant Analysis)线性判断别分析,可以用于降维和分类.其基本思想是类内散度尽可能小,类间散度尽可能大,是一种经典的监督式 ...
[机器学习]-PCA数据降维：从代码到原理的深入解析
&*&:2017/6/16update,最近几天发现阅读这篇文章的朋友比较多,自己阅读发现,部分内容出现了问题,进行了更新. 一.什么是PCA:摘用一下百度百科的解释 PCA(Prin ...
主成分分析PCA数据降维原理及python应用（葡萄酒案例分析）
目录主成分分析(PCA)——以葡萄酒数据集分类为例 1.认识PCA (1)简介 (2)方法步骤 2.提取主成分 3.主成分方差可视化 4.特征变换 5.数据分类结果 6.完整代码总结: 1.认识P ...
PCA和LDA降维的比较
PCA 主成分分析方法,LDA 线性判别分析方法,可以认为是有监督的数据降维.下面的代码分别实现了两种降维方式: print(__doc__) import matplotlib.pyplot as ...
KNN PCA LDA
http://blog.csdn.net/scyscyao/article/details/5987581 这学期选了门模式识别的课.发现最常见的一种情况就是,书上写的老师ppt上写的都看不懂,然后绕 ...
运用PCA进行降维的好处
运用PCA对高维数据进行降维,有一下几个特点: (1)数据从高维空间降到低维,因为求方差的缘故,相似的特征会被合并掉,因此数据会缩减,特征的个数会减小,这有利于防止过拟合现象的出现.但PCA并不是一种 ...
PCA数据降维
Principal Component Analysis 算法优缺点: 优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想: 降维的 ...
初识PCA数据降维
PCA要做的事降噪和去冗余,其本质就是对角化协方差矩阵. 一.预备知识 1.1 协方差分析对于一般的分布,直接代入E(X)之类的就可以计算出来了,但真给你一个具体数值的分布,要计算协方差矩阵,根据这 ...

随机推荐

linux sftp远程上传文件
1.打开xshell 点击“新建文件传输”,如下图: 中间可能会出现下面的提示框,直接关掉即可: 2.切换到远程你要传输文件的目的地命令:cd 你的路径 3.切换到本地文件所在目录命令:lcd ...
maven build resources
1.在我用springboot+mytatis时,生成完mapper后,然后访问网站总是报错错误信息: Servlet.service() for servlet [dispatcherServle ...
python基础(13)-面向对象
类类的定义和使用 # class Person: def __init__(self, name, age, gender): self.name = name self.age = age sel ...
【Linux】-NO.86.Linux.6.C.1.001-【CentOS 7 Install GCC】-
1.0.0 Summary Tittle:[Linux]-NO.86.Linux.6.C.1.001-[CentOS 7 Install GCC]- Style:Java Series:Log4j S ...
pwn学习日记Day4 基础知识积累
知识杂项 *:字符串重复空指令NOP:\x90 cmp:是比较指令,cmp的功能相当于减法指令.它不保存结果,只是影响相应的标志位. xor:将两个操作数进行异或运算,并将结果存放到操作数1中. s ...
JAVA微信公众号网页开发 —— 用户授权获取openid
官方文档:https://mp.weixin.qq.com/wiki?t=resource/res_main&id=mp1421140842 HttpClientUtil.java packa ...
cocos2dx JS layuot纯代码实现背景颜色渐变
// view._partyBtnClassify.setBackGroundColorType(ccui.Layout.BG_COLOR_GRADIENT);// view._partyBtnCla ...
Vue系列之 => 路由的嵌套
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta name ...
Feign 与 Hystrix
Feign 与 Hystrix Feign是一个声明式的web服务客户端,它使得web服务调用非常的简单,当我们使用Feign时,Spring Cloud 整合了Ribbon和Eureka,从而为我们 ...
js不需要知道图片宽高的懒加载方法（经过实际测试，不加宽高仍然是无法正常加载的，设置height:auto,height:100%，仍然显示高度为0）
js不需要知道图片宽高的懒加载方法懒加载是如何实现的? - 简书https://www.jianshu.com/p/e86c61468285找到一个不需要知道图片宽高的懒加载方法了(经过实际测试,不 ...

使用pca/lda降维

PCA主成分分析

对比散点图

LDA

对比散点图

使用pca/lda降维的更多相关文章

随机推荐

热门专题