第7章 PCA与梯度上升法

主成分分析法：主要作用是降维

疑似右侧比较好？

第三种降维方式：

问题：？？？？？

方差：描述样本整体分布的疏密的指标，方差越大，样本之间越稀疏；越小，越密集

第一步：

总结：

问题：？？？？怎样使其最大

变换后：

最后的问题：？？？？

注意区别于线性回归

使用梯度上升法解决PCA问题：

import numpy as np

import matplotlib.pyplot as plt

from sklearn import datasets

digits = datasets.load_digits()  # 手写识别数据

X = digits.data

y = digits.target

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)

# 使用K近邻

from sklearn.neighbors import KNeighborsClassifier

knn_clf=KNeighborsClassifier()

knn_clf.fit(X_train,y_train)

a1=knn_clf.score(X_test,y_test)

# print(a1)

# 使用PCA

from sklearn.decomposition import PCA

pca=PCA(n_components=2)

pca.fit(X_train)

X_train_reduction=pca.transform(X_train)

X_test_reduction=pca.transform(X_test)

knn_clf=KNeighborsClassifier()

knn_clf.fit(X_train_reduction,y_train)

a2=knn_clf.score(X_test_reduction,y_test)

# print(a2)

# print(pca.explained_variance_ratio_)

pca=PCA(n_components=X_train.shape[1])

pca.fit(X_train)

# print(pca.explained_variance_ratio_)

plt.plot([i for i in range(X_train.shape[1])],

        [np.sum(pca.explained_variance_ratio_[:i+1]) for i in range(X_train.shape[1])])

# plt.show()

pca1=PCA(0.95) # 能解释95%以上的方差

pca1.fit(X_train)

print(pca.n_components_)

from sklearn.decomposition import PCA

pca=PCA(0.95)

pca.fit(X_train)

X_train_reduction=pca.transform(X_train)

X_test_reduction=pca.transform(X_test)

knn_clf=KNeighborsClassifier()

knn_clf.fit(X_train_reduction,y_train)

a3=knn_clf.score(X_test_reduction,y_test)

print(a3)

pca=PCA(n_components=2)

pca.fit(X)

X_reduction=pca.transform(X)

for i in range(10):

    plt.scatter(X_reduction[y==i,0],X_reduction[y==i,1],alpha=0.8)

plt.show()

scikit-learn中的PCA

第7章 PCA与梯度上升法的更多相关文章

机器学习(七) PCA与梯度上升法 (上)
一.什么是PCA 主成分分析 Principal Component Analysis 一个非监督学的学习算法主要用于数据的降维通过降维,可以发现更便于人类理解的特征其他应用:可视化:去噪第一 ...
机器学习（4）——PCA与梯度上升法
主成分分析(Principal Component Analysis) 一个非监督的机器学习算法主要用于数据的降维通过降维,可以发现更便于人类理解的特征其他应用:可视化.去噪通过映射,我们可以 ...
4.pca与梯度上升法
(一)什么是pca pca,也就是主成分分析法(principal component analysis),主要是用来对数据集进行降维处理.举个最简单的例子,我要根据姓名.年龄.头发的长度.身高.体重 ...
机器学习(七) PCA与梯度上升法 (下)
五.高维数据映射为低维数据换一个坐标轴.在新的坐标轴里面表示原来高维的数据. 低维反向映射为高维数据 PCA.py import numpy as np class PCA: def __ini ...
机器学习：PCA（使用梯度上升法求解数据主成分 Ⅰ ）
一.目标函数的梯度求解公式 PCA 降维的具体实现,转变为: 方案:梯度上升法优化效用函数,找到其最大值时对应的主成分 w : 效用函数中,向量 w 是变量: 在最终要求取降维后的数据集时,w 是参数 ...
《机器学习实战》学习笔记——第13章 PCA
1. 降维技术 1.1 降维的必要性 1. 多重共线性--预测变量之间相互关联.多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯.2. 高维空间本身具有稀疏性.一维正态分布有68%的值落于正负 ...
第四章 PCA降维
目录 1. PCA降维 PCA:主成分分析(Principe conponents Analysis) 2. 维度的概念一般认为时间的一维,而空间的维度,众说纷纭.霍金认为空间是10维的. 3. 为 ...
Python3入门机器学习经典算法与应用
<Python3入门机器学习经典算法与应用> 章节第1章欢迎来到 Python3 玩转机器学习1-1 什么是机器学习1-2 课程涵盖的内容和理念1-3 课程所使用的主要技术栈第2章机器 ...
Python3入门机器学习经典算法与应用☝☝☝
Python3入门机器学习经典算法与应用 (一个人学习或许会很枯燥,但是寻找更多志同道合的朋友一起,学习将会变得更加有意义✌✌) 使用新版python3语言和流行的scikit-learn框架,算法与 ...

随机推荐

01-复杂度2 Maximum Subsequence Sum
01-复杂度2 Maximum Subsequence Sum (25分) 时间限制:200ms 内存限制:64MB 代码长度限制:16kB 判题程序:系统默认作者:陈越单位:浙江大学 htt ...
#if 和#ifdef的区别
转自:https://blog.csdn.net/zhangchiytu/article/details/7563329 先看个例子:#define TARGET_LITTLE_ENDINA 1#de ...
HTML--HTML入门篇（我想10分钟入门HTML，可以，交给我吧）
我要正经的讲一节课,咳咳! HTML简介(废话) HTML称为超文本标记语言,是一种标识性的语言.它包括一系列标签．通过这些标签可以将网络上的文档格式统一,使分散的Internet资源连接为一个逻辑整 ...
codeforce 266c Below the Diagonal 矩阵变换（思维题）
C. Below the Diagonal You are given a square matrix consisting of n rows and n columns. We assume th ...
HTML（表格标签）
<table> 标签表格由 <table> 标签来定义.每个表格均有若干行(由 <tr> 标签定义),每行被分割为若干单元格(由 <td> 标签定义) ...
unittest（封装用例）
from selenium import webdriver from time import sleep import unittest #导入unittest库 import HTMLTestRu ...
Ajax各参数介绍及使用
Ajax各参数介绍及使用 1. url: 要求为String类型的参数,(默认为当前页地址)发送请求的地址. 2. type: 要求为String类型的参数,请求方式(post或get)默认为get. ...
jdbc连接mysql数据库 (idea)
mysql我们已经不再陌生,但是通过Java来操作数据库的增删改查,我们就需要用到jdbc来连接: 我们使用idea来连接数据库,首先:我们电脑上需要安装idea和mysql,之后在网站上登录MySQ ...
网络流二十四题，题解summary
没有全部写完,有几题以后再补吧. 第一题:最简单的:飞行员配对方案问题讲讲这个题目为什么可以用网络流? 因为这个题目是要进行两两之间的匹配,这个就可以想到用二分图匹配,二分图匹配又可以用网络流写. ...
for do-while while区别
分别用for do-while while求1-100的和

第7章 PCA与梯度上升法

第7章 PCA与梯度上升法的更多相关文章

随机推荐

热门专题