PCA(Principal Component Analysis)主成分分析法的数学原理推导1.主成分分析法PCA的特点与作用如下:(1)是一种非监督学习的机器学习算法(2)主要用于数据的降维(3)通过降维,可以发现人类更加方便理解的特征(4)其他的应用:去燥:可视化等2.主成分分析法的数学原理主要是利用梯度上升法来最优化目标函数,即利用梯度上升法来求取效用函数的最大值,其具体的数学原理推导过程如下所示: 对于以上的函数,因为梯度的向量化表示我们已经求得,因此,我们便可以通过梯度上升法求取函数的…
工作原理 基于集成算法的多个树累加, 可以理解为是弱分类器的提升模型 公式表达 基本公式 目标函数 目标函数这里加入了损失函数计算 这里的公式是用的均方误差方式来计算 最优函数解 要对所有的样本的损失值的期望, 求解最小的程度作为最优解 集成算法表示 集成算法中对所有的树进行累加处理 公式流程分解 每加一棵树都应该在之前基础上有一个提升 损失函数 叶子节点惩罚项 损失函数加入到基本公式目标函数中 多余出来的常数项就用 c 表示即可 目标函数推导 如上图. 三个树, 真实值 1000 , 第一棵树…
//2019.08.17 #支撑向量机SVM(Support Vector Machine)1.支撑向量机SVM是一种非常重要和广泛的机器学习算法,它的算法出发点是尽可能找到最优的决策边界,使得模型的泛化能力尽可能地好,因此SVM对未来数据的预测也是更加准确的. 2.支撑向量机SVM有两种:Hard Margin SVM和Soft Margin SVM,对于第一种严格的支撑向量机算法主要解决的是线性可分的数据问题,而第二种SVM是在第一种的基础上改进而来,可以解决普遍的数据问题,对于问题的线性可…
引言: 最近一直在学习主成分分析(PCA),所以想把最近学的一点知识整理一下,如果有不对的还请大家帮忙指正,共同学习. 首先我们知道当数据维度太大时,我们通常需要进行降维处理,降维处理的方式有很多种,PCA主成分分析法是一种常用的一种降维手段,它主要是基于方差来提取最有价值的信息,虽然降维之后我们并不知道每一维度的数据代表什么意义,但是它将主要的信息成分保留了下来,那么PCA是如何实现的呢? 本文详细推导了PCA的数学原理,最后以实例进行演算. PCA的数学原理 (一)降维问题 大家都知道,PC…
//看了多少遍SVM的数学原理讲解,就是不懂,对偶形式推导也是不懂,看来我真的是不太适合学数学啊,这是面试前最后一次认真的看,并且使用了sklearn包中的SVM来进行实现了一个鸢尾花分类的实例,进行进一步的理解. 1.鸢尾花分类实例 转自:https://www.cnblogs.com/luyaoblog/p/6775342.html 数据集: 特点:每个属性及标记之间使用逗号进行隔开. #encoding:utf-8 from sklearn import svm import numpy…
Dijkstar算法是荷兰数学家迪克斯屈拉(or迪杰斯特拉?)在1959年发现的一个算法.是现有的几个求带权图中两个顶点之间最短通路的算法之一.算是一个相当经典的算法了. 迪克斯屈拉算法应用于无向连通简单带权图中,求出顶点a 与z 之间的最短通路的长度.我感觉其算法精髓就是:找到第一个与a 最靠近的顶点,然后找第二个,续行此法,直到找到的顶点是z 为止.该算法依赖于一系列的迭代.通过在每次迭代中添加一个顶点来构造出特殊顶点的集合.在每次迭代中完成一个标记过程.在这个标记过程中,用只包含特殊顶点的…
设有\(m\)个指标,\(n\)个样本的原始数据 将原始数据按列组成矩阵 \(X _ { n \times m }\) 将\(X\) 的每一列进行中心化 求\(X\)的协方差矩阵\(\Sigma _ { X } = \frac { 1 } { n - 1 } X ^ { T } X\) 求出 \(\Sigma _ { X }\) 的特征值及对应的特征向 将特征值按照从大到小构成对角矩阵\(\Lambda = \left( \begin{array} { l l l l } { \lambda _…
前几天和同事讨论IKE密钥交换流程时,提到了Diffie-Hellman交换.DH算法最主要的作用便是在不安全的网络上成功公共密钥(并未传输真实密钥).但由于对于DH算法的数学原理则不清楚,因此私下对DH算法进行一个简单学习. 1. DH算法的交互流程: Alice和Bob都有一个只有自己知道的私钥,在特定规则(g, a, p)下生成自己的公钥A; Alice将自己的公钥A,连同g, p共同发给Bob Bob在收到Alice发送来的公钥A, g, p后,先使用相同的规则((g, a, p))生成…
一:引入问题 首先看一个表格,下表是某些学生的语文,数学,物理,化学成绩统计: 首先,假设这些科目成绩不相关,也就是说某一科目考多少分与其他科目没有关系,那么如何判断三个学生的优秀程度呢?首先我们一眼就能看出来,数学,物理,化学这三门课的成绩构成了这组数据的主成分(很显然,数学作为第一主成分,因为数据成绩拉的最开). 那么为什么我们能一眼看出来呢? 当然是我们的坐标轴选对了!! 下面,我们继续看一个表格,下标是一组学生的数学,物理,化学,语文,历史,英语成绩统计: 那么这个表我们能一眼看出来吗?…