我们知道,PCA是用于对数据做降维的,我们一般用PCA把m维的数据降到k维(k < m). 那么问题来了,k取值多少才合适呢? PCA误差 PCA的原理是,为了将数据从n维降低到k维,需要找到k个向量,用于投影原始数据,是投影误差(投影距离)最小. 用公式来表示,如下 其中 m表示特征个数 分子表示原始点与投影点之间的距离之和,而误差越小,说明降维后的数据越能完整表示降维前的数据.如果这个误差小于0.01,说明降维后的数据能保留99%的信息. k值选取的原理 实际应用中,我们一般根据上式,选择…