1.pca 抛开fmri研究这个范畴,我们有一个超长向量,这个超长向量在fmri研究中,就是体素数据.向量中的每个数值,都代表在相应坐标轴下的坐标值.这些坐标轴所组成的坐标系,其实是标准单位坐标系.向量如果乘以另外一个转换矩阵,我们可以得到这个向量在新坐标系下的坐标值.变换之后,新的向量维数就变了,一般是降低了,如果我们是以降维为考虑目标.如果把向量进行推广,成为矩阵,那么这个矩阵的每一列都代表一个向量,在具体的研究中,也就是一次采样数据.矩阵有多少列,就代表有多少次采样.在fmri研究中,如果…
首先,ica是一种探索性的方法,属于数据驱动的范畴. ica计算量很大,一般都是离线式计算. ica基于的猜想是,世界是加性的.在我们所研究的脑科学中,所采集到的BOLD信号,是由一些源信号所构成,更准确地说,是由这些源信号叠加而成的.也就是说,假设我们以每个体素为研究对象,那么每个体素的BOLD信号在每个时间点的数值,都是由很多个独立的源信号所组成.注意,在这里,我们对于ica的要求就是分离出的源信号是独立的. 那么,源信号来自于哪里呢? 来自于某个体素,来自于某个脑区,来自于分散在大脑皮层各…
在肖柯的硕士毕业论文中<基于CCA的fMRI时空模型数据处理方法的研究>,他的总体思路是利用cca提取出fmri图像在时间和空间上两个相关系数,也就是两个特征,然后利用pca,对这两个特征进行融合,得的一个综合的相关系数,然后利用这个综合的相关系数进行选取阈值,然后判别激活与否. 首先,他没有降噪. 其次,他有一个假设,就是信号发生体素具有空间局部性和时间局部性.所以,我们才有这样的假设,就是如果一个体素的时间cca系数较高,或者空间cca系数较高,那么,再或者空间-时间两者系数都较高,那么我…
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第13章 - 利用PCA来简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. 降维技术的用途 使得数据集更易使用: 降低很多算法的计算开销: 去除噪声: 使得结果易懂. 基本概念 降维(dimensionality reduction). 如果样本数据的特征维度很大,会使得难以分析和理解.我们可以通过降维技术减少维度. 降维技术并不是将影响少的特征去掉,而是将样本数据集转换成一个低维度…
第13章 利用 PCA 来简化数据 降维技术 场景 我们正通过电视观看体育比赛,在电视的显示器上有一个球. 显示器大概包含了100万像素点,而球则可能是由较少的像素点组成,例如说一千个像素点. 人们实时的将显示器上的百万像素转换成为一个三维图像,该图像就给出运动场上球的位置. 在这个过程中,人们已经将百万像素点的数据,降至为三维.这个过程就称为降维(dimensionality reduction) 数据显示 并非大规模特征下的唯一难题,对数据进行简化还有如下一系列的原因: 使得数据集更容易使用…
load spectra; temp = randperm(size(NIR, 1)); P_train = NIR(temp(1:50),:); T_train = octane(temp(1:50),:); P_test = NIR(temp(51:end),:); T_test = octane(temp(51:end),:); [PCALoadings,PCAScores,PCAVar] = princomp(NIR); figure percent_explained = 100 *…
利用PCA进行故障监测,传统的统计指标有两种:Hotelling-T2和平方预测误差(Squared prediction error, SPE).T2统计量反映了每个主成分在变化趋势和幅值上偏离模型的程度,是对模型内部化的一种度量,它可以用来对多个主元同时进行监测:SPE统计量刻画了输入变量的测量值对主元模型的偏离程度,是对模型外部变化的一种度量.…
机器学习实战(Machine Learning in Action)学习笔记————09.利用PCA简化数据 关键字:PCA.主成分分析.降维作者:米仓山下时间:2018-11-15机器学习实战(Machine Learning in Action,@author: Peter Harrington)源码下载地址:https://www.manning.com/books/machine-learning-in-actiongit@github.com:pbharrin/machinelearn…
异常点往往是由于某一个特征或者多个特征数值异常.但是对于多维度特征无法直接进行可视化观测异常点,利用PCA技术进行维度缩减,可以在二维或者三维空间上进行可视化展示. 原数据如下: from sklearn.decomposition import PCA pca=PCA(n_components=2) #压缩到二维空间中 x_pca=pca.fit_transform(df_test) x_pca.shape (6, 2) 画出散点图,找出异常点 plt.scatter(x_pca[:,0],x…
背景 一般有价值的并保有数据的网站或接口很容易被爬虫,爬虫会占用大量的流量资源,接下来我们参考历史经验,探索如何在.Net Core中利用UserAgent+rDNS双解析方案来正确识别并且反爬虫. 新建网络爬虫识别项目 https://github.com/CraigTaylor/WebBotRecognition 在终端命令行中,基于DotNet-Cli的new命令新建名为WebBotRecognition的webapi项目,并且不需要https,它将自动创建一个net5.0的网络接口项目.…