初始数据类似: 蛋白质组数据虽不是严格的正态分布,但目前最常用的检验方法还是T检验(两组比较)和方差分析(多组比较).这个话题值得深究,这里不展开. 主要是求多个蛋白的Pvalue值或FDR,用于差异筛选. Pvalue <- c() type<-factor(c(rep("S01CC",3),rep("S11SC",3),rep("S12CC",3),rep("S12SC",3))) for(i in 1:nro…
方差检验可以评估组间的差异.依据检验的结果,虽然你可以拒绝不存在差异的原假设,但方差检验并没有告诉你哪些组显著地与其他组有不同.Robert 在 <R in Action>一书中推荐了一个包-npmc: 该包提供了一种非参数多组比较程序.在控制犯第一类错误的概率(发现一个事实上并不存在的差异的概率)的前提下,执行可以同步进行的多组比较,这样可以直接完成所有组之间的成对比较. 由于该包所依赖的mvtnorm包的一些更新,npmc包的最后更新版本(1.0.7)无法正确运行在R 3.0以上的版本.我…
注释:R语言是区分大小写的 1.向量 R语言中可以将各种向量赋值为一个变量,这种赋值操作符就是等号“=”,也可以使用“<-”. 1)产生向量 (1)函数c() 例如:x1=c(2,4,6,8,0)    表示数列 (2)例如: 向量a:2到60的元素都乘以2再加1 a[5]:显示向量a的第5个元素 a[-5]:除去向量a的第5个元素,显示其它元素 a[1:5]:显示第1到第5个元素 a[-(1:5)]:除去第1到第5个元素,显示其余的元素 a[c(2,4,7)]:显示第2,第4,第7个元素 a[…
做了个两组间的Kruskal-wallis检验,出现如下错误: 对应的英文版本错误为: All group levels must be finite is.finite(data$type)一下果然都是FALSE. 这是因为我的type变量是字符串而非因子.is.finite函数不能是字符串对象.?is.finite.因此转化为因子,成功:…
代码如下 df = pd.read_csv("../kmeans/gene.fpkm.csv",header=None) print df.head() #去掉第一行 tdf = df.drop(index=[0]) #去掉第一列 mdf = tdf.drop([0],axis=1) #获取第一列作为行的名称 rownames=tdf[0] #获取第一行作为列的名称 gene=df.loc[0][1:] #修改原始数据库的行列名 mdf.rename(index=rownames, c…
题目:Quantitative Proteomics of Th-MYCN Transgenic Mice Reveals Aurora Kinase Inhibitor Altered Metabolic Pathways and Enhanced ACADM To Suppress Neuroblastoma Progression 期刊:Journal of Proteome Research 发表时间:September 27, 2019 DOI:10.1021/acs.jproteom…
应用统计学 方差分析的基本假设: 组间组平均与总平均的不同是由treatment引发的.单个值与组平均的不同是由组内error引发的. 如果没有处理误差SSA=SSE,所以右尾假设如果F>1则处理效应更强 本质上样本方差,所以是总体方差的无偏估计. 描述强度: 增加n(维度),R变大,adjusted R变大.但是n过大就会出现过拟合的现象,此时R虽然变大,但是并不好,并不能反映客观情况,客观情况是变量间差异是本身就很大,而不是因为维度升高导致的. 双因子方差分析除了增加一个因素之外还有两个因素…
最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在多组学领域知名度最高的一个R包,有专门的团队,做了十余年了,引用量也比较高. 官网:http://mixomics.org/ 文章:mixOmics: An R package for 'omics feature selection and multiple data integration Gi…
R中预定义的字符组 代码 含义说明 [:digit:]或\\d 数字; [0-9] [^[:digit:]]或\\D 非数字; 等价于[^0-9] [:lower:] 小写字母; [a-z] [:upper:] 大写字母; [A-Z] [:alpha:] 字母; [a-z]及[A-Z] [:alnum:] 所有字母及数字; [A-z0-9] \\w 字符串; [A-z0-9_] (在ASCII编码下,\w比[:alnum:]多了一个下划线) [:xdigit:]或\\x 十六进制数字; [0-9…
1.1 Hotelling T2检验 Hotelling T2检验是一种常用多变量检验方法,是单变量检验的自然推广,常用于两组均向量的比较. 设两个含量分析为n,m的样本来自具有公共协方差阵的q维正态分布N(μ1,∑),N(μ2,∑),欲检验 H0:μ1=μ2 H1:μ1≠μ2 分别计算出两样本每个变量的均值构成的均向量X.Y及合并的组内协方差阵S,则统计量T2为 其中,S=(Lx+Ly)/(n+m-2),为合并协方差矩阵,分别为两样本的离差阵,即: 求得T2后,可查相应界值表得到P值,从而作出…