Applied Nonparametric Statistics-lec5
今天继续two-sample test
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/6
- Mann-Whitney Test
前面说这个和Wilcoxon是identical的,只是统计量不同。现在我们来看一下它的统计量U。注意,现在检查的仍然是两个独立样本。
Treatment 1: x1, x2, ... , xm
Treatment 2: y1, y2, ... , yn
U = # of pairs of (Xi, Yj) for which Xi < Yj
H0 : the distributions are the same
H1 : the distributions are not the same
Table A4 contains lower tailed and upper tailed values for U under the null hypothesis. It can be shown that Uupper = mn - Ulower.
实际在R中的操作:
wilcox.test(new, trad, alternative="greater")
现在,我们来构造U的置信区间。好了,直接用R就好了啊:)
wilcox.test(ugrad, grad, conf.level=0.90, conf.int=T)
以上我们检查的都是两个样本的位置情况,下面要检查scale,也就是分布的形状,variability。
我们现在假设两个样本的均值相等,方差不同,现在想判断哪个方差更大。如果两个样本来自正态分布的总体,那么可以分别计算方差,然后
但是如果这两个不是来自正态分布的,就不可以了。此时,我们考虑非参数检验的方法。
- Siegel-Tukey Test (ST test):检查方差
- 把数据合在一起,从小到大排列。
- 最小的rank为1,最大的为2,次小的为3,次大的为4,蛇形排序。
- 做Wilcoxon rank-sum test. The smaller rank sums are associated with the treatment that has the largest variability.
如果把指定rank的方式改为:最小和最大为1,次小和次大为2,以此类推,这样就是Ansari-Bradley test。
R下,可以使用jmuOutlier包内的函数
siegel.test(x, y, alternative = c("two.sided", "less", "greater"), reverse = FALSE,all.perms = TRUE, num.sim = 20000)
Ansari-Bradley test:
ansari.test(x, y,
alternative = c("two.sided", "less", "greater"),
exact = NULL, conf.int = FALSE, conf.level = 0.95,
...)
事实上,检查方差一致性homogeneity of variance (homoscedasticity)还有其他方法,参考这篇文章:
http://www.cookbook-r.com/Statistical_analysis/Homogeneity_of_variance/
- Bartlett’s test:适合于数据是正态分布的;
- Levene’s test :在car包里,对于非正态分布的数据,比Bartlett's test更具健壮性;
- Fligner-Killeen test :非参数检验方法。
- Tests on Deviances
1. Obtain the deviances for the two treatments (devix and devjy) and compute RMD from the orginal data, denoted RMDobs.
2. Permute.样本数大的话,循环指定次数,否则循环所有。计算RMD。
- Kolmogorov-Smirnov Test
这个是检查general difference的,也就是说,会考虑location,scale,shape。如果两个样本分布的位置是否不同这一点未知,使用这个;如果已经
知道两个样本数据分布的位置是不同的,那么应该用wilcoxon。
- Calculate the observed test statistic, KSobs
^F1(W)是sample CDF
2. Find all the possible permutation of the data and calculate KS for each permutation.
3. The p-value is found by
R语言就简单了:
ks.test(a, b)
Applied Nonparametric Statistics-lec5的更多相关文章
- Applied Nonparametric Statistics-lec10
Ref:https://onlinecourses.science.psu.edu/stat464/print/book/export/html/14 估计CDF The Empirical CDF ...
- Applied Nonparametric Statistics-lec9
Ref:https://onlinecourses.science.psu.edu/stat464/print/book/export/html/12 前面我们考虑的情况是:response是连续的, ...
- Applied Nonparametric Statistics-lec8
Ref:https://onlinecourses.science.psu.edu/stat464/print/book/export/html/11 additive model value = t ...
- Applied Nonparametric Statistics-lec7
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/9 经过前面的步骤,我们已经可以判断几个样本之间是否 ...
- Applied Nonparametric Statistics-lec6
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/8 前面都是对一两个样本的检查,现在考虑k个样本的情 ...
- Applied Nonparametric Statistics-lec4
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/5 Two sample test 直接使用R的t- ...
- Applied Nonparametric Statistics-lec3
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/4 使用非参数方法的优势: 1. 对总体分布做的假设 ...
- Applied Nonparametric Statistics-lec2
Ref: https://onlinecourses.science.psu.edu/stat464/print/book/export/html/3 The Binomial Distributio ...
- Applied Nonparametric Statistics-lec1
参考网址: https://onlinecourses.science.psu.edu/stat464/node/2 Binomial Distribution Normal Distribution ...
随机推荐
- https://www.safaribooksonline.com/home/
https://www.safaribooksonline.com/home/ https://www.safaribooksonline.com/library/view/instant-sikul ...
- java.sql.SQLException: No suitable driver found for jdbc:hive://localhost:10000/default
error: java.sql.SQLException: No suitable driver found for jdbc:hive://localhost:10000/default at ja ...
- OAuthLogin2.0
开源第三方登录组件OAuthLogin2.0 支持QQ,阿里巴巴,淘宝,京东,蘑菇街,有赞等平台 Nuget地址:https://www.nuget.org/packages/OAuthLogin ...
- JavaSE---悲观锁与乐观锁
1.[悲观锁] 1.1 在数据处理的整个过程中,数据将处于锁定状态: 1.2 悲观锁的实现,依赖于数据库提供的锁机制(只有数据库提供的锁机制才能真正保证数据访问的排他性,否则,即使在系统中加锁机制,也 ...
- 重置 linux系统后要配置的基本组件操作
1.安装jdk https://www.cnblogs.com/shihaiming/p/5809553.html 2.安装mysql 3.安装tomcat
- webpack.config.js====插件purifycss-webpack,提炼css文件
1. 安装:打包编译时,可以删除一些html中没有使用的选择器,如果html页面中没有class=a class="b"的元素,.a{}.b{}样式不会加载 cnpm instal ...
- JAVA基础之网络通信协议--TCP与UDP
个人理解: 了解区分UDP与TCP的不同,正常情况都是两者结合的使用模式!为了更好的传输,经常会开多线程进行传输的! 一.网络通信协议: 1.TCP/IP协议: 四层:应用层.传输层.网络层和链路层: ...
- 中介者模式和php实现
中介者模式: 中介者模式(Mediator Pattern)定义:用一个中介对象来封装一系列的对象交互,中介者使各对象不需要显式地相互引用,从而使其耦合松散,而且可以独立地改变它们之间的交互.中介者模 ...
- ABAP自定义功能函数
1.实现计算器中阶乘函数 FUNCTION zfun_mm_001. *"---------------------------------------------------------- ...
- Appium基础三:Appium实现原理
1.web自动化测试用的selenium webdriver 是c/s模式,server端和client端是通过webdriver protocol实现的,而Appium是参考selenium开发的, ...