SAS学习笔记27 卡方检验
卡方检验(chi-square test)是英国统计学家Pearson提出的一种主要用于分析分类变量数据的假设检验方法,该方法主要目的是推断两个或多个总体率或构成比之间有无差别。
卡方分布界值表的依据是卡方分布,其分布是连续型分布,而计数资料中的实际频数为分类资料,是不连续的。因此,计算出来的卡方值查界值表所得的概率P偏小,特别是对自由度为1的四格表资料的影响更大。 为此,美国统计学家F.Yates(1934年)提出了计算卡方的连续性校正法(correction for continuity)
在实际工作中,对于四格表资料,通常规定为:
四格表资料的Fisher确切概率法
该法是一种直接计算概率的假设检验方法,其理论依据是超几何分布(hypergeometric distribution)。四格表的确切概率法不属于卡方检验的范畴,但常作为四格表资料假设检验的补充。
多个样本率间多重比较
当多个样本率比较的推断结论拒绝H0、接受H1时,只说明各总体率之间有差别,但不能说明任两个总体率之间有差别。多个样本率间的两两比较若直接用四格表资料的卡方检验进行多重比较,将会增加犯I类错误的概率。为此,需要采用多个样本率的多重比较方法。
多个样本率间的多重比较有卡方分割法、Scheffe可信区间法和Bonferroni方法,应用这些方法能够保证假设检验中I类错误α的概率不变。
最简单的是Bonferroni方法,其基本思想是根据重复检验的次数重新规定检验水准α'。这是一种比较保守的方法,比较的组数不宜过多,实际中通常有两种情况。
一是多个实验组间的两两比较,二是实验组与同一个对照组的比较,而各实验组间不需要比较
RxC表卡方检验的注意事项
1、一般认为,RxC表中各格子的理论频数不应小于1,并且1<=T<5的格子数不宜超过格子总数的1/5。若出现这种情况,可通过以下方法解决:增加样本含量,使理论频数增大;根据专业知识,考虑删去或合并理论频数太小的行或列;改用RxC表的Fisher确切概率法
2、多个样本率比较,若统计推断结果拒绝H0,接受H1时,只说明各总体率之间总的来说有别,但并不能说明任两个总体率之间均有差别。要进一步推断,需做多个样本率的多重比较。
3、RxC表的卡方检验与分类结果的排序无关。对于有序RxC表,如果分析的目的不是对构成比进行比较,例如比较两组的疗效,试验结果为“痊愈、显效、有效、无效”,则不宜使用卡方检验,对此可以选用非参数秩和检验方法
SAS学习笔记27 卡方检验的更多相关文章
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程
SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础
SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...
- [原创]java WEB学习笔记27:深入理解面向接口编程
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- SAS学习笔记22 t检验、卡方检验
- SAS学习笔记<一>
三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...
- SAS学习笔记
一. 在SAS中进行随机抽样: 1. 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况: (1)简单无重复抽样(2)分层抽样 a.等比例分层抽样 b. 不等比例 ...
随机推荐
- BaggingClassifier
写在前面 Ensemble methods 组合模型的方式大致为四个:/bagging / boosting / voting / stacking ,此文主要简单叙述 bagging算法. 算法 ...
- activemq jmx
增加: -Djava.rmi.server.hostname=<IP addr>
- VMware Workstation虚拟机打开系统时,提示“无法打开内核设备“\\.\Global\vmx86”: 系统找不到指定的文件。是否在安装 VMware Workstation 后重新引导?”
VMware Workstation虚拟机打开系统时,提示“无法打开内核设备“\\.\Global\vmx86”: 系统找不到指定的文件.是否在安装 VMware Workstation 后重新引导? ...
- Oracle数据库-primary key/foreign key和references关系
主要介绍一下个人对主键(primary key).外键(foreign key).候选键(Candidate key).超键(super key).references的总结 概念: 主键:用户选择元 ...
- 常用学习&面试资源网站
https://github.com/MZCretin/RollToolsApi 开源通用API https://github.com/SenhLinsh/Android-Hot-Libraries ...
- python mysql使用问题
(deeplearning2) userdeMBP:ageAndGender user$ python Python |Anaconda, Inc.| ( , ::) [GCC Compatible ...
- pytorch加载数据的方法-没弄,打算弄
参考:https://www.jianshu.com/p/aee6a3d72014 # 网络,netg为生成器,netd为判别器 netg, netd = NetG(opt), NetD(opt) # ...
- 123457123456#0#-----com.threeapp.MakerHanBao01----儿童汉堡制作游戏
----com.threeapp.MakerHanBao01----儿童汉堡制作游戏
- 123456123456#0#-----com.threeapp.JiQiRenDaZhan01----机器人大战恐龙
com.threeapp.JiQiRenDaZhan01----机器人大战恐龙
- ELK之elasticsearch删除索引
参考文档:https://www.cnblogs.com/Dev0ps/p/9493576.html elasticsearch使用时间久了会产生大量索引占用磁盘空间,可以删除索引来释放 查看当前所有 ...