如何确定假设检验的样本量（sample size）？

在《如何计算假设检验的功效（power）和效应量（effect size）？》一文中，我们讲述了如何根据显著性水平α，效应量和样本容量n，计算功效，以及如何根据显著性水平α，功效和样本容量n，计算效应量。但这两个应用都属于事后检验，也就是说，就算假设检验之后计算出的功效或效应量不理想，我们也没有办法改变。因此，我们最好事先就把我们想要达到的功效和效应量确定好，然后根据显著性水平α，功效和效应量，计算样本容量n。这种事前检验的应用用得比较多。

此外，我们都知道，如果假设检验选取的样本量很小，那么检验结果的可信度就不高，因为每次抽取的样本波动会很大。但是也不是说样本量越大越好，因为如果样本量很大的话，会增加检验的成本。因此，在假设检验之前确定好样本量非常重要。

样本量（sample size）：每次抽取的样本中所含的观测值的数量。

z检验（单样本，样本和总体均值）中计算样本量的公式如下：

（单尾）

（双尾）

注：μ_a为第二类错误中所采用的总体均值的值。

双样本（两总体均值）的假设检验中，计算样本量的公式如下：（下图摘自：https://www.datasciencecentral.com/profiles/blogs/determining-sample-size-in-one-picture）

应用：根据显著性水平α，功效和效应量，计算样本容量n。

（可用G*Power或Statsmodels计算）

如何使用G*Power：https://zhuanlan.zhihu.com/p/62560195

线上计算：https://www.stat.ubc.ca/~rollin/stats/ssize/n2.html

单样本t检验：statsmodels.stats.power.tt_solve_power(effect_size=None, nobs=None, alpha=None, power=None, alternative='two-sided')

独立样本t检验：statsmodels.stats.power.tt_ind_solve_power(effect_size=None, nobs1=None, alpha=None, power=None, ratio=1.0, alternative='two-sided')

卡方拟合优度检验：statsmodels.stats.power.GofChisquarePower.solve_power(effect_size=None, nobs=None, alpha=None, power=None, n_bins=2)

F方差齐性检验：statsmodels.stats.power.FTestPower.solve_power(effect_size=None, df_num=None, df_denom=None, nobs=None, alpha=None, power=None, ncc=1)

方差分析：statsmodels.stats.power.FTestAnovaPower.solve_power(effect_size=None, nobs=None, alpha=None, power=None, k_groups=2)

可以看到，用Statsmodels库计算功效，效应量和样本量的函数都是同一个，只要把需要计算的那个值仍然设为None，把其他想要达到的数值填上即可。

参考：

https://www.afenxi.com/23249.html

如何确定假设检验的样本量（sample size）？的更多相关文章

Margin of Error|sample size and E
8.3 Margin of Error 由该公式可知: To improve the precision of the estimate, we need to decrease the margin ...
统计学基于SPSS贾俊平授课笔记发布作业 spss19cn 软件下载地址及破解包spss19_10039 下载地址
spss19cn软件下载地址及破解包spss19_10039 软件包下载地址一 http://www.33lc.com/soft/41991.html 软件包下载地址二 http://dl.pconl ...
某某项目SDV软件测试报告范例
说明:本范例为符合CMMI 5级要求的范例 Prepared by 拟制小张 Date 日期 2008-04-09 Reviewed by 评审人小丽.小王.小李.小莉.小三.小四.小猪.小猫.小 ...
如何计算假设检验的功效（power）和效应量（effect size）？
做完一个假设检验之后,如果结果具有统计显著性,那么还需要继续计算其效应量,如果结果不具有统计显著性,并且还需要继续进行决策的话,那么需要计算功效. 功效(power):正确拒绝原假设的概率,记作1-β ...
孟德尔随机化(Mendelian Randomization) 统计功效（power）和样本量计算
孟德尔随机化(Mendelian Randomization) 统计功效(power)和样本量计算 1 统计功效(power)概念统计功效(power)指的是在原假设为假的情况下,接受备择假设的概率 ...
取数据超过内存限制的问题-解决方案（sample，takeSample，filter）
遇到的问题在处理数据过程中,遇到需要取(n)个数的问题,而当样本量过大的时候,就不能简单的take(n),这类问题一般有两种情况: > - 有序取 TopN > - 无序取 N 先来讨论 ...
统计学_样本量估计_python代码实现
python机器学习-乳腺癌细胞挖掘(博主亲自录制视频)https://study.163.com/course/introduction.htm?courseId=1005269003&ut ...
R数据分析：样本量计算的底层逻辑与实操，pwr包
样本量问题真的是好多人的老大难,是很多同学科研入门第一个拦路虎,今天给本科同学改大创标书又遇到这个问题,我想想不止是本科生对这个问题不会,很多同学从上研究生到最后脱离科研估计也没能把这个问题弄得很明白 ...
R语言—使用函数sample进行抽样
在医学统计学或者流行病学里的现场调查.样本选择经常会提到一个词:随机抽样.随机抽样是为了保证各比较组之间均衡性的一个很重要的方法.那么今天介绍的第一个函数就是用于抽样的函数sample: > ...

随机推荐

解决python错误 UnicodeDecodeError: 'gb2312' codec can't decode byte 0x8b in position 1: illegal multibyte sequence
报错的代码: url= 'http://kaijiang.500.com/shtml/ssq/19001.shtml' page =urllib.request.urlopen(url) conten ...
Git拉取远程分支命令
如果我们想从Git仓库中拉取一个分支到本地,此处假如远程分支为develop,本地要创建的分支为dev,可以使用以下命令: git init //初始化本地Git仓库 git remote ad ...
【07】Jenkins：流水线（Pipeline）
写在前面的话个人认为 Pipeline 在 Jenkins 中算是一个优化性功能,它能够将我们的构建服务的整个过程流程化,这意味着当我们在执行到某一步的时候,可以添加询问,提示我们是否继续运行下一步 ...
【问题记录】ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)
一.问题描述环境:MySQL 8.0 + Windows 由于密码错误或者其他原因导致无法连上MySQL服务,如下图: 二.解决方案解决该问题的具体步骤如下: 1.关闭MySQL服务以管理员权限 ...
SpringBoot热部署（实战）详解
热部署是什么大家都知道在项目开发过程中,常常会改动页面数据或者修改数据结构,为了显示改动效果,往往需要重启应用查看改变效果,其实就是重新编译生成了新的 Class 文件,这个文件里记录着和代码等对应 ...
排序算法Java代码实现（五）—— 快速排序
本篇内容: 快速排序快速排序算法思想: 通过一趟排序将要排序的数据分割成独立的两部分, 其中一部分的所有数据都比另外一部分的所有数据都要小, 然后再按此方法对这两部分数据分别进行快速排序, 整个排 ...
swagger 集成后发布到服务器报错[Could not find file 'D:\\home\\site\\wwwroot\\bin\\WebAPI.XML]
webapi集成swagger后,在本地运行没有问题,但是发布到服务器上就有问题. 报错信息:Could not find file 'D:\\home\\site\\wwwroot\\bin\\We ...
centos7 配置nginx vim语法高亮
看了Nginx核心知识100讲,按照他的做法,没有配置成功,可以使用下面的方法: 下载nginx源码,http://nginx.org/en/download.html 这里下载的是:nginx-1. ...
开发工具--PyCharm
工具|PyCharm 主要介绍关于PyCharm的使用小技巧,方便自己使用这款软件. 前戏准备 1.下载pycharm: 官方网站(鼠标单击) 2.安装(自己百度一下,教程很多) 正式开始 PyCha ...
【转载】 C#中ArrayList使用ToArray方法转换为数组
在C#的编程开发中,ArrayList集合是一个常用的非泛型类集合,可以使用ArrayList中的ToArray方法将ArrayList集合对象转换为数组,ToArray方法有2个重载形式,其一为vi ...

如何确定假设检验的样本量（sample size）？

如何确定假设检验的样本量（sample size）？的更多相关文章

随机推荐

热门专题