样本量的确定与OC函数
在之前的假设检验文章中我们说过,在样本量固定的情况下,第一类错误的减少必然会导致第二类错误的增加。按照之前的例子,原假设依旧是一家馒头店每天卖出100个馒头,现在如果减少第一类错误(也就是减少显著性水平
α
α
α),也就是如果抽样结果是90-110之间都可以认为这家店店每天卖出100个馒头。相比于认为抽样结果是95-105之间才接受这个原假设,显然有更大的概率认为原假设是正确的(接受
H
0
H_0
H0的概率增加),这会导致对应的两种情况原假设为真和原假设为假的概率都增加,对应第二类错误的概率(
β
β
β)增加。

而在实际应用中,我们通常希望可以同时控制第一类错误和第二类错误的概率,从而使正确率更高,这时候就要求抽样是要选取充足的样本量。如何选取样本量使第二类错误的概率控制在预先的范围里呢?为此我们引入OC函数(施行特征函数):
定义:如果C为参数
θ
\theta
θ的某检验问题的一个检验法,那么我们设
β
(
θ
)
=
P
θ
(
接受
H
0
)
\beta(\theta)=P_\theta(\mathrm{接受} ~ H_0)
β(θ)=Pθ(接受 H0)为检验法C的施行特征函数或者OC函数,图形称为OC曲线。
也就是
β
(
θ
)
\beta(\theta)
β(θ)是在参数为
θ
\theta
θ的情况下接受原假设
H
0
H_0
H0的概率。
如果这个检验法的显著性水平为
α
\alpha
α,那么当真值
θ
∈
H
0
\theta \in H_0
θ∈H0时,
β
(
θ
)
\beta(\theta)
β(θ)为做出正确判断( 在原假设
H
0
H_0
H0为真时接受原假设
H
0
H_0
H0)的概率,如果
θ
∈
H
1
\theta \in H_1
θ∈H1 ,那么这个时候
β
(
θ
)
\beta(\theta)
β(θ)就是犯了第Ⅱ类错误的概率。对应的
1
−
β
(
θ
)
1-\beta(\theta)
1−β(θ)就是作出正确判断的概率,我们称现在这个时候的函数
1
−
β
(
θ
)
1-\beta(\theta)
1−β(θ) 为C的功效函数。对于某一个具体的点
θ
∗
∈
H
1
\theta^*\in H_1
θ∗∈H1,这个函数表示它在这个点的功效。也就是作出正确判断的概率
正态总体均值检验法的OC函数
Z检验法
首先来看右边检验。它的假设是
H
0
:
μ
≤
μ
0
,
H
1
:
μ
>
μ
0
H_0:\mu \le \mu_0,H_1:\mu > \mu_0
H0:μ≤μ0,H1:μ>μ0。
我们首先推导它的OC函数。我们注意到,在右边检验中,它的拒绝域满足条件为
X
ˉ
−
μ
0
σ
/
n
≥
z
α
\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}\ge z_\alpha
σ/n
Xˉ−μ0≥zα 。那么对应的OC函数为:
β
(
μ
)
=
P
μ
(
接受
H
0
)
=
P
μ
{
X
ˉ
−
μ
0
σ
/
n
<
z
α
}
=
P
μ
{
X
ˉ
−
μ
σ
/
n
<
z
α
−
μ
−
μ
0
σ
/
n
}
=
Φ
(
z
α
−
λ
)
\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_\alpha\right\}=P_\mu\left\{\frac{\bar X-\mu}{\sigma/\sqrt{n}}<z_\alpha-\frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right\}=\Phi(z_\alpha-\lambda)
β(μ)=Pμ(接受H0)=Pμ{σ/n
Xˉ−μ0<zα}=Pμ{σ/n
Xˉ−μ<zα−σ/n
μ−μ0}=Φ(zα−λ)
其中
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/n
μ−μ0,
Φ
\Phi
Φ是正态分布累积函数,有:
Φ
(
z
α
)
=
1
−
α
\Phi(z_\alpha)=1-\alpha
Φ(zα)=1−α.OC函数对应的函数图像如下:

这个函数有如下的性质
1.为
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/n
μ−μ0的单调递减连续函数
2.
lim
μ
→
μ
0
+
β
(
μ
)
=
1
−
α
,
lim
μ
→
∞
β
(
μ
)
=
0
\lim_{\mu \to \mu_0^+}\beta(\mu)=1-\alpha,\lim_{\mu \to \infty}\beta(\mu)=0
limμ→μ0+β(μ)=1−α,limμ→∞β(μ)=0 ,这是由概率函数的右连续性决定的
很显然我们希望
μ
>
μ
0
\mu > \mu_0
μ>μ0时函数的值都可以降到
β
\beta
β以下,但是因为
μ
0
\mu_0
μ0这个边界点的存在我们做不到让所有的处于拒绝域的值犯第Ⅱ类错误的概率都很低,因为必然会存在在
μ
0
\mu_0
μ0附近的
μ
(
μ
>
μ
0
)
\mu(\mu > \mu_0)
μ(μ>μ0)使
β
(
μ
)
\beta(\mu)
β(μ)几乎等于
1
−
α
1-\alpha
1−α.而为了控制第一类错误发生的概率,
α
\alpha
α都设置的很小,所以无论样本量
n
n
n 多大,对于所有的
μ
>
μ
0
\mu > \mu_0
μ>μ0,即真值为
H
1
H_1
H1所规定的任意一点,控制犯第二类错误的概率都很小是不可能的。但是可以让
μ
>
μ
0
\mu > \mu_0
μ>μ0时
β
(
μ
)
\beta(\mu)
β(μ)的值,也就是犯第二类错误的概率可以急剧下降,这样当
μ
≥
μ
0
+
δ
\mu \ge \mu_0+\delta
μ≥μ0+δ时犯第二类错误的概率
β
\beta
β都可以很小。其中
δ
\delta
δ是人为给定的,很明显
δ
\delta
δ越小说明检验法的准确程度越高。
所以最终得到的计算公式为:
β
(
μ
0
+
δ
)
=
Φ
(
z
α
−
n
δ
/
σ
)
≤
β
\beta(\mu_0+\delta)=\Phi(z_\alpha-\sqrt{n}\delta/\sigma)\le \beta
β(μ0+δ)=Φ(zα−n
δ/σ)≤β
化简可得
z
α
−
n
δ
/
σ
≤
−
z
β
z_\alpha-\sqrt{n}\delta/\sigma \le -z_\beta
zα−n
δ/σ≤−zβ
对于左边检验,按照同样的逻辑和步骤,你会发现结果是一样的
从而计算得出Z检验单侧检验的最小样本量计算公式:
n
≥
(
z
α
+
z
β
)
σ
δ
\sqrt{n} \ge \frac{(z_\alpha+z_\beta)\sigma}{\delta}
n
≥δ(zα+zβ)σ
这个时候我们就能使得
μ
∈
H
1
且
μ
≥
μ
0
+
δ
\mu \in H_1\mathrm{~ 且~}\mu \ge \mu_0+\delta
μ∈H1 且 μ≥μ0+δ的时候,它犯第Ⅱ类错误的概率不超过
β
\beta
β 。
下面来看双边假设检验。
双边检验问题
H
0
:
μ
=
μ
0
,
H
1
:
μ
≠
μ
0
H_0:\mu=\mu_0,H_1:\mu \neq \mu_0
H0:μ=μ0,H1:μ=μ0的OC函数为:
β
(
μ
)
=
P
μ
(
接受
H
0
)
=
P
μ
{
−
z
α
/
2
<
X
ˉ
−
μ
0
σ
/
n
<
z
α
/
2
}
=
Φ
(
z
α
/
2
−
λ
)
+
Φ
(
z
α
/
2
+
λ
)
−
1
\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{-z_{\alpha/2}<\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_{\alpha/2}\right\}=\Phi(z_{\alpha/2}-\lambda)+\Phi(z_{\alpha/2}+\lambda)-1
β(μ)=Pμ(接受H0)=Pμ{−zα/2<σ/n
Xˉ−μ0<zα/2}=Φ(zα/2−λ)+Φ(zα/2+λ)−1
其中
λ
=
μ
−
μ
0
σ
/
n
\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
λ=σ/n
μ−μ0,
Φ
\Phi
Φ是正态分布累积函数。OC函数对应的函数图像如下:

在这种情况下,我们需要解超越方程
β
=
Φ
(
z
α
/
2
−
n
δ
/
σ
)
+
Φ
(
z
α
/
2
+
n
δ
/
σ
)
−
1
\beta=\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma)+\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma)-1
β=Φ(zα/2−n
δ/σ)+Φ(zα/2+n
δ/σ)−1确定n,但是一般来说
n
n
n总是很大的,因此我们可以认为
Φ
(
z
α
/
2
+
n
δ
/
σ
)
≈
1
\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma) \approx 1
Φ(zα/2+n
δ/σ)≈1 ,也就是说我们只需要满足不等式
Φ
(
z
α
/
2
−
n
δ
/
σ
)
≤
β
\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma) \le \beta
Φ(zα/2−n
δ/σ)≤β ,解得
n
≥
(
z
α
/
2
+
z
β
)
σ
δ
\sqrt{n} \ge(z_{\alpha/2}+z_\beta)\frac\sigma\delta
n
≥(zα/2+zβ)δσ,这就是Z检验在双侧检验的情况下最小样本量的公式。
t检验法
对于t检验的右侧检验的OC函数为
β
(
μ
)
=
P
μ
{
X
ˉ
−
μ
0
S
/
n
<
t
α
(
n
−
1
)
}
\beta(\mu)=P_\mu\left\{\frac{\bar X-\mu_0}{S/\sqrt{n}}<t_\alpha(n-1)\right\}
β(μ)=Pμ{S/n
Xˉ−μ0<tα(n−1)}
其中有:
X
ˉ
−
μ
0
S
/
n
=
(
X
ˉ
−
μ
σ
/
n
+
λ
)
/
(
S
σ
)
,
λ
=
μ
−
μ
0
σ
/
n
\frac{\bar X-\mu_0}{S/\sqrt{n}}=(\frac{\bar X-\mu}{\sigma/\sqrt{n}}+\lambda)/(\frac{S}{\sigma}),\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}
S/n
Xˉ−μ0=(σ/n
Xˉ−μ+λ)/(σS),λ=σ/n
μ−μ0
解出这个具体的值超出了我们所学的内容。但是如果给定了
α
,
β
,
δ
\alpha,\beta,\delta
α,β,δ,我们查表是可以得到需要的样本量
n
n
n的,这样使得
μ
∈
H
1
\mu \in H_1
μ∈H1且
μ
−
μ
0
σ
≥
δ
\frac{\mu-\mu_0}{\sigma} \ge \delta
σμ−μ0≥δ犯第Ⅱ类错误的概率不超过
β
\beta
β。
要注意这里的不等式不再是
μ
−
μ
0
≥
δ
\mu-\mu_0 \ge \delta
μ−μ0≥δ而是
μ
−
μ
0
σ
≥
δ
\frac{\mu-\mu_0}{\sigma} \ge \delta
σμ−μ0≥δ
双边检测时,对应的不等式为
∣
μ
−
μ
0
∣
σ
≥
δ
\frac{|\mu-\mu_0|}{\sigma} \ge \delta
σ∣μ−μ0∣≥δ
但是在实际的应用中
σ
\sigma
σ一般是不知道的,这是就没有办法通过
δ
=
∣
μ
−
μ
0
∣
σ
\delta=\frac{|\mu-\mu_0|}{\sigma}
δ=σ∣μ−μ0∣来计算
δ
\delta
δ并查表得到样本量了。可以按照如下步骤来近似算一下:首先适当的取一个值
n
1
n_1
n1 ,抽取容量为
n
1
n_1
n1的样本,并根据这一样本计算出
s
2
s^2
s2的值,以
s
2
s^2
s2作为
σ
2
\sigma^2
σ2的估计值计算得到
δ
\delta
δ的近似值,代入查表得到
n
2
n_2
n2。如果
n
1
≥
n
2
n_1 \ge n_2
n1≥n2,则取
n
1
n_1
n1作为样本容量。如果
n
2
n_2
n2更大,那么就抽取
n
2
−
n
1
n_2-n_1
n2−n1个样本补充进原样本,按照一样的步骤计算
s
2
,
δ
s^2,\delta
s2,δ ,然后查表得到
n
3
n_3
n3 ,若
n
2
≥
n
3
n_2 \ge n_3
n2≥n3,则取
n
2
n_2
n2作为样本容量,否则继续上述计算步骤。

样本量的确定与OC函数的更多相关文章
- OC与Swift的区别五(函数)
13 函数 oc函数定义: 返回值类型 函数名(参数类型 参数名,参数类型 参数名){ } swift 函数定义: func 函数名(参数名:参数类型,参数名:参数类型) -> 返回值类型{ } ...
- swift项目中使用OC/C的方法
假如有个OC类OCViewController : UIViewController类里有两个方法 //swift调用oc或c的混编是比较常用的,反过来的调用很少.这里只写了swift调用oc和c的方 ...
- oc - runtime运行机制
Objective-C语言是一门动态语言,它将很多静态语言在编译和链接时做的事放到了运行时来处理.同时OC也是一门简单的语言,很大一部分是C的内容,只是在语言层面上加了关键字和语法,真正让OC强大 ...
- Xcode中c++&Object-C混编,详细介绍如何在cocos2dx中访问object函数以及Apple Api
转自:http://www.himigame.com/iphone-cocos2dx/743.html Cocos2dx系列博文的上一篇详细介绍了如何在Xcode中利用jni调用Android的Jav ...
- oc中的类学习笔记1
1.oc中的类和构造方法 NSAutoreleasePool * pool =[[NSAutoreleasePool alloc] init]; NSAutoreleasePool是一个类,alloc ...
- Objective-c 总结(一):OC类的设计
(一)学习目标: 1.面向对象基本概念: OOP的主要思想是把构成问题的各个事务分解成各个对象,建立对象的目的不是为了完成一个步骤,而是为了描述一个事物在整个解决问题步骤中的行为. 2.熟悉OC类的定 ...
- OC语言(一)
一.概述 1.基本上所有关键词@开头 2.字符串以@开头,如@"Hello" 3.基本数据类型 char int float double BOOL(YES\NO) 4.空为nil ...
- iOS OC和JS的交互 javaScriptCore方法封装
一.javaScriptCore javaScriptCore是一种JavaScript引擎,主要为webKit提供脚本处理能力,javaScriptCore是开源webkit的一部分,他提供了强大的 ...
- ios oc调用swift framework
1.oc 调用swift /*oc调用swift, project name为DeomOC: 1.oc工程DemoOC中显式创建一个swift文件,生成DemoOC-Bridging-Header.h ...
- Runtime应用防止按钮连续点击 (转)
好久之前就看到过使用Runtime解决按钮的连续点击的问题,一直觉得没啥好记录的.刚好今天旁边同时碰到这个问题,看他们好捉急而且好像很难处理,于是我先自己看看… 前面自己也学习了很多Runtime的东 ...
随机推荐
- SRE网站可靠性工程师
SRE网站可靠性工程师 SRE需要做什么? 一般: 故障模式,尤其是SPOF(单点故障).消除SPOFs是你作为SRE最大的挑战和乐趣. 基础设施组件,从应用程序到硬件(服务器.交换机.路由器.互联网 ...
- 在Linux终端管理你的密码!
大家好,我是良许. 现在是互联网时代,我们每天都要跟各种 APP .网站打交道,而这些东西基本上都需要注册才可以使用. 但是账号一多,我们自己都经常记不清对应的密码了.有些小伙伴就一把梭,所有的账号密 ...
- 线性探测法的查找函数 作者 DS课程组 单位 浙江大学
虽然但是,我真的讨厌c语言这样一大坨typedef命名来命名去的,很多时候其实我们会写,但是看不懂这个存储结构 函数的接口定义 Position Find( HashTable H, ElementT ...
- 🎀杜伽Durgod K610W蓝牙连接问题解决
简介 杜伽Durgod K610W键盘支持三模连接,在配对成功蓝牙后切换连接通道后,再次连接蓝牙通道时无法正常自动连接已配对的蓝牙,需取消配对再重新配对后才能正常连接.这种问题可以通过升级键盘固件解决 ...
- 从 Excel 到你的表格应用:数据验证功能的嵌入实践指南
前言: 随着信息化的不断发展,传统表格软件已无法满足用户对便携性.数据自动化管理等日益复杂的要求,将电子表格与其他系统结合.开发自己的表格应用已成为愈发火热的趋势. 然而,当企业需要将 Excel 的 ...
- QT 的信号-槽机制
对于对象间的通信问题,很多框架采用回调函数类解决.QT 使用信号-槽解决对象间的通信问题,只要继承 QObject 类就可以使用信号-槽机制.信号-槽使用起来非常简单.灵活,发射和接收对象实现了解耦. ...
- 在我用了几个月VSCode的C++及其衍生功能后的感受
VSCode优点槽点大盘点 优点 衍生功能是真的多,几乎所有功能在扩展市场里面都能得到.而且无需配置环境啊 自定义功能是真的方便,可以自定义.exe存放位置或者名称,打下;键就能够一键美化代码等等 美 ...
- 里程碑:MCP星球作为国内首个中文MCP社区和MCP工具平台,突破7000个MCP服务!
随着人工智能技术的快速发展,越来越多的开发者开始使用模型上下文协议(Model Context Protocol,简称MCP)来优化大模型与外部工具的交互.作为首个最大的中文MCP工具市场,MCP星球 ...
- 【记录】Prompt模板|作为甲方怎么清晰专业地描述自己的需求(又名“乙方,给你的甲方扔个GPT解放自己吧”)
这篇Prompt摘抄并修改自朋友送给我的书的第49页5.2.3让ChatGPT构建提示,质量挺不错,支持一下她的博客:[好书推荐2]AI提示工程实战:从零开始利用提示工程学习应用大语言模型. 书长这样 ...
- 【记录】PC端QQ空间爬虫常用接口API(随缘更新ing)
首先是官方的文档:https://wiki.connect.qq.com/api列表. 其次是自己f12找的,每次都要找挺麻烦的不如记下来.记录日期:2022/08/16,如之后功能有更改或API更换 ...