样本量的确定与OC函数

在之前的假设检验文章中我们说过，在样本量固定的情况下，第一类错误的减少必然会导致第二类错误的增加。按照之前的例子，原假设依旧是一家馒头店每天卖出100个馒头，现在如果减少第一类错误（也就是减少显著性水平

α），也就是如果抽样结果是90-110之间都可以认为这家店店每天卖出100个馒头。相比于认为抽样结果是95-105之间才接受这个原假设，显然有更大的概率认为原假设是正确的（接受

H_0

H0的概率增加），这会导致对应的两种情况原假设为真和原假设为假的概率都增加，对应第二类错误的概率（

β）增加。

而在实际应用中，我们通常希望可以同时控制第一类错误和第二类错误的概率，从而使正确率更高，这时候就要求抽样是要选取充足的样本量。如何选取样本量使第二类错误的概率控制在预先的范围里呢？为此我们引入OC函数（施行特征函数）：

定义：如果C为参数

\theta

θ的某检验问题的一个检验法，那么我们设

(

)

(

接受

)

\beta(\theta)=P_\theta(\mathrm{接受} ~ H_0)

β(θ)=Pθ(接受 H0)为检验法C的施行特征函数或者OC函数，图形称为OC曲线。
也就是

(

)

\beta(\theta)

β(θ)是在参数为

\theta

θ的情况下接受原假设

H_0

H0的概率。

如果这个检验法的显著性水平为

\alpha

α，那么当真值

∈

\theta \in H_0

θ∈H0时，

(

)

\beta(\theta)

β(θ)为做出正确判断( 在原假设

H_0

H0为真时接受原假设

H_0

H0)的概率，如果

∈

\theta \in H_1

θ∈H1 ，那么这个时候

(

)

\beta(\theta)

β(θ)就是犯了第Ⅱ类错误的概率。对应的

−

(

)

1-\beta(\theta)

1−β(θ)就是作出正确判断的概率，我们称现在这个时候的函数

−

(

)

1-\beta(\theta)

1−β(θ) 为C的功效函数。对于某一个具体的点

∗

∈

\theta^*\in H_1

θ∗∈H1，这个函数表示它在这个点的功效。也就是作出正确判断的概率

正态总体均值检验法的OC函数

Z检验法

首先来看右边检验。它的假设是

≤

H_0:\mu \le \mu_0,H_1:\mu > \mu_0

H0:μ≤μ0,H1:μ>μ0。

我们首先推导它的OC函数。我们注意到，在右边检验中，它的拒绝域满足条件为

−

≥

\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}\ge z_\alpha

σ/n

Xˉ−μ0≥zα 。那么对应的OC函数为：

(

)

(

接受

)

{

−

}

{

−

}

(

−

)

\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_\alpha\right\}=P_\mu\left\{\frac{\bar X-\mu}{\sigma/\sqrt{n}}<z_\alpha-\frac{\mu-\mu_0}{\sigma/\sqrt{n}}\right\}=\Phi(z_\alpha-\lambda)

β(μ)=Pμ(接受H0)=Pμ{σ/n

Xˉ−μ0<zα}=Pμ{σ/n

Xˉ−μ<zα−σ/n

μ−μ0}=Φ(zα−λ)
其中

−

\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}

λ=σ/n

μ−μ0,

\Phi

Φ是正态分布累积函数，有：

(

)

−

\Phi(z_\alpha)=1-\alpha

Φ(zα)=1−α.OC函数对应的函数图像如下：

这个函数有如下的性质

1.为

−

\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}

λ=σ/n

μ−μ0的单调递减连续函数
2.

lim

⁡

→

(

)

−

lim

⁡

→

∞

(

)

\lim_{\mu \to \mu_0^+}\beta(\mu)=1-\alpha,\lim_{\mu \to \infty}\beta(\mu)=0

limμ→μ0+β(μ)=1−α,limμ→∞β(μ)=0 ，这是由概率函数的右连续性决定的

很显然我们希望

\mu > \mu_0

μ>μ0时函数的值都可以降到

\beta

β以下，但是因为

\mu_0

μ0这个边界点的存在我们做不到让所有的处于拒绝域的值犯第Ⅱ类错误的概率都很低，因为必然会存在在

\mu_0

μ0附近的

（

）

\mu（\mu > \mu_0）

μ（μ>μ0）使

(

)

\beta(\mu)

β(μ)几乎等于

−

1-\alpha

1−α.而为了控制第一类错误发生的概率，

\alpha

α都设置的很小，所以无论样本量

n 多大，对于所有的

\mu > \mu_0

μ>μ0，即真值为

H_1

H1所规定的任意一点，控制犯第二类错误的概率都很小是不可能的。但是可以让

\mu > \mu_0

μ>μ0时

(

)

\beta(\mu)

β(μ)的值，也就是犯第二类错误的概率可以急剧下降，这样当

≥

\mu \ge \mu_0+\delta

μ≥μ0+δ时犯第二类错误的概率

\beta

β都可以很小。其中

\delta

δ是人为给定的，很明显

\delta

δ越小说明检验法的准确程度越高。

所以最终得到的计算公式为：

(

)

(

−

)

≤

\beta(\mu_0+\delta)=\Phi(z_\alpha-\sqrt{n}\delta/\sigma)\le \beta

β(μ0+δ)=Φ(zα−n

δ/σ)≤β
化简可得

−

≤

−

z_\alpha-\sqrt{n}\delta/\sigma \le -z_\beta

zα−n

δ/σ≤−zβ

对于左边检验，按照同样的逻辑和步骤，你会发现结果是一样的

从而计算得出Z检验单侧检验的最小样本量计算公式：

≥

(

)

\sqrt{n} \ge \frac{(z_\alpha+z_\beta)\sigma}{\delta}

≥δ(zα+zβ)σ
这个时候我们就能使得

∈

且

≥

\mu \in H_1\mathrm{~ 且~}\mu \ge \mu_0+\delta

μ∈H1 且 μ≥μ0+δ的时候，它犯第Ⅱ类错误的概率不超过

\beta

β 。

下面来看双边假设检验。
双边检验问题

≠

H_0:\mu=\mu_0,H_1:\mu \neq \mu_0

H0:μ=μ0,H1:μ=μ0的OC函数为：

(

)

(

接受

)

{

−

}

(

−

)

(

)

−

\beta(\mu)=P_\mu(接受H_0)=P_\mu\left\{-z_{\alpha/2}<\frac{\bar X-\mu_0}{\sigma/\sqrt{n}}<z_{\alpha/2}\right\}=\Phi(z_{\alpha/2}-\lambda)+\Phi(z_{\alpha/2}+\lambda)-1

β(μ)=Pμ(接受H0)=Pμ{−zα/2<σ/n

Xˉ−μ0<zα/2}=Φ(zα/2−λ)+Φ(zα/2+λ)−1
其中

−

\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}

λ=σ/n

μ−μ0,

\Phi

Φ是正态分布累积函数。OC函数对应的函数图像如下：

在这种情况下，我们需要解超越方程

(

−

)

(

)

−

\beta=\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma)+\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma)-1

β=Φ(zα/2−n

δ/σ)+Φ(zα/2+n

δ/σ)−1确定n，但是一般来说

n总是很大的，因此我们可以认为

(

)

≈

\Phi(z_{\alpha/2}+\sqrt{n}\delta/\sigma) \approx 1

Φ(zα/2+n

δ/σ)≈1 ，也就是说我们只需要满足不等式

(

−

)

≤

\Phi(z_{\alpha/2}-\sqrt{n}\delta/\sigma) \le \beta

Φ(zα/2−n

δ/σ)≤β ，解得

≥

(

)

\sqrt{n} \ge(z_{\alpha/2}+z_\beta)\frac\sigma\delta

≥(zα/2+zβ)δσ，这就是Z检验在双侧检验的情况下最小样本量的公式。

t检验法

对于t检验的右侧检验的OC函数为

(

)

{

−

(

−

)

}

\beta(\mu)=P_\mu\left\{\frac{\bar X-\mu_0}{S/\sqrt{n}}<t_\alpha(n-1)\right\}

β(μ)=Pμ{S/n

Xˉ−μ0<tα(n−1)}
其中有：

−

(

−

)

(

)

−

\frac{\bar X-\mu_0}{S/\sqrt{n}}=(\frac{\bar X-\mu}{\sigma/\sqrt{n}}+\lambda)/(\frac{S}{\sigma}),\lambda=\frac{\mu-\mu_0}{\sigma/\sqrt{n}}

S/n

Xˉ−μ0=(σ/n

Xˉ−μ+λ)/(σS),λ=σ/n

μ−μ0
解出这个具体的值超出了我们所学的内容。但是如果给定了

\alpha,\beta,\delta

α,β,δ，我们查表是可以得到需要的样本量

n的，这样使得

∈

\mu \in H_1

μ∈H1且

−

≥

\frac{\mu-\mu_0}{\sigma} \ge \delta

σμ−μ0≥δ犯第Ⅱ类错误的概率不超过

\beta

β。

要注意这里的不等式不再是

−

≥

\mu-\mu_0 \ge \delta

μ−μ0≥δ而是

−

≥

\frac{\mu-\mu_0}{\sigma} \ge \delta

σμ−μ0≥δ

双边检测时，对应的不等式为

∣

−

∣

≥

\frac{|\mu-\mu_0|}{\sigma} \ge \delta

σ∣μ−μ0∣≥δ

但是在实际的应用中

\sigma

σ一般是不知道的，这是就没有办法通过

∣

−

∣

\delta=\frac{|\mu-\mu_0|}{\sigma}

δ=σ∣μ−μ0∣来计算

\delta

δ并查表得到样本量了。可以按照如下步骤来近似算一下：首先适当的取一个值

n_1

n1 ,抽取容量为

n_1

n1的样本，并根据这一样本计算出

s^2

s2的值，以

s^2

s2作为

\sigma^2

σ2的估计值计算得到

\delta

δ的近似值，代入查表得到

n_2

n2。如果

≥

n_1 \ge n_2

n1≥n2,则取

n_1

n1作为样本容量。如果

n_2

n2更大，那么就抽取

−

n_2-n_1

n2−n1个样本补充进原样本，按照一样的步骤计算

s^2,\delta

s2,δ ,然后查表得到

n_3

n3 ，若

≥

n_2 \ge n_3

n2≥n3,则取

n_2

n2作为样本容量,否则继续上述计算步骤。