正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。

一、标准正态分布

标准正态分布是正态分布的标准化。正态分布是一个在数学,物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

1.1 正态分布

若随机变量\(X\)服从一个数学期望为\(\mu\)、方差为\(\sigma^2\)的正态分布,记为\(X∼N(\mu,{\sigma}^2)\),英文命名为Normal distribution,也就是典范规范分布。其概率密度函数为正态分布的期望值\(\mu\)决定了其位置,其标准差\(\sigma\)决定了分布的幅度,如下图所示。

它的密度函数为

\[f(x)=\frac{1}{\sqrt{2\pi }\sigma}e^{-(x-\mu)^{2}/{2\sigma^2}}
\]

该密度函数包含两个最重要的数学常量:自然对数的底数\(e\)和圆周率\(\pi\)。参数\(\mu,\sigma^2\)有明确的含义,分别是该分布的均值和方差。同时它的密度函数曲线如上图所示,被称为钟形曲线。

它的分布函数为

\[F(x) = P(f(t) \leq x) =\int_{-\infty}^x{\frac{1}{\sqrt{2\pi }\sigma}e^{-\frac{(t-\mu)^2}{2\sigma^2}}}dt
\]

1.2 正态分布的性质

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

1.3 标准正态分布

在正态分布函数中,当 \(\mu =0,\sigma =1\)时,就服从标准正态分布,标准正态分布概率密度函数为:

\[\phi(x)=\frac{1}{\sqrt{2\pi }}e^{-x^{2}/2}
\]
\[\Phi(x) = P(\phi(x) \leq x) =\int_{-\infty}^x{\frac{1}{\sqrt{2\pi }}e^{-t^{2}/2}}dt
\]

基于正态分布的对称性,当\(x\lt 0\)时,有

\[\Phi(x) =1- \Phi(-x)
\]

后面仅考虑\(x\gt 0\)的情形。

正态分布的标准化

正态分布可通过变换$$Z=\frac{X-\mu}{\sigma }$$化为标准正态分布。

正态分布的\(3\sigma\)区域

1.4 正态分布的上侧\(\alpha\)分位数

设X的密度函数为\(f(x)\),对于任给的\(\alpha\)(0<\(\alpha\)<1),称满足$$P(f(x)\ge Z_\alpha)$$的点\({Z_\alpha}\)为该分布函数的上侧\(\alpha\)分位数。

标准正态分布的上侧\(\alpha\)分位数\({Z_\alpha}\):

\[\alpha = P(\phi(x) \ge Z_\alpha) =\int_{Z_\alpha}^{+\infty}{\frac{1}{\sqrt{2\pi }}e^{-t^{2}/2}}dt
\]

分位数中\(\alpha\)代表概率,\({Z_\alpha}\)代表随机变量值,\(\alpha\)其实是随机变量大于\({Z_\alpha}\)的概率。分位数可以查标准正态分布表,在正态分布表中找\(\alpha\),对应查出\({Z_\alpha}\)。

二、标准正态分布表

标准正态分布表就是分位数表,有的是下侧分位数表,有的是上侧分位数表,这里采用上侧分位数建表。

#计算上侧分位数的概率
options(digits = 6)
u=seq(0,3.09,by=0.01)
p=pnorm(u)
m=matrix(p,ncol=10,byrow=TRUE)
m1=1-m
plot(u,dnorm(u),lwd=2,col="blue")
#head(m1)
#编辑了表头,行名表示分位数小数点后一位前的所有数,列名表示分位数小数点后第二位的数值。
[0.00] [0.01] [0.01] [0.03] [0.04] [0.05] [0.06] [0.07] [0.08] [0.09]
[0.0] 0.500000 0.496011 0.492022 0.488034 0.484047 0.480061 0.476078 0.472097 0.468119 0.464144
[0.1] 0.460172 0.456205 0.452242 0.448283 0.444330 0.440382 0.436441 0.432505 0.428576 0.424655
[0.2] 0.420740 0.416834 0.412936 0.409046 0.405165 0.401294 0.397432 0.393580 0.389739 0.385908
[0.3] 0.382089 0.378280 0.374484 0.370700 0.366928 0.363169 0.359424 0.355691 0.351973 0.348268
[0.4] 0.344578 0.340903 0.337243 0.333598 0.329969 0.326355 0.322758 0.319178 0.315614 0.312067
[0.5] 0.308538 0.305026 0.301532 0.298056 0.294599 0.291160 0.287740 0.284339 0.280957 0.277595
[0.6] 0.274253 0.270931 0.267629 0.264347 0.261086 0.257846 0.254627 0.251429 0.248252 0.245097
[0.7] 0.241964 0.238852 0.235762 0.232695 0.229650 0.226627 0.223627 0.220650 0.217695 0.214764
[0.8] 0.211855 0.208970 0.206108 0.203269 0.200454 0.197663 0.194895 0.192150 0.189430 0.186733
[0.9] 0.184060 0.181411 0.178786 0.176186 0.173609 0.171056 0.168528 0.166023 0.163543 0.161087
[1.0] 0.158655 0.156248 0.153864 0.151505 0.149170 0.146859 0.144572 0.142310 0.140071 0.137857
[1.1] 0.135666 0.133500 0.131357 0.129238 0.127143 0.125072 0.123024 0.121000 0.119000 0.117023
[1.2] 0.115070 0.113139 0.111232 0.109349 0.107488 0.105650 0.103835 0.102042 0.100273 0.098525
[1.3] 0.096800 0.095098 0.093418 0.091759 0.090123 0.088508 0.086915 0.085343 0.083793 0.082264
[1.4] 0.080757 0.079270 0.077804 0.076359 0.074934 0.073529 0.072145 0.070781 0.069437 0.068112
[1.5] 0.066807 0.065522 0.064255 0.063008 0.061780 0.060571 0.059380 0.058208 0.057053 0.055917
[1.6] 0.054799 0.053699 0.052616 0.051551 0.050503 0.049471 0.048457 0.047460 0.046479 0.045514
[1.7] 0.044565 0.043633 0.042716 0.041815 0.040930 0.040059 0.039204 0.038364 0.037538 0.036727
[1.8] 0.035930 0.035148 0.034380 0.033625 0.032884 0.032157 0.031443 0.030742 0.030054 0.029379
[1.9] 0.028717 0.028067 0.027429 0.026803 0.026190 0.025588 0.024998 0.024419 0.023852 0.023295
[2.0] 0.022750 0.022216 0.021692 0.021178 0.020675 0.020182 0.019699 0.019226 0.018763 0.018309
[2.1] 0.017864 0.017429 0.017003 0.016586 0.016177 0.015778 0.015386 0.015003 0.014629 0.014262
[2.2] 0.013903 0.013553 0.013209 0.012874 0.012545 0.012224 0.011911 0.011604 0.011304 0.011011
[2.3] 0.010724 0.010444 0.010170 0.009903 0.009642 0.009387 0.009137 0.008894 0.008656 0.008424
[2.4] 0.008198 0.007976 0.007760 0.007549 0.007344 0.007143 0.006947 0.006756 0.006569 0.006387
[2.5] 0.006210 0.006037 0.005868 0.005703 0.005543 0.005386 0.005234 0.005085 0.004940 0.004799
[2.6] 0.004661 0.004527 0.004396 0.004269 0.004145 0.004025 0.003907 0.003793 0.003681 0.003573
[2.7] 0.003467 0.003364 0.003264 0.003167 0.003072 0.002980 0.002890 0.002803 0.002718 0.002635
[2.8] 0.002555 0.002477 0.002401 0.002327 0.002256 0.002186 0.002118 0.002052 0.001988 0.001926
[2.9] 0.001866 0.001807 0.001750 0.001695 0.001641 0.001589 0.001538 0.001489 0.001441 0.001395
[3.0] 0.001350 0.001306 0.001264 0.001223 0.001183 0.001144 0.001107 0.001070 0.001035 0.001001

例1: 查\(Z_{0.025}\)值,打开正态分布表,刚好能查到0.025对应的Z值为1.96,故\(Z_{0.025}\)=1.96;如果要查\(Z_{\alpha}\)=1.64对应的α值,那么打开正态分布表,可得\(\alpha\)=0.05(近似值或附近平均值)。

例2:查\(Z_{0.95}\)的值,可先查\(Z_{0.05}\),完了根据对称性转化即可,得\(Z_{0.95}\)=-1.64。

三、总结

作为统计学的基础,我们会主要注重思维理解,复杂的数学计算在此略去。这并非意味着数学不重要,对数学的仔细专研恰恰会特别辅助理解和掌握。正态分布在统计中是非常常用的分布,例如在医学上,可以应用正态分布估计人体的某些生理指标,比如白细胞数的正常值范围,白细胞数在正常人群中近似服从正态分布。可以制定一个上限和下限,比如95%的人在正常范围之内,而超出这一范围的人,我们就认为需要对其进行特殊关注。还要注意:正态分布并不普适,有许多数据与正态拟合不好的情况,但我们仍可以利用其一些性质对数据进行一定的估计,以应对生产生活需要。在科研数据处理中要有选择性的择合适的方法(如其t分布等)进行检验;在数据处理时,正态分布也可以通过标准化处理,转化为标准正态分布。使用z=(X-μ)/σ将原始数据转化为标准分数。

参考文献

1.(一文搞懂“正态分布”所有重要知识点)[https://baijiahao.baidu.com/s?id=1681320912172746994&wfr=spider&for=pc]

2. (拓端tecdat|如何用R语言绘制生成正态分布图表)[https://blog.csdn.net/qq_19600291/article/details/105019489]

标准正态分布表—R语言的更多相关文章

  1. 标准正态分布表(scipy.stats)

    0. 标准正态分布表与常用值 Z-score 是非标准正态分布标准化后的 x即 z=x−μσ" role="presentation">z=x−μσz=x−μσ 表 ...

  2. [C#] 查标准正态分布表

    C#里面要计算正态分布是一件比较麻烦的事情,一般是通过查表来实现的. static double[] ayZTFB = null; /// <summary> /// 计算标准正态分布表 ...

  3. R语言编程艺术(2)R中的数据结构

    本文对应<R语言编程艺术>第2章:向量:第3章:矩阵和数组:第4章:列表:第5章:数据框:第6章:因子和表 ======================================== ...

  4. C语言产生标准正态分布或高斯分布随机数

    C语言 产生标准正态分布或高斯分布 随机数 产生正态分布或高斯分布的三种方法: 1. 运用中心极限定理(大数定理) #include #include #define NSUM 25 double g ...

  5. 机器学习与R语言

    此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...

  6. 数据分析与R语言

    数据结构 创建向量和矩阵 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 函数mean(), sum(), min(), m ...

  7. R语言各种假设检验实例整理(常用)

    一.正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知.现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264  ...

  8. R语言手册

    在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built bas ...

  9. R语言函数总结(转)

    R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...

  10. 【R语言学习】时间序列

    时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() st ...

随机推荐

  1. WinCC插件制作教程

    目录 插件的编写 插件的使用 参考资料 Creation of .NET Controls 109759944_Prepare.NetControls_DOC_en.pdf 插件的编写 创建插件项目, ...

  2. Yarn API

    Yarn API: 1. 查询整个yarn集群指标: GET http://{cluster_domain_name}|{rm_ip:8088}/ws/v1/metrics 2. 查看指定队列的所有任 ...

  3. Logtxt

    public static void SSOAuthenLog(string msg, bool isRemoteAuthen = true)        {            #region  ...

  4. hdu:Shape of HDU(判断多边形凹凸)

    Problem Description话说上回讲到海东集团推选老总的事情,最终的结果是XHD以微弱优势当选,从此以后,"徐队"的称呼逐渐被"徐总"所取代,海东集 ...

  5. 9.22 2020 实验 3:Mininet 实验——测量路径的损耗率

    一.实验目的 在实验 2 的基础上进一步熟悉 Mininet 自定义拓扑脚本,以及与损耗率相关的设定:初步了解 Mininet 安装时自带的 POX 控制器脚本编写,测试路径损耗率.   二.实验任务 ...

  6. cmake使用boost静态库,错误提示 Could NOT find Boost (missing: Boost_INCLUDE_DIR) (Required is at least version "1.48")

    使用的是Cmake-gui 编译. 问题出在C盘路径下找不到 Boost ,是否需要把boost的路径添加到系统Path 中? 任然不能解决. 更改源码: 找到下面这几行代码(你可以搜索) messa ...

  7. 初次使用Sqoop报错,sqoop命令不能正常使用:hcatalog does not exist!accumulo does not exist!

    1.问题描述: (1)问题示例: [hadoop@master Tmp]$ sqoop  helpWarning: /home/grid/Sqoop/sqoop-1.4.7/../hcatalog d ...

  8. Unity各种功能实现之一:对话系统

    最近根据网上的教程学习了一下Unity中的对话系统,将其中一些关键点记录下来作为参考,以后可在此基础上添加更多功能. 1.UI部分的设置. 对话框由一个panel下面的text和image组成.can ...

  9. NFS存储安装配置

    一.NFS(Network File System)即网络文件系统,是FreeBSD支持的文件系统中的一种, 它允许网络中的计算机之间通过TCP/IP网络共享资源.在NFS的应用中,本地NFS的客 户 ...

  10. Vue父子组件传值.sync

    <template> <div class="content"> <btn :btnName.sync='num' ></btn> ...