标准正态分布表—R语言
正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。
一、标准正态分布
标准正态分布是正态分布的标准化。正态分布是一个在数学,物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
1.1 正态分布
若随机变量\(X\)服从一个数学期望为\(\mu\)、方差为\(\sigma^2\)的正态分布,记为\(X∼N(\mu,{\sigma}^2)\),英文命名为Normal distribution,也就是典范规范分布。其概率密度函数为正态分布的期望值\(\mu\)决定了其位置,其标准差\(\sigma\)决定了分布的幅度,如下图所示。
它的密度函数为
\]
该密度函数包含两个最重要的数学常量:自然对数的底数\(e\)和圆周率\(\pi\)。参数\(\mu,\sigma^2\)有明确的含义,分别是该分布的均值和方差。同时它的密度函数曲线如上图所示,被称为钟形曲线。
它的分布函数为
\]
1.2 正态分布的性质
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。
1.3 标准正态分布
在正态分布函数中,当 \(\mu =0,\sigma =1\)时,就服从标准正态分布,标准正态分布概率密度函数为:
\]
\]
基于正态分布的对称性,当\(x\lt 0\)时,有
\]
后面仅考虑\(x\gt 0\)的情形。
正态分布的标准化
正态分布可通过变换$$Z=\frac{X-\mu}{\sigma }$$化为标准正态分布。
正态分布的\(3\sigma\)区域
1.4 正态分布的上侧\(\alpha\)分位数
设X的密度函数为\(f(x)\),对于任给的\(\alpha\)(0<\(\alpha\)<1),称满足$$P(f(x)\ge Z_\alpha)$$的点\({Z_\alpha}\)为该分布函数的上侧\(\alpha\)分位数。
标准正态分布的上侧\(\alpha\)分位数\({Z_\alpha}\):
\]
分位数中\(\alpha\)代表概率,\({Z_\alpha}\)代表随机变量值,\(\alpha\)其实是随机变量大于\({Z_\alpha}\)的概率。分位数可以查标准正态分布表,在正态分布表中找\(\alpha\),对应查出\({Z_\alpha}\)。
二、标准正态分布表
标准正态分布表就是分位数表,有的是下侧分位数表,有的是上侧分位数表,这里采用上侧分位数建表。
#计算上侧分位数的概率
options(digits = 6)
u=seq(0,3.09,by=0.01)
p=pnorm(u)
m=matrix(p,ncol=10,byrow=TRUE)
m1=1-m
plot(u,dnorm(u),lwd=2,col="blue")
#head(m1)
#编辑了表头,行名表示分位数小数点后一位前的所有数,列名表示分位数小数点后第二位的数值。
[0.00] [0.01] [0.01] [0.03] [0.04] [0.05] [0.06] [0.07] [0.08] [0.09]
[0.0] 0.500000 0.496011 0.492022 0.488034 0.484047 0.480061 0.476078 0.472097 0.468119 0.464144
[0.1] 0.460172 0.456205 0.452242 0.448283 0.444330 0.440382 0.436441 0.432505 0.428576 0.424655
[0.2] 0.420740 0.416834 0.412936 0.409046 0.405165 0.401294 0.397432 0.393580 0.389739 0.385908
[0.3] 0.382089 0.378280 0.374484 0.370700 0.366928 0.363169 0.359424 0.355691 0.351973 0.348268
[0.4] 0.344578 0.340903 0.337243 0.333598 0.329969 0.326355 0.322758 0.319178 0.315614 0.312067
[0.5] 0.308538 0.305026 0.301532 0.298056 0.294599 0.291160 0.287740 0.284339 0.280957 0.277595
[0.6] 0.274253 0.270931 0.267629 0.264347 0.261086 0.257846 0.254627 0.251429 0.248252 0.245097
[0.7] 0.241964 0.238852 0.235762 0.232695 0.229650 0.226627 0.223627 0.220650 0.217695 0.214764
[0.8] 0.211855 0.208970 0.206108 0.203269 0.200454 0.197663 0.194895 0.192150 0.189430 0.186733
[0.9] 0.184060 0.181411 0.178786 0.176186 0.173609 0.171056 0.168528 0.166023 0.163543 0.161087
[1.0] 0.158655 0.156248 0.153864 0.151505 0.149170 0.146859 0.144572 0.142310 0.140071 0.137857
[1.1] 0.135666 0.133500 0.131357 0.129238 0.127143 0.125072 0.123024 0.121000 0.119000 0.117023
[1.2] 0.115070 0.113139 0.111232 0.109349 0.107488 0.105650 0.103835 0.102042 0.100273 0.098525
[1.3] 0.096800 0.095098 0.093418 0.091759 0.090123 0.088508 0.086915 0.085343 0.083793 0.082264
[1.4] 0.080757 0.079270 0.077804 0.076359 0.074934 0.073529 0.072145 0.070781 0.069437 0.068112
[1.5] 0.066807 0.065522 0.064255 0.063008 0.061780 0.060571 0.059380 0.058208 0.057053 0.055917
[1.6] 0.054799 0.053699 0.052616 0.051551 0.050503 0.049471 0.048457 0.047460 0.046479 0.045514
[1.7] 0.044565 0.043633 0.042716 0.041815 0.040930 0.040059 0.039204 0.038364 0.037538 0.036727
[1.8] 0.035930 0.035148 0.034380 0.033625 0.032884 0.032157 0.031443 0.030742 0.030054 0.029379
[1.9] 0.028717 0.028067 0.027429 0.026803 0.026190 0.025588 0.024998 0.024419 0.023852 0.023295
[2.0] 0.022750 0.022216 0.021692 0.021178 0.020675 0.020182 0.019699 0.019226 0.018763 0.018309
[2.1] 0.017864 0.017429 0.017003 0.016586 0.016177 0.015778 0.015386 0.015003 0.014629 0.014262
[2.2] 0.013903 0.013553 0.013209 0.012874 0.012545 0.012224 0.011911 0.011604 0.011304 0.011011
[2.3] 0.010724 0.010444 0.010170 0.009903 0.009642 0.009387 0.009137 0.008894 0.008656 0.008424
[2.4] 0.008198 0.007976 0.007760 0.007549 0.007344 0.007143 0.006947 0.006756 0.006569 0.006387
[2.5] 0.006210 0.006037 0.005868 0.005703 0.005543 0.005386 0.005234 0.005085 0.004940 0.004799
[2.6] 0.004661 0.004527 0.004396 0.004269 0.004145 0.004025 0.003907 0.003793 0.003681 0.003573
[2.7] 0.003467 0.003364 0.003264 0.003167 0.003072 0.002980 0.002890 0.002803 0.002718 0.002635
[2.8] 0.002555 0.002477 0.002401 0.002327 0.002256 0.002186 0.002118 0.002052 0.001988 0.001926
[2.9] 0.001866 0.001807 0.001750 0.001695 0.001641 0.001589 0.001538 0.001489 0.001441 0.001395
[3.0] 0.001350 0.001306 0.001264 0.001223 0.001183 0.001144 0.001107 0.001070 0.001035 0.001001
例1: 查\(Z_{0.025}\)值,打开正态分布表,刚好能查到0.025对应的Z值为1.96,故\(Z_{0.025}\)=1.96;如果要查\(Z_{\alpha}\)=1.64对应的α值,那么打开正态分布表,可得\(\alpha\)=0.05(近似值或附近平均值)。
例2:查\(Z_{0.95}\)的值,可先查\(Z_{0.05}\),完了根据对称性转化即可,得\(Z_{0.95}\)=-1.64。
三、总结
作为统计学的基础,我们会主要注重思维理解,复杂的数学计算在此略去。这并非意味着数学不重要,对数学的仔细专研恰恰会特别辅助理解和掌握。正态分布在统计中是非常常用的分布,例如在医学上,可以应用正态分布估计人体的某些生理指标,比如白细胞数的正常值范围,白细胞数在正常人群中近似服从正态分布。可以制定一个上限和下限,比如95%的人在正常范围之内,而超出这一范围的人,我们就认为需要对其进行特殊关注。还要注意:正态分布并不普适,有许多数据与正态拟合不好的情况,但我们仍可以利用其一些性质对数据进行一定的估计,以应对生产生活需要。在科研数据处理中要有选择性的择合适的方法(如其t分布等)进行检验;在数据处理时,正态分布也可以通过标准化处理,转化为标准正态分布。使用z=(X-μ)/σ将原始数据转化为标准分数。
参考文献
1.(一文搞懂“正态分布”所有重要知识点)[https://baijiahao.baidu.com/s?id=1681320912172746994&wfr=spider&for=pc]
2. (拓端tecdat|如何用R语言绘制生成正态分布图表)[https://blog.csdn.net/qq_19600291/article/details/105019489]
标准正态分布表—R语言的更多相关文章
- 标准正态分布表(scipy.stats)
0. 标准正态分布表与常用值 Z-score 是非标准正态分布标准化后的 x即 z=x−μσ" role="presentation">z=x−μσz=x−μσ 表 ...
- [C#] 查标准正态分布表
C#里面要计算正态分布是一件比较麻烦的事情,一般是通过查表来实现的. static double[] ayZTFB = null; /// <summary> /// 计算标准正态分布表 ...
- R语言编程艺术(2)R中的数据结构
本文对应<R语言编程艺术>第2章:向量:第3章:矩阵和数组:第4章:列表:第5章:数据框:第6章:因子和表 ======================================== ...
- C语言产生标准正态分布或高斯分布随机数
C语言 产生标准正态分布或高斯分布 随机数 产生正态分布或高斯分布的三种方法: 1. 运用中心极限定理(大数定理) #include #include #define NSUM 25 double g ...
- 机器学习与R语言
此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...
- 数据分析与R语言
数据结构 创建向量和矩阵 函数c(), length(), mode(), rbind(), cbind() 求平均值,和,连乘,最值,方差,标准差 函数mean(), sum(), min(), m ...
- R语言各种假设检验实例整理(常用)
一.正态分布参数检验 例1. 某种原件的寿命X(以小时计)服从正态分布N(μ, σ)其中μ, σ2均未知.现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 ...
- R语言手册
在R的官方教程里是这么给R下注解的:一个数据分析和图形显示的程序设计环境(A system for data analysis and visualization which is built bas ...
- R语言函数总结(转)
R语言特征 对大小写敏感 通常,数字,字母,. 和 _都是允许的(在一些国家还包括重音字母).不过,一个命名必须以 . 或者字母开头,并且如果以 . 开头,第二个字符不允许是数字. 基本命令要么是表达 ...
- 【R语言学习】时间序列
时序分析会用到的函数 函数 程序包 用途 ts() stats 生成时序对象 plot() graphics 画出时间序列的折线图 start() stats 返回时间序列的开始时间 end() st ...
随机推荐
- WinCC插件制作教程
目录 插件的编写 插件的使用 参考资料 Creation of .NET Controls 109759944_Prepare.NetControls_DOC_en.pdf 插件的编写 创建插件项目, ...
- Yarn API
Yarn API: 1. 查询整个yarn集群指标: GET http://{cluster_domain_name}|{rm_ip:8088}/ws/v1/metrics 2. 查看指定队列的所有任 ...
- Logtxt
public static void SSOAuthenLog(string msg, bool isRemoteAuthen = true) { #region ...
- hdu:Shape of HDU(判断多边形凹凸)
Problem Description话说上回讲到海东集团推选老总的事情,最终的结果是XHD以微弱优势当选,从此以后,"徐队"的称呼逐渐被"徐总"所取代,海东集 ...
- 9.22 2020 实验 3:Mininet 实验——测量路径的损耗率
一.实验目的 在实验 2 的基础上进一步熟悉 Mininet 自定义拓扑脚本,以及与损耗率相关的设定:初步了解 Mininet 安装时自带的 POX 控制器脚本编写,测试路径损耗率. 二.实验任务 ...
- cmake使用boost静态库,错误提示 Could NOT find Boost (missing: Boost_INCLUDE_DIR) (Required is at least version "1.48")
使用的是Cmake-gui 编译. 问题出在C盘路径下找不到 Boost ,是否需要把boost的路径添加到系统Path 中? 任然不能解决. 更改源码: 找到下面这几行代码(你可以搜索) messa ...
- 初次使用Sqoop报错,sqoop命令不能正常使用:hcatalog does not exist!accumulo does not exist!
1.问题描述: (1)问题示例: [hadoop@master Tmp]$ sqoop helpWarning: /home/grid/Sqoop/sqoop-1.4.7/../hcatalog d ...
- Unity各种功能实现之一:对话系统
最近根据网上的教程学习了一下Unity中的对话系统,将其中一些关键点记录下来作为参考,以后可在此基础上添加更多功能. 1.UI部分的设置. 对话框由一个panel下面的text和image组成.can ...
- NFS存储安装配置
一.NFS(Network File System)即网络文件系统,是FreeBSD支持的文件系统中的一种, 它允许网络中的计算机之间通过TCP/IP网络共享资源.在NFS的应用中,本地NFS的客 户 ...
- Vue父子组件传值.sync
<template> <div class="content"> <btn :btnName.sync='num' ></btn> ...