置信区间-显著性-P-值
1.置信区间:误差范围(区间)在统计概率中就叫做置信区间;简单来说置信区间就是误差范围
我们用中括号[a,b]表示样本估计总体平均值的误差范围的区间,由于a和b的确切数值取决于你希望自己对于“该区间包含总体均值”这一结果具有可信程度,所以[a,b]被称为置信区间。
2.置信水平:我们选择这个置信区间,目的是为了让“a和b之间包含总体平均值”这一结果具有特定的概率,这个概率就称为置信水平。
蒙特卡罗模拟
1.蒙特卡罗模拟用于求事件的近似概率,它多次执行同一模拟,然后将结果进行平均。
2.用查表法替代计算的这种思想用途十分广泛,性能出现问题时,经常会采用这种方法,查表法是以空间换时间这种通用思想的一个典型列子。
3.模拟模型是描述性而非规定性的,它可以描叔出系统如何在给定的条件下运行,但不能告诉我们如何安排条件才能使系统运行的最好,模拟模型只会进行描述,不会进行优化,但这并不是说模拟不能作为优化过程的一部分,例如,寻找参数设定的最优集合时,经常使用模拟作为搜索过程的一部分。
模拟模型可以按照三个维度进行分类:
确定性与随机性
确定性模拟的行为完全由模型定义,重新运行模拟不会改变结果,随机性模拟在模型中引入了随机性,多次运行同一个模型会得到不同的结果
静态与动态
在静态模型中,时间的作用不大,在动态模型中,时间是个基本要素
离散与连续
在离散模型中,相关变量的值是可数的,例如所有值都是整数,在连续模型中,相关变量的值位于一个不可数集合中,例如实数集合。
补充
PyLab中提供了一个内置函数polyfit,它可以找出最小二乘拟合的近似解。
调用以下函数:
pylab.polyfit (observedXVals, observedYVals, n)
可以找出一组n阶多项式的系数,这个多项式就是定义在observedXVals和observedYVals这两个数组中的数据点的最优最小二乘拟合。
举例来说,调用以下函数:
pylab.polyfit(observedXVals,observedYVals, 1)
可以找出一条由多项式y = ax + b定义的直线,这里的a是直线的斜率,b是Y轴上的截距。在本例中,函数会返回一个带有两个浮点数的数组。同样,二次方程y = ax2+ bx + c可以定义一条抛物线。因此,调用以下函数:pylab.polyfit(observedXVals, observedYVals, 2)可以返回一个带有3个浮点数的数组
显著性
1.费希尔的检验显著性的方法总结如下:
(1)定义一个原假设和一个备择假设。原假设就是“布里斯托·洛奇博士根本品尝不出不同奶茶之间的区别”,备择假设仅当原假设是错误的时候才成立,例如,“布里斯托·洛奇博士可以品尝出奶茶之间的区别”;
(2)理解待评价样本的统计学假设。对于“奶茶测试”,费希尔假设布里斯托·洛奇博士对每一杯奶茶都可以做出独立判断;
(3)计算相关的检验统计量。在本例中,检验统计量就是布里斯托·洛奇博士给出正确答案的可能性;
(4)在原假设成立的情况下,推导出检验统计量的概率。在本例中,就是仅凭运气正确找出所有奶茶的概率,也就是0.014;
(5)确定这个概率是否足够小到可以使你放心地认为原假设是错的,即拒绝假设。这个能使你拒绝原假设的概率要事先决定好,一般为0.05或0.01
P-值
P-值的含义很容易被误解,它经常被认为是原假设为真的概率,但实际上不是。如果P-只很小,就意味着原假设为真的情况下,得到特定样本的可能性很小。
条件概率
1.构成贝叶斯推理的核心思想就是条件概率。
2.P(A|B)表示当B为真时,A为真的概率,它经常读作“给定B时,A的概率”
如果P(A)和P(B)是独立的,那么P(A|B) = P(A)
一般的,如果P(B)!= 0,则:P(A|B)=P(A+B)/P(B)
条件概率也在0到1之间
3.公式P(A|B,C)表示当B和C同时成立时,A成立的概率,假设B和C互不相关,那么通过条件概率的定义和独立概率的乘法法则可知:
P(A|B,C) = P(A,B,C)/P(B,C)
这里的P(A,B,C)表示A,B和C同时为真的概率。
同理,P(A,B|C)表示当C为真时,A和B同时为真的概率。假设A和B是互不相关的,那么:P(A,B|C) = P(A|C)*P(B|C)
贝叶斯定理
P(A|B) = P(A)*P(B|A) / P(B)
在贝叶斯统计中,概率测量的是可信度,贝叶斯定理表明了不考虑证据的可信度和考虑了证据的可信度之间的关系。公式等号左边的部分P(A|B)是后验概率,即考虑了B之后的A的可信度。后验概率定义为先验概率P(A)与证据B对A的支持度的乘积。支持度是A成立的情况下B成立的概率与不考虑A时B成立的概率的比值,即:P(B|A)/P(B)
置信区间-显著性-P-值的更多相关文章
- 统计学常用概念:T检验、F检验、卡方检验、P值、自由度
1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了一 ...
- T检验与F检验的区别_f检验和t检验的关系
1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了一 ...
- 通俗理解T检验和F检验
来源: http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总 ...
- 通俗理解T检验与F检验的区别【转】
转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错 ...
- Logistic 回归模型 第一遍阅读笔记
MLE :最大似然估计,求得的这套参数估计能够通过指定模型以最大概率在线样本观测数据 必须来自随机样本,自变量与因变量之间是线性关系 logistic 回归没有关于自变量分布的假设条件,自变量可以连续 ...
- 2019 study list
分析工具: (1)SQL select from where group by having order by limit 运算符(算数运算符+-*/.比较运算符>< ...
- SPSS分析技术:CMH检验(分层卡方检验);辛普森悖论,数据分析的谬误
SPSS分析技术:CMH检验(分层卡方检验):辛普森悖论,数据分析的谬误 只涉及两个分类变量的卡方检验有些时候是很局限的,因为混杂因素总是存在,如果不考虑混杂因素,得出的分析结论很可能是谬误的,这就是 ...
- 为什么在数据驱动的路上,AB 实验值得信赖?
在线AB实验成为当今互联网公司中必不可少的数据驱动的工具,很多公司把自己的应用来做一次AB实验作为数据驱动的试金石. 文 | 松宝 来自 字节跳动数据平台团队增长平台 在线AB实验成为当今互联网公司中 ...
- Fold Change和t分布
基因表达谱数据 基因表达谱可以用一个矩阵来表示,每一行代表一个基因,每一列代表一个样本(如图1).所有基因的表达谱数据在“gene_exp.txt”文件中存储,第一列为基因的entrez geneid ...
随机推荐
- kubernetes云平台管理实战: 集群部署(一)
一.环境规划 1.架构拓扑图 2.主机规划 3.软件版本 [root@k8s-master ~]# cat /etc/redhat-release CentOS Linux release 7.4.1 ...
- JS 正则中的命名捕获分组
假设你在一段陌生的代码中看到这样一个函数: function toLocalDate(date) { return date.replace(/(\d{2})-(\d{2})-(\d{4})/, &q ...
- Pipeline build step with parameters
build step https://jenkins.io/doc/pipeline/steps/pipeline-build-step/#build-build-a-job 一个任务的执行触发,另外 ...
- 运维工作笔记-------nginx的反向代理
1.nginx的反向代理意义 一般来说,我们在项目中,不会直接让项目服务器ip与外网做直接映射,这样一则是不安全,二是客户直接去访问项目服务器,对项目服务器带来的压力太大,从而导致项目运行速度变慢,程 ...
- UOJ #311「UNR #2」积劳成疾
需要锻炼$ DP$能力 UOJ #311 题意 等概率产生一个长度为$ n$且每个数在[1,n]间随机的数列 定义其价值为所有长度为$ k$的连续子数列的最大值的乘积 给定$ n,k$求所有合法数列的 ...
- Spring系列(二) Bean装配
创建应用对象之间协作关系的行为称为装配(wiring), 这也是DI的本质. Spring中装配Bean的方式 Spring提供了三种装配Bean的方式. 隐式的Bean发现机制和自动装配 Java ...
- 【easy】226. Invert Binary Tree 反转二叉树
/** * Definition for a binary tree node. * struct TreeNode { * int val; * TreeNode *left; * TreeNode ...
- css好看的银行卡号样式
.cardNo { font-size: 17px; font-family: menlo,tahoma; text-shadow: 1px 1px 2px #666; line-height: 18 ...
- 九.LNMP网站架构实践部署
期中集群架构-第九章-期中架构LNMP章节====================================================================== 01. LNMP ...
- 数位dp-入门模板题 hdu2089
#include<bits/stdc++.h> using namespace std; ][],n,m; void init(){//dp[i][j]:i位的数,最高位是j dp[][] ...