[Statistic] 置信度
背景
调研总体的情况时,常因调研成本等原因难以对总体情况逐一调研给出完全准确的结论。常以随机抽样的方式,通过统计样本估计总体。
单次随机抽样的结果可以看做是对总体结果的近似,但仍有不准确性。比如某次抽样的准确率为64.7%。
那么在不知道总体真实值的情况下,此次抽样结果是否可信呢?或者可以以多大的概率相信呢?
这就引入了“置信度”的度量指标。
计算方法
在不确定总体数据分布的条件下,是很难直接得到某一个抽样值对应的置信度的,(如果可以就相当于可以获取总体真实值了),但是可以通过统计的方法,获取抽样结果在某一区间的置信度。
比如,我们很难说 64.7%这个抽样统计值的置信度是多少,但是我们可以通过统计的方法获取 抽样值落在 63%~66%的概率有多大,即抽样统计值落在 63%~67%区间内的置信度是多少。
各个区间内的置信度如何获取呢?
如果进行多次随机抽样,会得到随机抽样结果的分布。如64.7%, 65.3%,63%,67%...
我们可以根据这些结果得到 随机抽样结果的概率分布图。那么
$$ 统计值落在给定区间(a, b] 的置信度 = 随机抽样结果在(a, b]内的个数 / 总的随机抽样结果个数 $$
ex. 总体有3亿,但每次抽样1000个样本进行统计,抽样100次,其中抽样准确率在 (63%, 66%]的个数有80个,那么可以说,抽样结果在 (63%, 66%] 的置信度为80%。
如果某次抽样结果为64.7%,是落在(63%, 66%] 范围内的,那么可以说,我们以 80%的置信度认为 总体的准确率为64.7%。
参考链接:
1. 机器之心:https://baijiahao.baidu.com/s?id=1596169784713150436&wfr=spider&for=pc
2. 原文链接:https://towardsdatascience.com/a-very-friendly-introduction-to-confidence-intervals-9add126e714
[Statistic] 置信度的更多相关文章
- 置信度&置信水平&置信区间
置信水平是指总体参数值落在样本统计值某一区内的概率:而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围.置信区间越大,置信水平越高. 例如:估计某件事件完成会在10~12日之间,但这个估 ...
- AngularJS in Action读书笔记4(实战篇)——创建Statistic模块
个人感觉<Angularjs in action>这本书写的很好,很流畅,循序渐进,深入浅出,关键是结合了一个托管于Github上的实例讲解的,有代码可查,对于初学者应该是个不错的途径.( ...
- SPOJ ORDERSET - Order statistic set
ORDERSET - Order statistic set In this problem, you have to maintain a dynamic set of numbers whic ...
- What is a Statistic?
from: https://controls.engin.umich.edu/wiki/index.php/Basic_statistics:_mean,_median,_average,_stand ...
- codeforces 675E E. Trains and Statistic(线段树+dp)
题目链接: E. Trains and Statistic time limit per test 2 seconds memory limit per test 256 megabytes inpu ...
- 支持度(support)和置信度(confidence)
支持度(Support)的公式是:Support(A->B)=P(A U B).支持度揭示了A与B同时出现的概率.如果A与B同时出现的概率小,说明A与B的关系不大:如果A与B同时出现的非常频 ...
- 【Android Studio安装部署系列】四十、Android Studio安装Statistic插件(统计项目总行数)
版权声明:本文为HaiyuKing原创文章,转载请注明出处! 概述 Android Studio 是没有提提供统计代码全部行数的功能的,但是对于开发者来说,这个功能确实必备的,Statistic统计代 ...
- [DUBBO] Unexpected error occur at send statistic, cause: Forbid consumer 192.168.3.151 access servic
[DUBBO] Unexpected error occur at send statistic, cause: Forbid consumer 192.168.3.151 access servic ...
- Oracle Statistic 统计信息 小结
oraclestatisticstabledatabasesqldictionary 目录(?)[-] 直方图上列的信息说明 直方图类型说明 一. Statistic 说明 Oracle 官 ...
随机推荐
- 第15.22节 PyQt(Python+Qt)入门学习:Model/View架构详解
老猿Python博文目录 专栏:使用PyQt开发图形界面Python应用 老猿Python博客地址 一.简介 在PyQt和Qt中,Model/View架构是图形界面开发时用于管理数据和界面展现方式的关 ...
- es6交换两个值
let a='a',b='b' let [a,b]=[b,a];//借助数组解构 let {a:b,b:a}={a,b}//利用别名进行对象解构
- GYM101889J Jumping frog
突然发现题刷累了写写题解还是满舒服的 题目大意: 给你一个只包含 \(R\) , \(P\) ,长度为 \(n\) 的字符串( \(3\le n\le 10^5\) ).你可以选择一个跳跃距离 \(l ...
- Java使用hasNext()输入不定长数组
1 Scanner scan = new Scanner(System.in); 2 String s = scan.nextLine(); 3 Scanner sc = new Scanner(s) ...
- 新挖个坑,准备学习一下databricks的spark博客
挖坑 https://databricks.com/blog 一.spark3.0特性(Introducing Apache Spark 3.0) 1.通过通过自适应查询执行,动态分区修剪和其他优化使 ...
- WebService-问题
1.引用问题 在用C#对接webservice的时候,常用的方法是下载vs中引用webservice的地址.然后,new对应的client就可以使用了.但在,实际应用中往往会遇到webservice访 ...
- 哔哩哔哩批量采集器(支持windows和mac)
链接:https://pan.baidu.com/s/1jW2ea0Cl1xL5xN9DuB8Fcw 密码:klyw
- 带宽、延时、吞吐率、PPS 这些都是啥?
Linux 网络协议栈是根据 TCP/IP 模型来实现的,TCP/IP 模型由应用层.传输层.网络层和网络接口层,共四层组成,每一层都有各自的职责. 应用程序要发送数据包时,通常是通过 socket ...
- 使用Spark的newAPIHadoopRDD接口访问有kerberos认证的hbase
使用newAPIHadoopRDD接口访问hbase数据,网上有很多可以参考的例子,但是由于环境使用了kerberos安全加固,spark使用有kerberos认证的hbase,网上的参考资料不多,访 ...
- PHP可变变量特性
可变变量 有时候使用可变变量名是很方便的.就是说,一个变量的变量名可以动态的设置和使用.一个普通的变量通过声明来设置,例如: <?php$a = 'hello';?> 一个可变变量获取了一 ...