白话空间统计之四:P值和Z值(上):零如果
本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。
首先是空间统计里面非常神奇的两个值:P值和Z值。
要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。
首先,统计学里面。有一个叫做“零如果”的概念很厉害,一定要说说。
零如果(null hypothesis),有时候又称原如果,官方的解释是:指进行统计检验时预先建立的如果。也就是说,你在检验你的结果之前。先对这些结果如果一个数值区间,这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。
例如以下图所看到的:
如果你的计算结果落在-2到2之间,就表示你的如果是能够接受得。可是不在这个范围内,就说明消息小概率事件了。既然有小概率事件,就说明两种可能:1,你的如果有错误。2,出现了异常值。
这个奇妙的零如果有啥用呢?看以下这个样例:
我们来抛一枚硬币,(我发现统计学,特别是经典统计学最喜欢抛硬币了)。在丢之前,我们就已经设定了不管正反两面的概率都在50%左右。(实际上更接近48%——52%这个区间)那么假设我们丢出来的结果,出现了正面概率高达80%,而反面才出现了20%。那就是说。超出了我预设的范围,发生了小概率现象,那么这样的小概率现象就非常值得研究了,虾神个人觉得,假设出现了这样的情况,最大可能是这个硬币被做了手脚。
当然,还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。
(关于抛硬币的第二种思维方式,还能够看这篇文章:抛硬币的两种思维方式:
在经典统计里面,零如果觉得你统计计算的数据是符合某种概率的,那么在空间统计里面。零如果表示什么呢?
看以下这个样例:
假设说,A市在7月份发生了200起案件,理论上,不设定条件的话,这200起案件应该是平均的分布在A市的每一个区域的,可是实际上这是不可能的,我们会发现某些地区,案发率远远高于其它地区。
那么上面那个命题,最開始我们说明的,200起案件。平均分布在全市各个地方。就是所谓的“零如果”,在空间统计中,零如果指的就是空间位置在一定区域里面呈现全然随机(均匀)分布(在自然现象里面,均匀分布是极小概率才会出现的,基本上都能够忽略了。所以一般谈的就是全然随机)。
依照这种如果,我们就能够对整个城市的案件案发地点进行统计分析了,如果计算出来的结果,符合我们如果,那么就仅仅能说,这200起案件。发生的地点是随机的,没有聚集规律或者离散的规律。
在空间数据的分析中。有一个非常重要内容,就是知道数据分布是否有规律。
拿到一份数据的时候。第一时间,要了解的,就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据,那么一般来说,就没有啥分析研究的可能了。由于纯随机(全然随机)是无法预測也无法找到模式的,就像素数(素数在数轴上出现的位置就是全然随机的,无法找到不论什么规律和模式)。
所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。
那么怎样对随机如果进行推断呢?也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。
(未完待续)
白话空间统计之四:P值和Z值(上):零如果的更多相关文章
- 白话空间统计之:Moran's I(莫兰指数)
前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I. 首先,Moran's I这个东西.官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰 ...
- ArcGIS高程Z值的去除方法
在ArcGIS中,我们常用的几何类型有点.线.面.体(体,在涉及三维的情况下使用),但在这之外,可能会遇到带ZM的类型,如图所示,面ZM,它与面类似,但比面多两个字段. 在编辑中查看草图属性可看到Z值 ...
- 已知空间两点组成的直线求线上某点的Z值
已知空间两点组成的直线求线上某点的Z值,为什么会有这种看起来比较奇怪的求值需求呢?因为真正三维空间的几何计算是比较麻烦的,很多时候需要投影到二维,再反推到三维空间上去. 复习下空间直线方程:已知空间上 ...
- 已知空间三点组成的面求该面上某点的Z值
已知空间三点,那么可以就可以确定空间三点组成的平面.此时可以根据某一点的X值和Y值,来求取该点在平面上的Z值.这个过程对于求三角面片上某点的高程或者权值特别有用,其本身也可以看作一种线性插值. 其算法 ...
- Moran’s I空间统计中出现内存溢出的问题
在经济学.资源管理.生物地理学.政治地理学和人口统计等领域,经常会有如下的研究需求: 研究区域中的富裕区和贫困区之间的最清晰边界在哪里? 研究区域中存在可以找到异常消费模式的位置吗? 研究区域中意想不 ...
- Z-score(Z值)的意义--转载
http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://we ...
- 几何不能具有Z值
ArcEngine 复制要素Geometry时,产生 几何不能具有Z值 的异常 解决方法:http://forums.esri.com/Thread.asp?c=159&f=1707& ...
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
判断IFeatureClass图形是否含有Z值信息 IFeatureClass featureClass = this.pLayer.FeatureClass; string shapeFieldNa ...
- 统计某一字段等于不同值的个数的sql语句(分享)
本文介绍下,用一条sql语句统计某一字段等于不同值的个数,方法很独特,有需要的朋友参考下. 表t,数据: id type001 1001 0002 1001 ...
随机推荐
- Spring_对缓存的支持
使用SpringBoot开启缓存分为两步: 开启基于注解的缓存 标注缓存注解即可 如上就是一个简单的缓存示例 默认使用的是ConcurrentHashMap组件用来缓存的 package ustc.a ...
- aaaaa
svn://192.168.199.182/anti-counterfeiting/trunk svn://192.168.199.182/anti-ds/trunk/antifake-service ...
- PHP11 日期和时间
学习要点 UNIX时间戳 将其他格式的日期转成UNIX时间戳格式 基于UNIX时间戳的日期计算 获取并格式化输出日期 修改PHP的默认时间 微秒的使用 Unix时间戳 相关概念 Unix tim ...
- JavaSE-03 Java选择结构
学习要点 if选择结构 switch选择结构 if选择结构 单分支if选择结构 语法结构 应用场合 问题:如果王小强的Java考试成绩大于98分,小强就能获得一个iphone8作为奖励. 复杂条件下的 ...
- postman使用--批量执行测试用例和数据驱动
批量执行 在我们测试接口的时候,有时候希望执行所有的测试用例,前面讲的都是测试单个的接口,postman提供了我们批量执行接口的功能 点击Runner 然后我们点击run 执行完会统计出我们的结果,失 ...
- Ubuntu 18的网络配置
包括Ubuntu 18.04和18.10,设置为静态IP及DNS. sudo vim /etc/netplan/50-cloud-init.yaml network: ethernets: enp4s ...
- No-2.常用 Linux 命令的基本使用
常用 Linux 命令的基本使用 01. 学习 Linux 终端命令的原因 Linux 刚面世时并没有图形界面,所有的操作全靠命令完成,如 磁盘操作.文件存取.目录操作.进程管理.文件权限 设定等 在 ...
- Java中的枚举--Enumeration
之前并没有注意到枚举这个知识点,因为之前在项目中并没有使用过枚举,可能是项目并不是很复杂的原因吧,今天看张孝祥老师的讲解,觉得,这个枚举真的有很多值得学习的地方,探究一下枚举的设计原理,底层到底是怎么 ...
- RTMP协议研究
RTMP协议研究 1协议研究概述 协议设计和分析一直都是在工作遇到,正好在这里总结一下,说到协议,在这个网络的时代,没有人可以离开它了.他存在我们生活中的任何角落,只不过我们平时,并没有注意到它的存在 ...
- Ahoi2014&Jsoi2014 支线剧情
题目描述 题解: 每条边至少经过一次,说明经过下界为$1$. 然后套有源汇上下界最小费用可行流板子. 口胡一下. 此类问题的建图通式为: 1.假设原来的边流量上下界为$[l,r]$,那么在新图中建流量 ...