白话空间统计之四:P值和Z值(上):零如果
本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。
首先是空间统计里面非常神奇的两个值:P值和Z值。
要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。
首先,统计学里面。有一个叫做“零如果”的概念很厉害,一定要说说。
零如果(null hypothesis),有时候又称原如果,官方的解释是:指进行统计检验时预先建立的如果。也就是说,你在检验你的结果之前。先对这些结果如果一个数值区间,这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。
例如以下图所看到的:
如果你的计算结果落在-2到2之间,就表示你的如果是能够接受得。可是不在这个范围内,就说明消息小概率事件了。既然有小概率事件,就说明两种可能:1,你的如果有错误。2,出现了异常值。
这个奇妙的零如果有啥用呢?看以下这个样例:
我们来抛一枚硬币,(我发现统计学,特别是经典统计学最喜欢抛硬币了)。在丢之前,我们就已经设定了不管正反两面的概率都在50%左右。(实际上更接近48%——52%这个区间)那么假设我们丢出来的结果,出现了正面概率高达80%,而反面才出现了20%。那就是说。超出了我预设的范围,发生了小概率现象,那么这样的小概率现象就非常值得研究了,虾神个人觉得,假设出现了这样的情况,最大可能是这个硬币被做了手脚。
当然,还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。
(关于抛硬币的第二种思维方式,还能够看这篇文章:抛硬币的两种思维方式:
在经典统计里面,零如果觉得你统计计算的数据是符合某种概率的,那么在空间统计里面。零如果表示什么呢?
看以下这个样例:
假设说,A市在7月份发生了200起案件,理论上,不设定条件的话,这200起案件应该是平均的分布在A市的每一个区域的,可是实际上这是不可能的,我们会发现某些地区,案发率远远高于其它地区。
那么上面那个命题,最開始我们说明的,200起案件。平均分布在全市各个地方。就是所谓的“零如果”,在空间统计中,零如果指的就是空间位置在一定区域里面呈现全然随机(均匀)分布(在自然现象里面,均匀分布是极小概率才会出现的,基本上都能够忽略了。所以一般谈的就是全然随机)。
依照这种如果,我们就能够对整个城市的案件案发地点进行统计分析了,如果计算出来的结果,符合我们如果,那么就仅仅能说,这200起案件。发生的地点是随机的,没有聚集规律或者离散的规律。
在空间数据的分析中。有一个非常重要内容,就是知道数据分布是否有规律。
拿到一份数据的时候。第一时间,要了解的,就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据,那么一般来说,就没有啥分析研究的可能了。由于纯随机(全然随机)是无法预測也无法找到模式的,就像素数(素数在数轴上出现的位置就是全然随机的,无法找到不论什么规律和模式)。
所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。
那么怎样对随机如果进行推断呢?也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。
(未完待续)
白话空间统计之四:P值和Z值(上):零如果的更多相关文章
- 白话空间统计之:Moran's I(莫兰指数)
前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I. 首先,Moran's I这个东西.官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰 ...
- ArcGIS高程Z值的去除方法
在ArcGIS中,我们常用的几何类型有点.线.面.体(体,在涉及三维的情况下使用),但在这之外,可能会遇到带ZM的类型,如图所示,面ZM,它与面类似,但比面多两个字段. 在编辑中查看草图属性可看到Z值 ...
- 已知空间两点组成的直线求线上某点的Z值
已知空间两点组成的直线求线上某点的Z值,为什么会有这种看起来比较奇怪的求值需求呢?因为真正三维空间的几何计算是比较麻烦的,很多时候需要投影到二维,再反推到三维空间上去. 复习下空间直线方程:已知空间上 ...
- 已知空间三点组成的面求该面上某点的Z值
已知空间三点,那么可以就可以确定空间三点组成的平面.此时可以根据某一点的X值和Y值,来求取该点在平面上的Z值.这个过程对于求三角面片上某点的高程或者权值特别有用,其本身也可以看作一种线性插值. 其算法 ...
- Moran’s I空间统计中出现内存溢出的问题
在经济学.资源管理.生物地理学.政治地理学和人口统计等领域,经常会有如下的研究需求: 研究区域中的富裕区和贫困区之间的最清晰边界在哪里? 研究区域中存在可以找到异常消费模式的位置吗? 研究区域中意想不 ...
- Z-score(Z值)的意义--转载
http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://we ...
- 几何不能具有Z值
ArcEngine 复制要素Geometry时,产生 几何不能具有Z值 的异常 解决方法:http://forums.esri.com/Thread.asp?c=159&f=1707& ...
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
判断IFeatureClass图形是否含有Z值信息 IFeatureClass featureClass = this.pLayer.FeatureClass; string shapeFieldNa ...
- 统计某一字段等于不同值的个数的sql语句(分享)
本文介绍下,用一条sql语句统计某一字段等于不同值的个数,方法很独特,有需要的朋友参考下. 表t,数据: id type001 1001 0002 1001 ...
随机推荐
- 16.04 下修改 ssh 默认端口
打开/etc/ssh/ssh_config,在Port指令下追加新的端口设置: Port 8888 即允许通过端口 8888 进行 ssh 访问. 打开/etc/ssh/sshd_config,进行同 ...
- android滚动图片
关于广告轮播,大家肯定不会陌生,它在现手机市场各大APP出现的频率极高,它的优点在于"不占屏",可以仅用小小的固定空位来展示几个甚至几十个广告条,而且动态效果很好,具有很好的用户& ...
- 获得Dictionary所有key和value值
Dictionary<string, string> dc = new Dictionary<string, string>(); dc.Add("code" ...
- DB2数据库在线备份还原
DB2在线备份设置方法: 第一步:开启归档日志 db2 update db cfg for TEST_DB using logretain on 第二步:重启数据库 第三步:进行一次离线备份 db2 ...
- Django框架基础知识10-内置分页系统
from django.shortcuts import render, redirect, reversefrom datetime import datetime# Create your vie ...
- linux网络原理
1.ipconfig命令使用 显示所有正在启动的网卡的详细信息或设定系统中网卡的IP地址. 某一块网卡信息 打开或者关闭某一块网卡 2.ifup和ifdown ifup和ifdown分别是加载网卡信息 ...
- 剑指Offer(书):用两个栈实现队列
题目:用两个栈来实现一个队列,完成队列的Push和Pop操作. 队列中的元素为int类型. 分析:入栈时只入栈1,出栈为栈2:若栈2不为空,直接出栈:否则,将栈1中的值依次入栈2,之后栈2出栈 Sta ...
- 【02】使用Firebug查看和编辑HTML和CSS
使用Firebug查看和编辑HTML和CSS 描述 在本章节的教程中,我们将讨论如何使用Firebug查看和编辑HTML和CSS. 使用Firebug查看和编辑HTML 在你要查看的元素上右击鼠标然后 ...
- 【06】sass编译工具(弃)
[06]编译工具(弃) SASS转译工具 除了使用sass命令来转译SASS文件之外,还可以借助第三方工具完成,目前世面上较为流行的转译工具主要有: Compass.app Scout Codekit ...
- coraldraw快捷键
显示导航窗口(Navigator window) [N] 运行 Visual Basic 应用程序的编辑器 [Alt]+[F11] 保存当前的图形 [Ctrl]+[S] 打开编辑文本对话框 ...