白话空间统计之四:P值和Z值(上):零如果
本来今天想要讲讲软件操作的,后来发现好像还有好几个重要的指标没有说,干脆等所有说完在讲操作吧。否则操作出来的结果会发现大量的“不明觉厉”。
首先是空间统计里面非常神奇的两个值:P值和Z值。
要说这两个值之前。还是要复习一下统计学的概念。毕竟空间统计的理论基础还是建立在经典统计学上面的。
首先,统计学里面。有一个叫做“零如果”的概念很厉害,一定要说说。
零如果(null hypothesis),有时候又称原如果,官方的解释是:指进行统计检验时预先建立的如果。也就是说,你在检验你的结果之前。先对这些结果如果一个数值区间,这个区间通常是符合某种概率分布的情况。如果你的真实结果偏离了你设定的区间。就表示发生了小概率事件。这样你原来的如果就不成立了。
例如以下图所看到的:
如果你的计算结果落在-2到2之间,就表示你的如果是能够接受得。可是不在这个范围内,就说明消息小概率事件了。既然有小概率事件,就说明两种可能:1,你的如果有错误。2,出现了异常值。
这个奇妙的零如果有啥用呢?看以下这个样例:
我们来抛一枚硬币,(我发现统计学,特别是经典统计学最喜欢抛硬币了)。在丢之前,我们就已经设定了不管正反两面的概率都在50%左右。(实际上更接近48%——52%这个区间)那么假设我们丢出来的结果,出现了正面概率高达80%,而反面才出现了20%。那就是说。超出了我预设的范围,发生了小概率现象,那么这样的小概率现象就非常值得研究了,虾神个人觉得,假设出现了这样的情况,最大可能是这个硬币被做了手脚。
当然,还有可能是出现硬币竖立了起来这样的极小概率的事情……这样的就得归类到异常值里面去了。
(关于抛硬币的第二种思维方式,还能够看这篇文章:抛硬币的两种思维方式:
在经典统计里面,零如果觉得你统计计算的数据是符合某种概率的,那么在空间统计里面。零如果表示什么呢?
看以下这个样例:
假设说,A市在7月份发生了200起案件,理论上,不设定条件的话,这200起案件应该是平均的分布在A市的每一个区域的,可是实际上这是不可能的,我们会发现某些地区,案发率远远高于其它地区。
那么上面那个命题,最開始我们说明的,200起案件。平均分布在全市各个地方。就是所谓的“零如果”,在空间统计中,零如果指的就是空间位置在一定区域里面呈现全然随机(均匀)分布(在自然现象里面,均匀分布是极小概率才会出现的,基本上都能够忽略了。所以一般谈的就是全然随机)。
依照这种如果,我们就能够对整个城市的案件案发地点进行统计分析了,如果计算出来的结果,符合我们如果,那么就仅仅能说,这200起案件。发生的地点是随机的,没有聚集规律或者离散的规律。
在空间数据的分析中。有一个非常重要内容,就是知道数据分布是否有规律。
拿到一份数据的时候。第一时间,要了解的,就是这份数据是不是有规律。由于有规律的数据才干进行更好的分析。而假设你拿到的这份数据是一份随机分布的数据,那么一般来说,就没有啥分析研究的可能了。由于纯随机(全然随机)是无法预測也无法找到模式的,就像素数(素数在数轴上出现的位置就是全然随机的,无法找到不论什么规律和模式)。
所谓的纯随机。也有三种可能。一种是你的如果是纯随机的。二是你要计算的数据本身是纯随机的。第三就是你要计算的数据与其周边数据的关系是纯随机。
那么怎样对随机如果进行推断呢?也就是说。你的结果是接受零如果还是拒绝零如果。这样的就能够通过P、Z两种值的结果来帮助我们进行推断。
(未完待续)
白话空间统计之四:P值和Z值(上):零如果的更多相关文章
- 白话空间统计之:Moran's I(莫兰指数)
前两天聊了空间统计学里面的两个经典概念,今天来说说第一篇文章留下的大坑:Moran's I. 首先,Moran's I这个东西.官方叫做:莫兰指数,是澳大利亚统计学家帕特里克·阿尔弗雷德·皮尔斯·莫兰 ...
- ArcGIS高程Z值的去除方法
在ArcGIS中,我们常用的几何类型有点.线.面.体(体,在涉及三维的情况下使用),但在这之外,可能会遇到带ZM的类型,如图所示,面ZM,它与面类似,但比面多两个字段. 在编辑中查看草图属性可看到Z值 ...
- 已知空间两点组成的直线求线上某点的Z值
已知空间两点组成的直线求线上某点的Z值,为什么会有这种看起来比较奇怪的求值需求呢?因为真正三维空间的几何计算是比较麻烦的,很多时候需要投影到二维,再反推到三维空间上去. 复习下空间直线方程:已知空间上 ...
- 已知空间三点组成的面求该面上某点的Z值
已知空间三点,那么可以就可以确定空间三点组成的平面.此时可以根据某一点的X值和Y值,来求取该点在平面上的Z值.这个过程对于求三角面片上某点的高程或者权值特别有用,其本身也可以看作一种线性插值. 其算法 ...
- Moran’s I空间统计中出现内存溢出的问题
在经济学.资源管理.生物地理学.政治地理学和人口统计等领域,经常会有如下的研究需求: 研究区域中的富裕区和贫困区之间的最清晰边界在哪里? 研究区域中存在可以找到异常消费模式的位置吗? 研究区域中意想不 ...
- Z-score(Z值)的意义--转载
http://blog.sina.com.cn/s/blog_72208a6a0101cdt1.html http://www.docin.com/p-350677620.html http://we ...
- 几何不能具有Z值
ArcEngine 复制要素Geometry时,产生 几何不能具有Z值 的异常 解决方法:http://forums.esri.com/Thread.asp?c=159&f=1707& ...
- 判断IFeatureClass图形是否含有Z值信息,若有为IPoint赋Z值
判断IFeatureClass图形是否含有Z值信息 IFeatureClass featureClass = this.pLayer.FeatureClass; string shapeFieldNa ...
- 统计某一字段等于不同值的个数的sql语句(分享)
本文介绍下,用一条sql语句统计某一字段等于不同值的个数,方法很独特,有需要的朋友参考下. 表t,数据: id type001 1001 0002 1001 ...
随机推荐
- aapt环境变量配置
D:\android-sdk_r24.4.1-windows\android-sdk-windows\build-tools\28.0.2 将aapt路径添加到path中, 打开cmd 输入aapt
- 1、C编程预备计算机知识
一.数据类型 基本数据类型 1.整数 整形 -- int -- 4 短整型 -- short int -- 2 长整型 -- long int --8 2.浮点数(实数) 单精度浮点数 -- floa ...
- VR技术在数据中心3D机房中的应用 (下)
VR技术在数据中心3D机房中的应用 (下) 前面给大家简单科普了一下VR的硬件设备以及VR在各个领域的应用,是不是觉得非常高大上?千言万语概括成一句话,VR能给用户带来前所未有的沉浸感和交互方式,让人 ...
- js多维数组扁平化
数组扁平化,就是将多维数组碾平为一维数组,方便使用. 一:例如,一个二维数组 var arr = ['a', ['b', 2], ['c', 3, 'x']],将其扁平化: 1. 通过 apply ...
- tiny4412学习笔记-将uboot、zImage、文件系统烧到emmc中 (转)
http://blog.chinaunix.net/uid-30025978-id-4788683.html 1.首先还是要将u-boot写入SD卡中从SD卡启动. 使用读卡器将SD插入电脑中,使用u ...
- Python开发环境之pyenv环境搭建
首先到Github上下载Pyenv相应的一键安装脚本, 安装完毕,设置环境变量,设置环境变量,可以添加到个人家目录的.bashrc或.bash_profile及系统的全局的/etc/profile, ...
- 第六天,字典Dictionary
字典(Dictionary)在Python中是一种可变的容器模型,它是通过一组键(key)值(value)对组成,这种结构类型通常也被称为映射,或者叫关联数组,也有叫哈希表的.每个key-value之 ...
- CSS3 pointer-events:none 让你摆脱事件的烦恼
以前没遇到这个属性,在一个偶然的博文下发现该属性真的好用,你是否遇到过写鼠标移入显示文本的效果时,鼠标在元素内的每一次移动都会造成要显示文本的闪烁或是突然的消失?只要在被控制的元素中加上这个属性完美解 ...
- Java 新手学习日记一
Java 基础知识点掌握: 数据类型 变量就是申请内存来存储值.也就是说,当创建变量的时候,需要在内存中申请空间.内存管理系统根据变量的类型为变量分配存储空间,分配的空间只能用来储存该类型数据. 因此 ...
- 大数据学习——Linux-SSH报错:Could not resolve hostname centos02: Temporary failure in name resolution
https://blog.csdn.net/mcb520wf/article/details/83303792 随笔异常 ssh: Could not resolve hostname centos0 ...