◆描述性统计分析

概念:描述性统计分析方法是指应用分类、制表、图形及概括性数据指标(去均值,方差等)来概括数据分布特征的方法。

   而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总体的数据分析方法统计上需要把样本数据所御寒信息进行概括,融合和抽象,

   从而得到反映样本数据的综合指标。这些指标称为统计量。描述数据特征的统计量可分为两类:一类表示数据的中心位置,

   如均值,中位数,众数等,另一类表示数据的离散程度,如方差,标准差,极差等用来衡量个体偏离中心的程度在描述定性观测知识,

   有时候我们需要把这些指按照某种原则分成一些组或者类,使得每个观测值必须且只能落入一个类中。对于给定的类,落入这个类的个案数称为频率,落入该类中的个案数和个案总数的比例称为相对频率。

频率分析主要通过频率分布表,条形图,饼图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

◆中心趋势的描述

概念:中心趋势是指以组数据向某个中心值靠拢的倾向。描述数据分布的中心位置的统计量称为位置统计量。

     对于连续变量和定序变量,描述数据中心趋势的指标有均值,中位数,众数,5%截尾均值,

     对于定性数据,描述数据中心趋势的指标只有众数。

     SPSS中把变量分为三个水平,分别为尺度变量,定序变量,名义变量。

◆均值

概念:均值一般是指数据的算术均值。数据的均值容易受极端值的影响。

◆5%截尾均值

概念:把观测值按照从小到大顺序排序,剔除掉排序后的数据序列两端的部分数字后计算得到的均值称为截尾均值,避免了极端值的影响。

◆几何均值

概念:几何均值又称几何平均数。它是样本数据连乘后得到的积开N次方得到的 计算机和平均数要求各观察值之间存在连乘关系,

    并且各个观察值的连乘积必须具有实际意义,它主要用于相对数数列,他要求样本数和算术平均值相比较,几何平均数应用范围较窄。

◆中位数

概念:将观测值按照从小到大的顺序排列,位于中间位置的数值称为中位数。

中位数受极端值的影响较小,在具有极大和极小值的数据中,中位数比均值往往更能代表数据的集中趋势。

◆众数

概念:众数是观测值中出现次数最多的数值,其反映了这组观测值的集中趋势。不受极端值影响。可能有多个众数离散趋势的描述。

◆极差

概念: 数据的观测值中的最大值与最小值之差反映了数据的波动情况。该差称为极差或者全距,容易受极端值影响。

◆方差和标准差

概念: 标准差用来度量观测值偏离平均数的大小,相当于平均偏差,可以直接描述数据偏离均值的程度。

◆均值的标准误

概念:均值的标准误用来衡量不同样本的均值之间的差别。

如果两个样本均值的差值与标准误的比值小于-2或大于2,则可以断定两个均值有显著的差别,进而断定这两个样本来自于两个不同的总体。

◆变异系数

概念:在比较两组数据离散程度大小时,如果观测的测量尺度相差太大,或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,需要首先消除测量尺度和量纲的影响,变异系数就可以剔除这些影响。

◆分位数

概念: P%分位数是指使得至少有P%的数据小于或等于这个值,且使得至少有(100-P)%的数据大于或等于这个值。

数据按照从小到大进行排序。

最小的四分位数称为下四分位数,记为Q1,所有观测值中有1/4的观测值小于下四位数,3/4的观测值大于下四位数,中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,记为Q3

统计中常常把数据的最小值,下四分位数,中位数,上四分位数和最大值称为数据的总结五数。从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现。

◆分布的形状

概念: 当α>0时,分布为正偏和右偏,及分布图形在右边拖尾,分布图有很长的右尾尖锋偏左,

  α<0,分布为负片和左偏,及分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右,α=0,分布对称,

  不论正负哪种偏态,偏度的绝对值最大表示偏斜的程度越大,反之偏斜程度越小,分布形状越接近对称。

SPSS 2019年10月31日 20:20:53今日学习总结的更多相关文章

  1. SPSS 2019年10月17日 21:46:38 今日学习总结

    数据库: 开放数据库链接是为了解决异构数据库间的数据共享而产生的,现已成为WOSA的主要部分和基于Windows环境的一种数据库访问接口标准ODBC为异构数据库访问提供一个接口,允许应用程序以SQL为 ...

  2. 易初大数据 spss 2019年10月31日 wangqingchao

    ---恢复内容开始--- 1.描述性统计分析方法是指应用分类.制表.图形及概括性数据指标来概括数据分析特征的方法. 2.而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总 ...

  3. SPSS 2019年10月24日 今日学习总结

    2019年10月24日今日课上内容1.SPSS掌握基于键值的一对多合并2.掌握重构数据3.掌握汇总功能 内容: 1.基于键值的一对多合并 合并文件 添加变量 合并方法:基于键值的一对多合并 变量 2. ...

  4. Linux自用指令——2019年10月23日

    1.ls ls命令是列出目录内容(List Directory Contents)的意思.运行它就是列出文件夹里的内容,可能是文件也可能是文件夹. ls -a 列出目录所有文件,包含以.开始的隐藏文件 ...

  5. Gitbook环境搭建及制作——2019年10月24日

    1.gitbook介绍 GitBook 是一个基于 Node.js 的命令行工具,支持 Markdown 和 AsciiDoc 两种语法格式,可以输出 HTML.PDF.eBook 等格式的电子书.可 ...

  6. ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk

    ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk ;~ 此脚本用于测试执行一行或多行AHK脚本源代码的效果;~ 此脚本最后修改于2019年9月22日20时03分;~ 把此 ...

  7. 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk

    ;; 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk;; 腾讯QQ号 595076941; 作者:徐晓亮(weiyunwps618); 写作日期:2019年5月15日; 版本号: ...

  8. 2016年10月31日 星期一 --出埃及记 Exodus 19:16

    2016年10月31日 星期一 --出埃及记 Exodus 19:16 On the morning of the third day there was thunder and lightning, ...

  9. 2017年10月31日结束Outlook 2007与Office 365的连接

    2017 年10月31日 ,微软即将推出 Office 365中Exchange Online邮箱将需要Outlook for Windows的连接,即通过HTTP Over MAPI方式,传统使用R ...

随机推荐

  1. Bootstrap 表单布局示例

    <html> <head> <link href="../../dist/css/bootstrap.min.css" rel="style ...

  2. surprise库官方文档分析(二):使用预测算法

    1.使用预测算法 Surprise提供了一堆内置算法.所有算法都派生自AlgoBase基类,其中实现了一些关键方法(例如predict,fit和test).可以在prediction_algorith ...

  3. Redis使用总结(二、缓存和数据库双写一致性问题)

    首先,缓存由于其高并发和高性能的特性,已经在项目中被广泛使用.在读取缓存方面,大家没啥疑问,都是按照下图的流程来进行业务操作. 但是在更新缓存方面,对于更新完数据库,是更新缓存呢,还是删除缓存.又或者 ...

  4. ST表 「 从入门到入门 · 浅显理解 」

    ST 表是个好东西,虽然前些天 ldq 学长已经讲完啦,但是那天他讲了那么多,让智商受限的我完全没有全部接受,选择性的扔掉了一部分(其实不舍的扔,记不住QAQ). ST 表最简单的应用就是查询区间最大 ...

  5. Python的is和==

    is是对比地址:==是对比值

  6. Ubuntu 14.04 查看指定端口的服务

    查看已经连接的服务端口(ESTABLISHED) netstat -a 查看所有的服务端口(LISTEN,ESTABLISHED) netstat -ap 查看指定端口,可以结合grep命令: net ...

  7. Java中使用md5进行hash运算

    public class Md5Util { /** * @author Bean_bag * @description 进行Hash运算 * * @param input 参数字符串 * @retu ...

  8. Dockerfile 指令 WORKDIR介绍

    Dockerfile中的WORKDIR指令用于指定容器的一个目录, 容器启动时执行的命令会在该目录下执行. 相当于设置容器的工作目录了.我们来看一个dockerfile文件 #test FROM ub ...

  9. faster-rcnn CUDA8.0编译错误

    之前编译Faster-RCNN的时候用的都是CUDA7.5,最近换了机器,变成了CUDA8.0,果然编译出现错误了…… 参考下面这篇博客解决了问题: http://blog.csdn.net/kexi ...

  10. ML_Review_PCA(Ch4)

    Note sth about PCA(Principal Component Analysis)   ML6月20日就要考试了,准备日更博客,来记录复习一下这次ML课所学习的一些方法. 博客是在参考老 ...