◆描述性统计分析

概念:描述性统计分析方法是指应用分类、制表、图形及概括性数据指标(去均值,方差等)来概括数据分布特征的方法。

   而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总体的数据分析方法统计上需要把样本数据所御寒信息进行概括,融合和抽象,

   从而得到反映样本数据的综合指标。这些指标称为统计量。描述数据特征的统计量可分为两类:一类表示数据的中心位置,

   如均值,中位数,众数等,另一类表示数据的离散程度,如方差,标准差,极差等用来衡量个体偏离中心的程度在描述定性观测知识,

   有时候我们需要把这些指按照某种原则分成一些组或者类,使得每个观测值必须且只能落入一个类中。对于给定的类,落入这个类的个案数称为频率,落入该类中的个案数和个案总数的比例称为相对频率。

频率分析主要通过频率分布表,条形图,饼图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

◆中心趋势的描述

概念:中心趋势是指以组数据向某个中心值靠拢的倾向。描述数据分布的中心位置的统计量称为位置统计量。

     对于连续变量和定序变量,描述数据中心趋势的指标有均值,中位数,众数,5%截尾均值,

     对于定性数据,描述数据中心趋势的指标只有众数。

     SPSS中把变量分为三个水平,分别为尺度变量,定序变量,名义变量。

◆均值

概念:均值一般是指数据的算术均值。数据的均值容易受极端值的影响。

◆5%截尾均值

概念:把观测值按照从小到大顺序排序,剔除掉排序后的数据序列两端的部分数字后计算得到的均值称为截尾均值,避免了极端值的影响。

◆几何均值

概念:几何均值又称几何平均数。它是样本数据连乘后得到的积开N次方得到的 计算机和平均数要求各观察值之间存在连乘关系,

    并且各个观察值的连乘积必须具有实际意义,它主要用于相对数数列,他要求样本数和算术平均值相比较,几何平均数应用范围较窄。

◆中位数

概念:将观测值按照从小到大的顺序排列,位于中间位置的数值称为中位数。

中位数受极端值的影响较小,在具有极大和极小值的数据中,中位数比均值往往更能代表数据的集中趋势。

◆众数

概念:众数是观测值中出现次数最多的数值,其反映了这组观测值的集中趋势。不受极端值影响。可能有多个众数离散趋势的描述。

◆极差

概念: 数据的观测值中的最大值与最小值之差反映了数据的波动情况。该差称为极差或者全距,容易受极端值影响。

◆方差和标准差

概念: 标准差用来度量观测值偏离平均数的大小,相当于平均偏差,可以直接描述数据偏离均值的程度。

◆均值的标准误

概念:均值的标准误用来衡量不同样本的均值之间的差别。

如果两个样本均值的差值与标准误的比值小于-2或大于2,则可以断定两个均值有显著的差别,进而断定这两个样本来自于两个不同的总体。

◆变异系数

概念:在比较两组数据离散程度大小时,如果观测的测量尺度相差太大,或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,需要首先消除测量尺度和量纲的影响,变异系数就可以剔除这些影响。

◆分位数

概念: P%分位数是指使得至少有P%的数据小于或等于这个值,且使得至少有(100-P)%的数据大于或等于这个值。

数据按照从小到大进行排序。

最小的四分位数称为下四分位数,记为Q1,所有观测值中有1/4的观测值小于下四位数,3/4的观测值大于下四位数,中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,记为Q3

统计中常常把数据的最小值,下四分位数,中位数,上四分位数和最大值称为数据的总结五数。从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现。

◆分布的形状

概念: 当α>0时,分布为正偏和右偏,及分布图形在右边拖尾,分布图有很长的右尾尖锋偏左,

  α<0,分布为负片和左偏,及分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右,α=0,分布对称,

  不论正负哪种偏态,偏度的绝对值最大表示偏斜的程度越大,反之偏斜程度越小,分布形状越接近对称。

SPSS 2019年10月31日 20:20:53今日学习总结的更多相关文章

  1. SPSS 2019年10月17日 21:46:38 今日学习总结

    数据库: 开放数据库链接是为了解决异构数据库间的数据共享而产生的,现已成为WOSA的主要部分和基于Windows环境的一种数据库访问接口标准ODBC为异构数据库访问提供一个接口,允许应用程序以SQL为 ...

  2. 易初大数据 spss 2019年10月31日 wangqingchao

    ---恢复内容开始--- 1.描述性统计分析方法是指应用分类.制表.图形及概括性数据指标来概括数据分析特征的方法. 2.而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总 ...

  3. SPSS 2019年10月24日 今日学习总结

    2019年10月24日今日课上内容1.SPSS掌握基于键值的一对多合并2.掌握重构数据3.掌握汇总功能 内容: 1.基于键值的一对多合并 合并文件 添加变量 合并方法:基于键值的一对多合并 变量 2. ...

  4. Linux自用指令——2019年10月23日

    1.ls ls命令是列出目录内容(List Directory Contents)的意思.运行它就是列出文件夹里的内容,可能是文件也可能是文件夹. ls -a 列出目录所有文件,包含以.开始的隐藏文件 ...

  5. Gitbook环境搭建及制作——2019年10月24日

    1.gitbook介绍 GitBook 是一个基于 Node.js 的命令行工具,支持 Markdown 和 AsciiDoc 两种语法格式,可以输出 HTML.PDF.eBook 等格式的电子书.可 ...

  6. ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk

    ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk ;~ 此脚本用于测试执行一行或多行AHK脚本源代码的效果;~ 此脚本最后修改于2019年9月22日20时03分;~ 把此 ...

  7. 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk

    ;; 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk;; 腾讯QQ号 595076941; 作者:徐晓亮(weiyunwps618); 写作日期:2019年5月15日; 版本号: ...

  8. 2016年10月31日 星期一 --出埃及记 Exodus 19:16

    2016年10月31日 星期一 --出埃及记 Exodus 19:16 On the morning of the third day there was thunder and lightning, ...

  9. 2017年10月31日结束Outlook 2007与Office 365的连接

    2017 年10月31日 ,微软即将推出 Office 365中Exchange Online邮箱将需要Outlook for Windows的连接,即通过HTTP Over MAPI方式,传统使用R ...

随机推荐

  1. eclipse和scala整合,打包配置文件及打包步骤

    我写的是maven项目,pom文件为: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi=" ...

  2. sql server 综合使用的例子

    exec sp_helptext prosampleoldstyle_usp -- ============================================= -- ========= ...

  3. 剖析生产系统的I/O模式

    剖析生产系统的I/O模式 2019/02/13 vmunix 了解I/O的特点对于优化系统性能非常重要,I/O是顺序的还是随机的,是读操作还是写操作,读写的比例是多少,I/O数据块的大小,这些都是影响 ...

  4. AS400 printer setting

    (1) CRTOUTQ OUTQ(TESTLIB/PRINTER2) (2) CRTDEVPRT ===> CRTDEVPRT DEVD(PRINTER2) DEVCLS(*LAN) TYPE( ...

  5. CF620E New Year Tree 线段树+dfs序+bitset

    线段树维护 dfs 序是显然的. 暴力建 60 个线段树太慢,于是用 bitset 优化就好了 ~ code: #include <bits/stdc++.h> #define M 63 ...

  6. Linux操作系统常用命令合集——第三篇-系统管理操作(25个命令)

    1.whoami [命令作用] 显示当前登录有效用户名称 [命令语法]  whoami    [选项] [常用选项] 无 [参数说明] 用户名称 [命令示例] 显示当前登录有效用户名称 # whoam ...

  7. leetcode解题报告(17):Missing Number

    描述 Given an array containing n distinct numbers taken from 0, 1, 2, ..., n, find the one that is mis ...

  8. 在win10环境下IED配置spark项目

    eclipse在对spark的支持上并不友好,所以需要新下载并安装IntelliJ IDEA 2019.1.我下载安装的是专业版的,直接在网上搜索了破解码进行破解. 1. 配置java和scala I ...

  9. jmeter压测过程中报java.lang.NoClassDefFoundError: org/bouncycastle/jce/provider/BouncyCastleProvider

    由于在java中添加了第三方安全策略文件,具体请看https://www.cnblogs.com/mrjade/p/10886378.html,导致在用jmeter压测过程中会遇到以下错误 解决办法: ...

  10. python 小数处理

    modf() 分别取整数部分和小数部分 math模块函数import mathn = 3.75print(math.modf(n))>>> (0.75, 3.0)n = 3.25pr ...