◆描述性统计分析

概念:描述性统计分析方法是指应用分类、制表、图形及概括性数据指标(去均值,方差等)来概括数据分布特征的方法。

   而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总体的数据分析方法统计上需要把样本数据所御寒信息进行概括,融合和抽象,

   从而得到反映样本数据的综合指标。这些指标称为统计量。描述数据特征的统计量可分为两类:一类表示数据的中心位置,

   如均值,中位数,众数等,另一类表示数据的离散程度,如方差,标准差,极差等用来衡量个体偏离中心的程度在描述定性观测知识,

   有时候我们需要把这些指按照某种原则分成一些组或者类,使得每个观测值必须且只能落入一个类中。对于给定的类,落入这个类的个案数称为频率,落入该类中的个案数和个案总数的比例称为相对频率。

频率分析主要通过频率分布表,条形图,饼图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。

◆中心趋势的描述

概念:中心趋势是指以组数据向某个中心值靠拢的倾向。描述数据分布的中心位置的统计量称为位置统计量。

     对于连续变量和定序变量,描述数据中心趋势的指标有均值,中位数,众数,5%截尾均值,

     对于定性数据,描述数据中心趋势的指标只有众数。

     SPSS中把变量分为三个水平,分别为尺度变量,定序变量,名义变量。

◆均值

概念:均值一般是指数据的算术均值。数据的均值容易受极端值的影响。

◆5%截尾均值

概念:把观测值按照从小到大顺序排序,剔除掉排序后的数据序列两端的部分数字后计算得到的均值称为截尾均值,避免了极端值的影响。

◆几何均值

概念:几何均值又称几何平均数。它是样本数据连乘后得到的积开N次方得到的 计算机和平均数要求各观察值之间存在连乘关系,

    并且各个观察值的连乘积必须具有实际意义,它主要用于相对数数列,他要求样本数和算术平均值相比较,几何平均数应用范围较窄。

◆中位数

概念:将观测值按照从小到大的顺序排列,位于中间位置的数值称为中位数。

中位数受极端值的影响较小,在具有极大和极小值的数据中,中位数比均值往往更能代表数据的集中趋势。

◆众数

概念:众数是观测值中出现次数最多的数值,其反映了这组观测值的集中趋势。不受极端值影响。可能有多个众数离散趋势的描述。

◆极差

概念: 数据的观测值中的最大值与最小值之差反映了数据的波动情况。该差称为极差或者全距,容易受极端值影响。

◆方差和标准差

概念: 标准差用来度量观测值偏离平均数的大小,相当于平均偏差,可以直接描述数据偏离均值的程度。

◆均值的标准误

概念:均值的标准误用来衡量不同样本的均值之间的差别。

如果两个样本均值的差值与标准误的比值小于-2或大于2,则可以断定两个均值有显著的差别,进而断定这两个样本来自于两个不同的总体。

◆变异系数

概念:在比较两组数据离散程度大小时,如果观测的测量尺度相差太大,或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,需要首先消除测量尺度和量纲的影响,变异系数就可以剔除这些影响。

◆分位数

概念: P%分位数是指使得至少有P%的数据小于或等于这个值,且使得至少有(100-P)%的数据大于或等于这个值。

数据按照从小到大进行排序。

最小的四分位数称为下四分位数,记为Q1,所有观测值中有1/4的观测值小于下四位数,3/4的观测值大于下四位数,中点位置的四分位数就是中位数。最大的四分位数称为上四分位数,记为Q3

统计中常常把数据的最小值,下四分位数,中位数,上四分位数和最大值称为数据的总结五数。从这五个值可以大致看出数据分布的中心和离散程度。而箱图则是这五个数的图形表现。

◆分布的形状

概念: 当α>0时,分布为正偏和右偏,及分布图形在右边拖尾,分布图有很长的右尾尖锋偏左,

  α<0,分布为负片和左偏,及分布图形在左边拖尾,分布图有很长的左尾,峰尖偏右,α=0,分布对称,

  不论正负哪种偏态,偏度的绝对值最大表示偏斜的程度越大,反之偏斜程度越小,分布形状越接近对称。

SPSS 2019年10月31日 20:20:53今日学习总结的更多相关文章

  1. SPSS 2019年10月17日 21:46:38 今日学习总结

    数据库: 开放数据库链接是为了解决异构数据库间的数据共享而产生的,现已成为WOSA的主要部分和基于Windows环境的一种数据库访问接口标准ODBC为异构数据库访问提供一个接口,允许应用程序以SQL为 ...

  2. 易初大数据 spss 2019年10月31日 wangqingchao

    ---恢复内容开始--- 1.描述性统计分析方法是指应用分类.制表.图形及概括性数据指标来概括数据分析特征的方法. 2.而推断性统计分析方法则是通过随机抽样,应用统计方法把从样本数据得到的结论推广到总 ...

  3. SPSS 2019年10月24日 今日学习总结

    2019年10月24日今日课上内容1.SPSS掌握基于键值的一对多合并2.掌握重构数据3.掌握汇总功能 内容: 1.基于键值的一对多合并 合并文件 添加变量 合并方法:基于键值的一对多合并 变量 2. ...

  4. Linux自用指令——2019年10月23日

    1.ls ls命令是列出目录内容(List Directory Contents)的意思.运行它就是列出文件夹里的内容,可能是文件也可能是文件夹. ls -a 列出目录所有文件,包含以.开始的隐藏文件 ...

  5. Gitbook环境搭建及制作——2019年10月24日

    1.gitbook介绍 GitBook 是一个基于 Node.js 的命令行工具,支持 Markdown 和 AsciiDoc 两种语法格式,可以输出 HTML.PDF.eBook 等格式的电子书.可 ...

  6. ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk

    ;~ 小部分AutoHotkey源代码片段测试模板2019年10月9日.ahk ;~ 此脚本用于测试执行一行或多行AHK脚本源代码的效果;~ 此脚本最后修改于2019年9月22日20时03分;~ 把此 ...

  7. 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk

    ;; 等Excel工作簿关闭后自动加密压缩备份2019年10月9日.ahk;; 腾讯QQ号 595076941; 作者:徐晓亮(weiyunwps618); 写作日期:2019年5月15日; 版本号: ...

  8. 2016年10月31日 星期一 --出埃及记 Exodus 19:16

    2016年10月31日 星期一 --出埃及记 Exodus 19:16 On the morning of the third day there was thunder and lightning, ...

  9. 2017年10月31日结束Outlook 2007与Office 365的连接

    2017 年10月31日 ,微软即将推出 Office 365中Exchange Online邮箱将需要Outlook for Windows的连接,即通过HTTP Over MAPI方式,传统使用R ...

随机推荐

  1. 使用Ajax和一般处理程序实现文件上传与下载

    1.使用HTML的input标签 <input type="file" multiple="multiple" id="file_load&qu ...

  2. 全栈开发工程师微信小程序-下

    app.json { "pages": ["pages/index/index"] } index.wxml <text>Hello World&l ...

  3. git 常用命令使用,git bash通用命令

    git 常用命令 1.强制推送(慎用,除非你认为其他冲突等可以丢弃 或者不是很重要) git push -- force 2.创建文件等小命令 touch a // 创建一个a文件 >> ...

  4. codeforces164A

    Variable, or There and Back Again CodeForces - 164A Life is not easy for the perfectly common variab ...

  5. [bzoj 2653][国家集训队]middle

    传送门 Description 一个长度为\(n\)的序列\(a\),设其排过序之后为\(b\),其中位数定义为\(b[n/2]\),其中\(a,b\)从\(0\)开始标号,除法取下整. 给你一个长度 ...

  6. C++的面向对象的Dijkstra写法

    C++的面向对象的Dijkstra写法 面向对象特点的充分使用 清晰的逻辑 简洁的图输入 程序 面向对象特点的充分使用 清晰明确的类实现 class Edge(边的实现) class Req (路由请 ...

  7. C#图片灰度处理(位深度24→位深度8)、C#图片二值化处理(位深度8→位深度1)

    C#图片灰度处理(位深度24→位深度8) #region 灰度处理 /// <summary> /// 将源图像灰度化,并转化为8位灰度图像. /// </summary> / ...

  8. 按比例吃CPU

    前几天测试软件在多核上的性能,需要按照比例吃各个CPU,查了查资料,撸了下面一小段代码: #include <unistd.h> #include <stdlib.h> #in ...

  9. OpenJudge计算概论-细菌实验分组

    /*====================================================细菌实验分组总时间限制: 1000ms 内存限制: 65536kB描述有一种细菌分为A.B两 ...

  10. API 设计 POSIX File API

    小结: 1. https://mp.weixin.qq.com/s/qWrSyzJ54YEw8sLCxAEKlA API 设计最佳实践的思考 谷朴 阿里技术 昨天   阿里妹导读:API 是模块或者子 ...