spss-数据抽取-拆分与合并

数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。

一:字段拆分

如何提取“身份证号码”字段。身份证号码里面包含了许多信息,例如省份、城市、出生日期、性别等等。我们将它抽取出来,就可以得到相应的字段。也就可以做相应的分析了。如用户的省份分布、出生日期、性别等。

大家都知道在excel中使用字符函数(right、mid、left)就可以将这些信息提取出来。那么在spss中该如何使用呢?接下来教给大家一个在spss中的函数方法。

Substr函数,它跟excel中的mid函数的用法是一致的。函数如下:

Substr(字符串 , 提取的起始位置 , 提取的字符个数)

操作步骤:

【转换】--【计算变量】,弹出【计算变量】对话框,如图

首先在【函数组】框中找到“字符串”类,在【函数和特殊变量】中选择“char.substr(3)”函数,双击,这时该函数就会被移入【数字表达式】框中,然后将表达式修改为“CHAR.SUBSTR(身份证号码,7,4)”,这样就完成了公式的编写。

接着在【目标变量】框中,输入变量名称“年份”,并在【类型与便签】功能中设置为“字符串”

最后点击【确定】按钮。这样就新增加了一个变量“年份”。

拓展:SPSS中计算变量这个功能非常常用,类似于excel的编辑栏功能,可以输入函数或者计算公式来新增变量,后续还会使用它来进行相关的数据处理操作。

二:数据合并

数据合并是指综合数据表中某几个字段的信息或记录,组合成一个新字段、新记录。主要分为两种:A、字段合并、B、记录合并。

A、字段合并,是指将几个字段合并为一个新字段。例如将前面从身份证号码中提取出来的年、月、日三个单独的字段进行合并,得到出生日期。

介绍一个函数concat

操作步骤如上

最后新增加一步:如果想要对年龄进行计算,需要将变量视图中“出生日期2”的数据类型更改为日期。

B、记录合并,也称纵向合并。是将具有共同的数据字段、结构,不同的数据记录表信息合并的一个新的数据表中。数据分析师培训

操作步骤:

【数据】-【合并文件】-【添加个案】,弹出【添加个案】对话框。

选择【浏览】,打开文件

点击【继续】按钮。

如果正确,点击【确定】按钮。完成男女数据合并工作。

spss-数据抽取-拆分与合并的更多相关文章

  1. (Sql Server)数据的拆分和合并

    (Sql Server)数据的拆分和合并 背景: 今天遇到了数据合并和拆分的问题,尝试了几种写法.但大致可分为两类:一.原始写法.二.Sql Server 2005之后支持的写法.第一种写法复杂而且效 ...

  2. NDK学习笔记-文件的拆分与合并

    文件的拆分与合并在开发中经常会用到,上传或是下载的时候都有这样的运用 文件拆分的思路 将文件大小拆分为n个文件 那么,每个文件的大小就是等大小的 如果文件大小被n除不尽,那么就使用n+1个文件来拆分 ...

  3. SPSS数据记录的选择(Select Cases)

    SPSS数据记录的选择(Select Cases) 在数据分析时,有时可能只对某些记录感兴趣.例如,在判别分析时,可能用其中90%的记录数据建立判别函数,用其余10%的记录来考核判别函数.此时,可以通 ...

  4. 【BIM】基于BIMFACE的空间拆分与合并

    BIMFACE中矩形空间拆分与合并 应用场景 在BIM运维场景中,空间同设备一样,作为一种资产被纳入运维管理体系,典型的应用场景例如商铺.防火分区等,这就涉及到空间的拆分和合并,在bimface中,已 ...

  5. Oracle数据行拆分多行

    工作和学习中常常会遇到一行要分割成多行数据的情况,在此整理一下做下对比. 单行拆分 如果表数据只有一行,则可以直接在原表上直接使用connect by+正则的方法,比如: select regexp_ ...

  6. pdf拆分与合并

    1.引用iTextSharp,用于拆分和合并pdf文件 using iTextSharp.text; using iTextSharp.text.pdf; 2.合并pdf //outMergeFile ...

  7. fasta文件拆分与合并

    Linux中fasta文件的拆分与合并 FASTA文件的拆分: (1)如果从一个文件a提取第11至20个序列存到另一个文件b: awk -v RS='>' 'NR>1{i++}i>= ...

  8. HR数据抽取:通过 Read Master Data 转换规则读取时间相关主属性数据

    声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...

  9. 《BI项目笔记》增量ETL数据抽取的策略及方法

    增量抽取 增量抽取只抽取自上次抽取以来数据库中要抽取的表中新增或修改的数据.在ETL使用过程中.增量抽取较全量抽取应用更广.如何捕获变化的数据是增量抽取的关键.对捕获方法一般有两点要求:准确性,能够将 ...

随机推荐

  1. 17-MySQL-Ubuntu-数据表的查询-分页(六)

    分页(limit) 注: (1)limit位于SQL语句的最后面; (2)limit 2; 2表示查询前两条数据; (3)limit 0,2;  0表示查询第1页的起始数据的下标,2表示每页有两条数据 ...

  2. 【转】Windows(server2008)下使用VisualSVN Server搭建SVN服务器

    参考文献 1.Windows下使用VisualSVN Server搭建SVN服务器(百度经验)  挺好就是没有配图已验证可用 2.在Windows Server 2008上部署SVN代码管理器 把第二 ...

  3. ps -aux|grep mysql时候报错:Warning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQ

    ps -aux|grep mysql时候报错:Warning: bad syntax, perhaps a bogus '-'? See /usr/share/doc/procps-3.2.8/FAQ ...

  4. luoguP2580 于是他错误的点名开始了 [Trie]

    题目背景 XS中学化学竞赛组教练是一个酷爱炉石的人. 他会一边搓炉石一边点名以至于有一天他连续点到了某个同学两次,然后正好被路过的校长发现了然后就是一顿欧拉欧拉欧拉(详情请见已结束比赛CON900). ...

  5. 计算几何——判线段规范相交+最短路zoj1721

    枚举每个端点,然后i点j点连线作为一条路径,逐一判断这条路径是否可行即可 注意的地方:判一条线段是否可行,需要判其余线段是否和其相交,但是这个相交比较难判(因为会不规范相交),所以将问题转化为墙以外的 ...

  6. 修改Chrome的UserAgent

    修改Chrome的UserAgent 直接在chrome商店中搜索user-agent switcher 打开chrome 商店,搜索 user-agent switcher   点击免费, 然后执行 ...

  7. 阿里云CentOs7上安装JDK

    一.查看服务器是否已经预装了JDK 在拿到新机器以后,要先看下机器上是否已经预装了JDK,命令: rpm -qa|grep jdk 如果有的话,卸载openjdk(无需输全称).命令: yum -y ...

  8. 同步+TASK异步请求

    using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; usin ...

  9. Spring IOC基础回顾 — 组件扫描和装配

    目录 注解形式配置应用IOC 1. 组件自动扫描 2. 组件依赖:为bean添加注解,实现自动注入 3. Spring IOC应用小结 注解形式配置应用IOC 在类定义.方法定义.成员变量定义前使用, ...

  10. 05_mybatis动态sql

    1.sql片段 1.sql片段**** mybatis核心 对sql语句进行灵活操作,通过表达式进行判断,对sql进行灵活拼接.组装. 2.需求 用户信息综合查询列表和用户信息查询列表总数这两个sta ...