SAS学习笔记13 SAS数据清洗和加工(续)
查找缺失值



cha[*]和num[*]是建立数组cha和num,但不指定数组中的元素数
自动变量_character_表示数据集中的所有字符型变量
自动变量_numeric_表示数据集中的所有数值型变量
_all_表示数据集中的所有变量
if和where的区别
where运行的速度要快一些,因为它是在数据读入之前就执行选择条件,而if是在数据读入之后才执行。但只有在数据量很大的时候才能感觉出来,正常几百几千个数据几乎感觉不到
只能用if的场合
使用自动变量时,只能用if,不能用where
如果指定的条件变量是新产生的变量,只能用if,不能用where
只能用where的场合
当使用某些特殊运算符时,只能用where,不能用if




当调用某一proc过程时,如果要选择部分观测执行该过程,只能用where,不能用if
查找异常值


缺失值的填补
之前笔记1介绍过缺失值的单一插补法,这里介绍下缺失值的多重填补(multiple imputation)


可以看到,sas默认产生5个填补完整的数据集,每个数据集的填补值都不同。我们可以取这5次填补的平均值作为最终的填补值
缺失数据的更新


SAS学习笔记13 SAS数据清洗和加工(续)的更多相关文章
- SAS学习笔记51 SAS数据集
		结构 SAS数据集是关系型的,包含两个部分:描述部分(变量)和数据部分(观察值) 形式 SAS系统中共有两种类型的数据集: 1.SAS 数据文件(SAS datafiles) 2.SAS 数据视窗(S ... 
- SAS学习笔记12 SAS数据清洗和加工
		set语句纵向合并 我们把a1和b1进行合并,并区分是来自哪个数据集,会用到in=选项 in=a是产生临时变量a,由于它是a1的选项,所以a的值=1(来自a1)或者=0(不来自a1) in=b是产生临 ... 
- SAS学习笔记50 SAS数据集索引
		在没有索引的情况下,SAS是一条接一条的扫描观测:有索引时,直接跳到该索引对应的观测所在位置.总结一句话就是:节省时间,节省内存,提高效率 当然并不是任何情况下使用索引都能提高工作效率,因为建立索引本 ... 
- SAS学习笔记40 SAS程序运行过程
		当我们提交运行一个DATA步程序后,具体发生了什么事情. SAS程序与其他程序一样,在运行时都要经过两个阶段:编译(Compilation).执行(Execution) 程序首先经过编译阶段,该阶段主 ... 
- SAS学习笔记38 SAS Comments注释语句
		通常来讲,注释语句有四种: 1.* message; 2.COMMENT message; 3./* message */ 4.%* message; 第一种的主要限制是注释之中不得有“:”符号.通常 ... 
- SAS学习笔记31 SAS随机分组方法及实现
		随机分组方法包括: 简单随机化(simple randomization) 区组随机化(block randomization) 分层随机化(stratified randomization) 分层区 ... 
- SAS学习笔记30 SAS各种常用随机函数
		UNIFORM(seed) 产生(0,1)区域均匀分布随机数,乘同余发生器 RANUNI(seed) 产生(0,1)区域均匀分布随机数,素数模发生器 NORMAL(seed) 产生标准正态分布随机数, ... 
- SAS学习笔记19 SAS删除空格函数(left、right、trim、strip、compress、compbl函数)
- SAS学习笔记17 SAS生成随机数函数(rand function)
随机推荐
- sql 分组后每组查询10个
			SELECT ID,Name,Class ROW_NUMBER() OVER(PARTITION BY Class ORDER BY ID) as NUM 主要是用到 rownum 里面的 PARTI ... 
- 如何实现数组与List的相互转换
			List转数组:toArray(arraylist.size()方法 数组转List:Arrays的asList(a)方法 List<String> arrayList = new Arr ... 
- php语言查询Mysql数据库内容
			通过php语言实现对Mysql数据库的基本操作 1.php页面在进行浏览时需要有php语言执行的环境,本人用的是WampServer软件,只要将项目复制到wampserver_php\wamp\www ... 
- T-MAX-凡事预则立
			T-MAX-凡事预则立 这个作业属于哪个课程 2019秋福大软件工程实践Z班 这个作业要求在哪里 团队作业第五次-项目冲刺 团队名称 T-MAX 这个作业的目标 1.冲刺的时间计划安排2.答辩问题的回 ... 
- nodejs取参四种方法 req.body, req.params, req.param, req.body
			获取请求很中的参数是每个web后台处理的必经之路,nodejs的 express框架 提供了四种方法来实现. req.body req.query req.params req.param() 首先介 ... 
- nginx里面的location 规则匹配
			nginx location语法 ~ # 区分大小写的正则匹配 location ~ \.(gif|jpg|png|js|css)$ { #规则D } ~* # 不区分大小写的正则匹配(和~的功能相同 ... 
- flutter的生命周期
			大致可以看成三个阶段 初始化(插入渲染树) 状态改变(在渲染树中存在) 销毁(从渲染树种移除) initState 当插入渲染树的时候调用,这个函数在生命周期中只调用一次.这里可以做一些初始化工作,比 ... 
- Qt编写自定义控件58-直方对称图
			一.前言 本控件也非原创控件,是参考网上的代码而来的,对称顾名思义就是将画布平均成上下两部分,将设置的值自动按照画布高度的一半作为参照高度进行绘制,然后增加动态过渡效果,有点类似于声音播放时候的频谱效 ... 
- iOS 将一个UIImage缩放到指定Size
			这方法挺实用的,直接调用就可以得到想要的size. //将一个UIImage缩放变换到指定Size -(UIImage*) OriginImage:(UIImage *)image scaleToSi ... 
- tornado之自定义form表单验证
			直接上链接吧:银角的地址 源码下载链接:点我点我点我... 
