PROC SORT DATA=输入数据集  <OUT=输出数据集><选项>;
BY 关键变量;
RUN;

PROC SORT 语法如上,其中在尖括号中的可以不出现,也不会报错。

选项中常用的有两种NODUPKEY和NOUNIQUEKEY。

功能可以由字面意思帮助记忆,NO-没有,DUP-重复,KEY-关键变量,,,合起来就是数据集中指定的关键变量不重复,

其功能也一样,,去除重复的关键变量,这里的关键变量就是指跟在关键字BY后面的变量;还有一个对应的DUPOUT=选项用来输出被该(NODUPKEY)剔除的观测数据。

例如:

PROC SORT DATA=ABC OUT=ABC1 DUPOUT=ABC2  NODUPKEY;
BY ID;
RUN;

这里的ABC1数据集就是关于源数据集ABC中关于ID不重复的数据集(重复的观测只保留第一条),而ABC2则是存放重复ID的重复部分。

还有一个常用选项NOUNIQUEKEY,同样可以帮助记忆  NO-没有,UNIQUE-唯一, KEY-关键变量,,,合起来就是数据集中的关键变量不唯一;

功能呢个就是保留数据集中关于关键变量有多条观测的数据,还有一个对应的选项  UNIQUEOUT=选项用来输出关于关键变量的观测数据唯一的的部分。

例如;

PROC SORT DATA=ABC UNIQUEOUT=ABC3 OUT=ABC4 NOUNIQUEKEY;
BY KEY;
RUN;

这里输出的ABC3是关于KEY唯一的观测数据,而ABC4存放的就是关于key不唯一的观测数据.

PROC SORT的更多相关文章

  1. SAS中的Order By - Proc Sort

    SAS中的Order By - Proc Sort 1.排序proc sort proc sort在按数据集中某一个变量或几个变量的升序或降序将记录重新排列,并把结果保存在输出数据集中,如果不另外指定 ...

  2. 使用PROC TRANSPOSE过程步对数据集进行转置时如何保持日期变量的时间顺序

    有一个数据集如下所示: 如果直接进行转置. SAS程序: proc transpose data=test out=outx1 (drop=_name_); by id; var amount; id ...

  3. TRANSPOSE的DATA步实现

    data a; input name $ a b ; cards; x x x y y y ; run; %macro transpose; proc sql noprint ; select cou ...

  4. 脚本工具: 查看当前系统被写入的FD

    #!/bin/bash touch /tmp/sn2 /tmp/sn4 /tmp/sn6 /tmp/sn3 redir=/dev/null which lsof >&/dev/null ...

  5. 关于PDV的那些事

    数据集中的数据来源分为两种: 一.来自于另一个数据集: 二.来自于外部数据源(本文细说此来源): 无论是哪种来源,在它们成为目标数据集中的观测行(官方叫它observation)之前都要进入PDV,先 ...

  6. Linux 相关基础笔记

    html,body { } .CodeMirror { height: auto } .CodeMirror-scroll { } .CodeMirror-lines { padding: 4px 0 ...

  7. 《SAS编程与数据挖掘商业案例》学习笔记之十七

    继续读书笔记,本次重点sas sql语句,因为sql内容多且复杂,本文仅仅介绍商业应用中经常使用的而且easy出错的地方,内容包含:单表操作.多表关联.子查询以及merge和join的差别 1.单表操 ...

  8. SAS学习笔记

    一.            在SAS中进行随机抽样: 1. 在实际数据处理中常常需要进行样本抽样,在实践中主要有两种情况: (1)简单无重复抽样(2)分层抽样   a.等比例分层抽样  b. 不等比例 ...

  9. SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- SAS中的一些常见的符号.运算符是一种符号①比 ...

随机推荐

  1. Redis(二) 扩展

    事务multi ... exec  之间的操作先进入等待队列,到exec时一起执行                事物的所有操作结果都是一起返回的,所以前一条指令的结果无法作为后一条指令的参数     ...

  2. 【Python全栈笔记】03 [模块二] 16-17 Oct 函数

    定义一个函数 def function_name(形式参数): 代码块 return 'Value' #如果没有写return,则默认返回None # 一个函数到return这一行就结束执行了,在re ...

  3. Regex

    1. regex with variable example: find the number and put a parenthese around the number. output: a(52 ...

  4. python积累

    python积累 一.逐渐积累 python逐渐积累 http://www.cnblogs.com/lx63blog/articles/6051526.html python积累_2 http://w ...

  5. sqlite的简介

    第一步: 第二步,建立桥接文件 随便创建一个类,语言选择oc,然后它会问你是否创建桥接模式,然后你选择是就可以了 那个类可以删除了 在那份桥接文件中加入一句话#import <sqlite3.h ...

  6. Python SQLAlchemy --1

    本文為 Python SQLAlchemy ORM 一系列教學文: SQLAlchemy 大概是目前 Python 最完整的資料庫操作的套件了,不過最令人垢病的是它的文件真的很難閱讀,如果不搭配個實例 ...

  7. 博弈论揭示了深度学习的未来(译自:Game Theory Reveals the Future of Deep Learning)

    Game Theory Reveals the Future of Deep Learning Carlos E. Perez Deep Learning Patterns, Methodology ...

  8. centos 常见软件安装

    centos虚拟机扩展硬盘空间 http://www.cnblogs.com/sixiweb/p/3360008.html http://blog.csdn.net/remote_roamer/art ...

  9. linux python升级和ipython的安装

    ==CentOS 6.X 自带的python版本是 2.6 , 由于工作需要,很多时候需要2.7版本.所以需要进行版本升级.由于一些系统工具和服务是对 Python 有依赖的,所以升级 Python ...

  10. SVN和CVS的区别

    对版本控制就有了一定的理解,同时也应该知道SVN与CVS是比较流行的两款SCM工具.那么到底这两款工具有什么区别呢? 1.版本编号方面 例如,我们的版本库为A,其中有文件a,b,c. 在SVN中,新版 ...