SAS通过IMPORT过程读取外部文件数据

使用IMPORT过程导入带分隔符的文件外,Microsoft Access数据库文件、Miscrosft Excel工作簿、 dBase文件、JMP文件、SPSS文件、Stata文件、Paradox等。

IMPORT过程的导入数据的基本形式如下:

PROC  IMPORT DATAFILE=文件名|文件引用|DATATABLE=表名 DBMS=数据源标识符 OUT=数据集名称;
RUN;

其中:

·DATAFILE=指定输入文件的完整路径和文件名,或文件引用。文件引用通常通过FILENAME语句指定。

·DATATABLE=指定输入DBMS表名。数据源可以通过DATAFILE或DATATABLE指定。

·DBMS=指定要导入的数据类型。SAS支持多种数据类型,例如 CSV、TAB、ACCESS、XLSX、XLS、EXCEL、JMP、DTA、SPSS 等。其中CSV、TAB表示要导入的数据文件分别由逗号和tab符号分隔, ACCESS表示使用LIBNAME语句的Miscrosoft Access表,XLSX表示 Micorsoft Excel 2007或2010的工作簿,等等。可参考SAS帮助文档了解 关于导入数据类型和各类型的详细信息。

·OUT=指定输出的数据集名称。该语句后面还可以添加数据集选项。

一、插入csv文件

读取csv文件(逗号分隔的文件)中的数据文件,其中的文件内容如下(可以复制下面建立txt文件):

Name,Age,Position,Marriage,Address
Greg William,,Manager,Single,"14 Bridge St. San Francisco, CA"
Emily Cooker, , Sales, Married, "42 Rue Marston"
Henry Cooper,,Office,Married,"52 Rue Marston Paris"
Jimmy Cruze,,Manager,Single,"Box 100 Cary, NC"

使用如下的方式进行读取

proc import datafile="E:\SAS\sas base\contact.txt" out=work.contact dbms = csv replace;
getnames = yes;
datarow=;
run; proc print data=work.contact;
run;

GETNAMES语句表示是否从该文件中的第一行读取变量值,默认为YES,表示读取;值为NO表示不读取,这时IMPORT过程 会自动产生名为F1、F2、F3等的变量。

DATAROW=语句也会经常使用,用于指定IMPORT语句开始读数 据的行号。默认情况下,当GETNAMES=NO时,DATAROW=1,当GETNAMES=YES时,DATAROW=2。该选项用于跳过数据文件开始处的多行内容。

二、读取Miscosoft Excel工作簿

使用import 读取下面的excel数据

使用语法如下

proc import datafile = "E:\SAS\sas base\contact.xls" out=work.contact2 dbms = xls replace;
run;
proc print data=work.contact2;
run;

DBMS=XLS或DBMS=XLSX来读取Excel文件

三、读取Microsoft Access数据库文件

Microsoft Access是一个桌面关系型数据库系统,通常使用Microsoft ACE引擎(.accdb文件格式)或Microsoft Jet引擎(.mdb文件格式)。在 IMPORT过程中指定DBMS为ACCESS,SAS可以读取在Microsoft Access 97、Microsoft Access 2000、Microsoft Access 2003、MicrosoftAccess 2007和Microsoft Access 2010中的文件。

proc  import  out=saslib.customer datatable='customer' dbms=access  replace;
database="c:\sas\data\customer.accdb";
RUN;

四、访问关系数据库

SAS支持的关系型数据库

1.通过LIBNAME语句访问

接口逻辑库是通过SAS/ACCESS接口软件来访问的其他软件,例如 数据库管理系统、格式化的文件等。通过LIBNAME语句指定接口逻辑库的引用名后,就可以像访问SAS原生数据集一样通过二级引用来访问 数据库中的表了。这时数据库中的表也称为接口数据集。这里简单介绍 SAS/ACCESS用LIBNAME语句访问关系型数据库的一般用法,更详细的用法请查看SAS帮助文档。

注意:大多数情况下,接口数据集的使用与原生数据集没有区别,但仍然会有些限制。

LIBNAME语句指定到DBMS对象的逻辑库引用名的基本形式如 下:

LIBNAME  逻辑库引用名  逻辑库引擎  访问连接选项;

其中:

·逻辑库引用名为访问数据库的逻辑引用名称,在本章第一节介绍SAS逻辑库时有详细介绍。

·逻辑库引擎由所要访问的数据库确定,例如Oracle数据库的引擎为oracle,Teradata数据库的引擎为teradata,Hadoop的引擎为hadoop。

·访问连接选项提供连接信息并控制SAS如何管理到DBMS链接的时 机和并发。不同数据库,连接选项会不同。例如,连接到Oracle数据的 连接选项为User=、PASSWORD=和PATH=。

下面两条LIBNAME语句分解建立了到Teradata数据库和Oracle数据 库的逻辑库引用名。接着,就可以使用带逻辑库引用名tdlib和oralib的二 级名称引用数据库中的表了。

libname  tdlib  teradata  server=tera2650  database=hps  user=user1  password=password1;
libname oralib oracle path=mypath schema=myschema user=usr1 password=password1;

2.通过PROC SQL访问

PROC SQL为SAS软件实现了结构化查询语句(Structured Query Language,SQL)。这里主要介绍如何通过PROC SQL使用SAS/ACCESS访问关系型数据库。

·使用LIBNAME语句指定接口逻辑库引用名,然后在PROC SQL语 句中引用该引用名查询、更新或删除DBMS数据。

·将LIBNAME信息嵌入PROC SQL视图中,在每次处理该SQL视图 时会自动连接到DBMS。

·使用PROC SQL的扩展功能,将DBMS特定的SQL语句直接发送到DBMS,该功能叫作SQL转交(pass-through)功能。

前两种方法使用的仍然是SAS/ACCESS LIBNAME引擎,引用数据库中表的形式与引用SAS原生数据集相同,这里不做介绍。作为 LIBNAME语句的替代,SQL转交功能使用SAS/ACCESS连接DBMS,并 将语句直接放到DBMS中执行,这样就可以使用DBMS本身的SQL语法 了。所以,SQL转交功能支持当前DBMS支持的任何非ANSI标准的 SQL。需要注意的是,不是所有的SAS/ACCESS接口都支持这种属性。

使用SQL转交功能的基本形式如下:

PROC  SQL;
CONNECT TO 数据库名称 <AS 别名> <(<数据库连接参数> )>;
EXECUTE (数据库特定SQL语句) BY 数据库名称|别名;
SELECT 列表 FROM CONNECTION TO数据库名称|别名 (数据库查询);
DISCONNECT FROM数据库名称|别名;
QUIT;

其中:

·CONNECT语句建立到DBMS的连接。数据库名称标识要连接的数 据库管理系统;别名为该连接指定别名;数据库连接参数指定PROC SQL连接到DBMS需要的特定的DBMS参数。

·EXECUTE语句发送DBMS特定的、非查询SQL语句到DBMS。 SAS会把输入的内容原封不动地发送到DBMS。有些DBMS可能是大小 写敏感的,需要注意。

·CONNECTION TO组件获取并使用PROC SQL查询或视图中的 DBMS数据。数据库查询指定要发送到DBMS上的查询,该查询可使用 对该DBMS有效的任何DBMS特定的SQL语句或语法。同样,这些查询 对有些DBMS可能是大小写敏感的。

·DISCONNECT语句终止与DBMS的连接。 各语句执行的返回值和消息保存在宏变量&sqlxrc和&sqlxmsg中。 下面的代码建立到Oracle数据库的连接。在CONNECT语句中,

oracle为数据库名称,mycon为别名,括号里的内容为数据库的连接参 数。%put宏将上一条CONNECT语句的返回值和代码打印到日志窗口。 SELECT语句通过建立的连接将表employees中满足条件(hiredate>='31- DEC-88')的行指定的5列(empid、lastname、firstname、hiredate、salary)数据取出。

PROC SQL还可以将上面的查询存储为SQL视图或创建为SAS数据集。下面的代码中查询条件一样,还是将查询存储为SAS逻辑库中的 SQL视图,这样在下次使用该视图时就可以自动从数据库中获取数据 了。

sas通过IMPORT过程读取外部文件数据的更多相关文章

  1. Unity3D移动平台动态读取外部文件全解析

    前言: 一直有个想法,就是把工作中遇到的坑通过自己的深挖,总结成一套相同问题的解决方案供各位同行拍砖探讨.眼瞅着2015年第一个工作日就要来到了,小匹夫也休息的差不多了,寻思着也该写点东西活动活动大脑 ...

  2. (转)Unity3D移动平台动态读取外部文件全解析

    Unity3D移动平台动态读取外部文件全解析 c#语言规范 阅读目录 前言: 假如我想在editor里动态读取文件 移动平台的资源路径问题 移动平台读取外部文件的方法 补充: 回到目录 前言: 一直有 ...

  3. 慕容小匹夫 Unity3D移动平台动态读取外部文件全解析

    Unity3D移动平台动态读取外部文件全解析   c#语言规范 阅读目录 前言: 假如我想在editor里动态读取文件 移动平台的资源路径问题 移动平台读取外部文件的方法 补充: 回到目录 前言: 一 ...

  4. 细说Unity3D(一)——移动平台动态读取外部文件全解析

    前言: 一直有个想法,就是把工作中遇到的坑通过自己的深挖总结成一套相同问题的解决方案供各位同行拍砖探讨.眼瞅着2015年第一个工作日就要来到了,小匹夫也休息的差不多了,寻思着也该写点东西活动活动大脑和 ...

  5. Android - 读取JSON文件数据

    Android读取JSON文件数据 JSON - JavaScript Object Notation 是一种存储和交换文本信息的语法. JSON对象在花括号中书写.用逗号来分隔值. JSON数组在方 ...

  6. python使用h5py读取mat文件数据,并保存图像

    1 安装h5py sudo apt-get install libhdf5-dev sudo pip install h5py 假设你已经安装好python和numpy模块 2 读取mat文件数据 i ...

  7. python3 读取txt文件数据,绘制趋势图,matplotlib模块

    python3 读取txt文件数据,绘制趋势图 test1.txt内容如下: 时间/min cpu使用率/% 内存使用率/% 01/12-17:06 0.01 7.61 01/12-17:07 0.0 ...

  8. 上传读取Excel文件数据

    /// <summary> /// 上传读取Excel文件数据 /// 来自http://www.cnblogs.com/cielwater /// </summary> // ...

  9. Unity 用C#脚本读取JSON文件数据

    读取JSON文件数据网上有很多方法吗,这里采用SimpleJSON,关于SimpleJSON的介绍参考以下链接:http://wiki.unity3d.com/index.php/SimpleJSON ...

随机推荐

  1. redis学习链接收藏

    1.redis命令大全--官网 2.redis命令大全--中文翻译版 3.源码(注释版):redis3.0 4.程序代码:<redis入门指南(第二版)>第五章 5.最新的redis-st ...

  2. 【亲测】502 Bad Gateway 怎么解决?

    502 Bad Gateway 怎么解决? 1.什么是502 badgateway 报错 简单来说 502 是报错类型代码,bad gateway 错误的网关. 2.产生错误的原因 连接超时 具体原因 ...

  3. js运算符逻辑!和instanceof的优先级

    写js时间长了,运算符优先级很可能自然而然的就形成习惯了,也不需要特别注意优先级的问题. 至少到目前为止,我也没有真正了解过js当中所有运算符的具体优先级.也没有出过什么重大的问题. 但是直到今天,在 ...

  4. Hash和HashCode深入理解

    目录介绍1.Hash的作用介绍1.1 Hash的定义1.2 Hash函数特性1.3 Hash的使用场景2.如何判断两个对象相等2.1 判断两个字符串2.2 判断两个int数值2.3 其他基本类型3.H ...

  5. 10. 批量插入List<String>

    List<String> iscBusOrgIdList = getIscOrgIdList();List<Map<String, Object>> iscBusO ...

  6. http建立连接过程

    参考:http://blog.csdn.net/wangjun5159/article/details/51510594

  7. springboot 启动脚本

    #!/bin/bash cd `` data_dir=`pwd` JAVA_HOME=/usr/local/jdk1..0_92 logs_dir=$data_dir/logs if [ ! -d $ ...

  8. ccc切割刚体

    // http://www.emanueleferonato.com/2011/08/05/slicing-splitting-and-cutting-objects-with-box2d-part- ...

  9. (转)VS2010反编译dll之后存在的resource修改为resx

    https://www.cnblogs.com/tangbaono1/p/6897183.html 1.找到安装VS的时候,存在的ResGen.exe,我的电脑是win7的,路径是在C:\Progra ...

  10. springboot @Value获取值为空,解决办法

    在spring中,常常使用 @Value("${property}") 从application.properties中取值,需要注意两点 使用 @Value 的类不能使用 new ...