主要学习如何把几种常用的数据格式导入到R中进行处理,并简单介绍如何把R中的数据保存为R数据格式和csv文件。

1、保存和加载R的数据(与R.data的交互:save()函数和load()函数)

a <- 1:10

save(a, file = "data/dumData.Rdata")  # data文件为当前工作目录下的文件,必须存在

rm(a)

load("data/dumData.Rdata")

print(a)

 

2、导入和加载.csv文件(write.csv()函数和read.csv()函数)

var1 <- 1:5

var2 <- (1:5) / 10

var3 <- c("R", "and", "Data Mining", "Examples", "Case Studies")

a <- data.frame(var1, var2, var3)

names(a) <- c("VariableInt", "VariableReal", "VariableChar")

write.csv(a, "data/dummmyData.csv", row.names = FALSE)

b <- read.csv("data/dummmyData.csv")

3、导入SPSS/SAS/Matlab等数据集

# 导入spss的sav格式数据则要用到foreign扩展包,加载后直接用read.spss读取sav文件

library(foreign)

mydata=read.spss('d:/test.sav')

# 上面的函数在很多情况下没能将sav文件中的附加信息导进来,例如数据的label,

# 那么建议用Hmisc扩展包的spss.get函数,效果会更好一些。

library(Hmisc)

data=spss.get("D:/test.sav")

导入时候,如果报了这样的错误:

Unrecognized record type 7, subtype 24 encountered in system file

可以使用下面的这个包:

library(memisc)

data<-as.data.set(spss.system.file("D:/test.sav"))

4、导入数据库中的数据

library(RODBC)

#这里是载入RODBC

Connection <- odbcConnect(dsn="servername",uid="userid",pwd="******")

#连接刚才添加进数据源的数据库,表示用户名为user,密码是****

Query <- "SELECT * FROM lib.table WHERE ..."

# Query <- readChar("data/myQuery.sql", nchars=99999)    --或者选择从SQL文件中读入语句

myData <- sqlQuery(Connection, Query, errors=TRUE)

#在R中查询

odbcCloseAll()

#最后要记得关闭连接

R通过RODBC方式进行数据存取的主要函数如下:
函数名称                               函数描述
odbcConnect(dsn, uid="", pwd="")   # 建立并打开连接  
sqlFetch(channel, sqtable)         # 从数据库读取数据表,并返回一个数据框对象
sqlQuery(channel, query)           # 向数据库提交一个查询,并返回结果
sqlSave(channel, mydf, tablename = sqtable, append = FALSE)

# 将一个数据框写入或更新(append=True)到数据库
sqlDrop(channel, sqtable)          # 从数据库删除一个表
sqlClear(channel, sqtable)   # 删除表中的内容
sqlTables(channel)  # 返回数据库中表的信息
sqlColumns(channel, sqtable)  # 返回数据库表sqtable列的信息
close(channel)  # 关闭连接

操作步骤:建立DSN——〉打开连接——〉数据操作——〉关闭连接

5、导入Excel数据

library(RODBC)

channel=odbcConnectExcel("d:/test.xls")

mydata=sqlFetch(channel,'Sheet1')      #如果是Excel2007格式数据则要换一个函数odbcConnectExcel2007

R语言:导入导出数据的更多相关文章

  1. Android开发笔记:SQLite导入导出数据

    SQLite是Android中最方便使用的数据库了,现在看下如何快速的在SQLite中导入导出数据. 首先由于是.NET项目转Android,原有数据库使用的是SQLSERVER,由于项目相同部分结构 ...

  2. R语言分析朝阳医院数据

    R语言分析朝阳医院数据 本次实践通过分析朝阳医院2016年销售数据,得出“月均消费次数”.“月均消费金额”.“客单价”.“消费趋势”等结果,并据此作出可视化图形. 一.读取数据: library(op ...

  3. CRL快速开发框架系列教程九(导入/导出数据)

    本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...

  4. mysql导入导出数据中文乱码解决方法小结

    linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题 首先要做的是要确定你导出数据的编码格式,使用mysqld ...

  5. 解决mysql导入导出数据乱码问题

    最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to ...

  6. [转]mysql导入导出数据中文乱码解决方法小结

    本文章总结了mysql导入导出数据中文乱码解决方法,出现中文乱码一般情况是导入导入时编码的设置问题,我们只要把编码调整一致即可解决此方法,下面是搜索到的一些方法总结,方便需要的朋友. linux系统中 ...

  7. oracle中导入导出数据备份数据库

    原文:oracle中导入导出数据备份数据库 数据库所在位置                         将数据导出到的文件名                    用户名 备份数据库 :exp c ...

  8. PLSQL导入/导出数据方法

    PLSQL导入/导出数据方法 PLSQL导入/导出数据方法 以前导数据库信息的时候,总是会先开启sql窗口,把自己手写的建表文件复制进去,然后再导入数据信息. 今天突然懒得去找以前的建表文件,而想用S ...

  9. oracle10g和oracle11g导入导出数据区别

    其中flxuser为用户名,flxuser为密码,file值为导入到数据库中的备份文件. oracle10g和oracle11g导入导出数据的命令方式大有不同: oracle10g导入数据: imp  ...

  10. 利用sqoop将hive数据导入导出数据到mysql

    一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令  #  sqoop list-databases --connect jdbc:mysql://localhost:3306 ...

随机推荐

  1. Starting Session of user root.

    Sep 23 01:50:01 d systemd: Started Session 1475 of user root.Sep 23 01:50:01 d systemd: Starting Ses ...

  2. python模块学习(二)

    configparser模块 软件常见文档格式如下: [DEFAULT]ServerAliveInterval = 45Compression = yesCompressionLevel = 9For ...

  3. 我的Android进阶之旅------>修改Android签名证书keystore的密码、别名alias以及别名密码

    转载于:http://blog.k-res.net/archives/1229.html  和 http://blog.k-res.net/archives/1671.html ADT允许自定义调试用 ...

  4. 两个offer如何做选择?年薪20万vs年薪15万

    (附注:本文转载于:http://www.eoeandroid.com/thread-296678-1-1.html) 前些天和一个年轻的朋友谈跳槽.朋友说她需要在两个offer里面做选择.一个是年薪 ...

  5. ORACLE中RECORD、VARRAY、TABLE的使用具体解释

     1     说明 1.1       RECORD 定义记录数据类型. 它类似于C语言中的结构数据类型(STRUCTURE).PL/SQL提供了将几个相关的.分离的.基本数据类型的变量组成一个总 ...

  6. 2.2 使用ARDUINO控制MC20发短信

    需要准备的硬件 MC20开发板 1个 https://item.taobao.com/item.htm?id=562661881042 GSM/GPRS天线 1根 https://item.taoba ...

  7. ACM解题之素矩阵

    题意: 如果一个矩形的两条边都是素数,则称此矩形为素矩形.本题给出一个素矩形的面积,请计算其两条边的值.有多个测试用例.每个用例占一行,包含一个表示素矩形面积且不超过 108 的正整数.输入直至没有数 ...

  8. 面向对象编程——super进阶(十)

    一.入门使用 在python中,使用super最常见的让子类继承父类.在这种情况下,当前类和对象可以作为super函数的参数使用,调用函数返回的任何方法都是调用超类的方法,而不是当前类的方法. cla ...

  9. Django基础(三)_分页器、COOKIE与SESSION、FORM表单

    分页器(paginator) 分页器的使用 >>> from django.core.paginator import Paginator >>> objects ...

  10. 20160422 --Switch…case 总结; 递归算法

    13 2016-04-22  11:01:00 Switch…case 总结(网摘) 例题: Console.WriteLine("1.汉堡包"); Console.WriteLi ...