R语言中的read.table()

参考资料：http://www.cnblogs.com/xianghang123/archive/2012/06/06/2538274.html

read.table(file, header = FALSE, sep = "", quote = "\"'",

           dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),

           row.names, col.names, as.is = !stringsAsFactors,

           na.strings = "NA", colClasses = NA, nrows = -1,

           skip = 0, check.names = TRUE, fill = !blank.lines.skip,

           strip.white = FALSE, blank.lines.skip = TRUE,

           comment.char = "#",

           allowEscapes = FALSE, flush = FALSE,

           stringsAsFactors = default.stringsAsFactors(),

           fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

file 指定读入的文件
header 是否有列名（默认无）
seq 指定分隔符(空格、TAB、换行符、回车符)
quote 制定包围字符型数据的字符。默认情况下，字符串可以被 " 或 ’ 括起，并且两种情况下，引号内部的字符都作为字符串的一部分。有效的引用字符（可能没有）的设置由参数 quote 控制。默认值改为 quote = “”
dec = “.” 指定小数点数
colClasses 指定列的数据类型格式
row.names 指定各行名称，也可以是数字，指定某列为行名
col.names
as.is = !stringsAsFactors as.is 字符向量是否转换成因子（仅仅这个功能），TRUE时保留为字符型
na.strings = “NA” 指定什么样的字符表示值缺少
colClasses = NA colClasses运行为输入中的每个列设置需要的类型。注意，colClasses 和 as.is 对每列专用，而不是每个变量。因此，它对行标签列也同样适用（如果有的话）。
nrows = -1 最大读入行数，即读入前多少行，“-1”表示都读入
skip = 0 跳过文件的前n行（skip = n）
check.names = TRUE # 检查变量名在R中是否有效
fill = !blank.lines.skip 从一个电子表格中导出的文件通常会把拖尾的空字段（包括?堑姆指舴? 忽略掉。为了读取这样的文件，必须设置参数 fill = TRUE
strip.white = FALSE 如果设定了分隔符，字符字段起始和收尾处的空白会作为字段一部分看待的。为了去掉这些空白，可以使用参数 strip.white = TRUE
blank.lines.skip = TRUE 默认情况下，read.table 忽略空白行。这可以通过设置 blank.lines.skip = FALSE 来改变。但这个参数只有在和 fill = TRUE 共同使用时才有效。这时，可能是用空白行表明规则数据中的缺损样本。
comment.char = “#” 默认情况下，read.table 用 # 作为注释标识字符。如果碰到该字符（除了在被引用的字符串内），该行中随后的内容将会被忽略。只含有空白和注释的行被当作空白行。如果确认数据文件中没有注释内容，用 comment.char = “” 会比较安全（也可能让速度比较快）。
allowEscapes = FALSEread.table 和 scan 都有一个逻辑参数 allowEscapes。从 R 2.2.0 开始，该参数默认为否，而且反斜杠是唯一被解释为逃逸引用符的字符（在前面描述的环境中）。如果该参数设为是，以C形式的逃逸规则解释，也就是控制符如 , , , , , , 八进制和十六进制如 40 和 x2A 一样描述。任何其它逃逸字符都看着是自己，包括反斜杠

women1.txt

name	height	weight	tmp

stu1	58	115	1.1

stu2	59	117	1.2

stu3	60	120	1.3

stu4	61	123	1.4

stu5	62	126	1.5

stu6	63	129	1.6

stu7	64	132	1.7

stu8	65	135	1.8

stu9	66	139	1.9

stu10	67	142	2

stu11	68	146	2.1

stu12	69	150	2.2

stu13	70	154	2.3

stu14	71	159	2.4

stu15	72	164	2.5

## 基本参数

dataset1 <- read.table("./women1.txt", header = T, sep = "\t")

head(dataset1)

##   name height weight tmp

## 1 stu1     58    115 1.1

## 2 stu2     59    117 1.2

## 3 stu3     60    120 1.3

## 4 stu4     61    123 1.4

## 5 stu5     62    126 1.5

## 6 stu6     63    129 1.6

dataset1$name

##  [1] stu1  stu2  stu3  stu4  stu5  stu6  stu7  stu8  stu9  stu10 stu11

## [12] stu12 stu13 stu14 stu15

## 15 Levels: stu1 stu10 stu11 stu12 stu13 stu14 stu15 stu2 stu3 ... stu9

class(dataset1$name)

## [1] "factor"

is.factor(dataset1$name)

## [1] TRUE

dataset1 <- read.table("./women1.txt", header = T, sep = "\t", as.is = T)

head(dataset1)

##   name height weight tmp

## 1 stu1     58    115 1.1

## 2 stu2     59    117 1.2

## 3 stu3     60    120 1.3

## 4 stu4     61    123 1.4

## 5 stu5     62    126 1.5

## 6 stu6     63    129 1.6

dataset1$name

##  [1] "stu1"  "stu2"  "stu3"  "stu4"  "stu5"  "stu6"  "stu7"  "stu8"

##  [9] "stu9"  "stu10" "stu11" "stu12" "stu13" "stu14" "stu15"

class(dataset1$name)

## [1] "character"

is.factor(dataset1$name)

## [1] FALSE

## skip = 0 跳过文件的前n行（skip = n）

dataset2 <- read.table("./women1.txt", header = T, sep = "\t", skip = 3)

head(dataset2)

##   stu3 X60 X120 X1.3

## 1 stu4  61  123  1.4

## 2 stu5  62  126  1.5

## 3 stu6  63  129  1.6

## 4 stu7  64  132  1.7

## 5 stu8  65  135  1.8

## 6 stu9  66  139  1.9

dataset2 <- read.table("./women1.txt", header = F, sep = "\t", skip = 3)

head(dataset2)

##     V1 V2  V3  V4

## 1 stu3 60 120 1.3

## 2 stu4 61 123 1.4

## 3 stu5 62 126 1.5

## 4 stu6 63 129 1.6

## 5 stu7 64 132 1.7

## 6 stu8 65 135 1.8

## nrows = -1 最大读入行数，“-1”表示都读入

dataset3 <- read.table("./women1.txt", header = T, sep = "\t", nrows = 3)

head(dataset3)

##   name height weight tmp

## 1 stu1     58    115 1.1

## 2 stu2     59    117 1.2

## 3 stu3     60    120 1.3

dataset3 <- read.table("./women1.txt", header = F, sep = "\t", nrows = 3)

head(dataset3)

##     V1     V2     V3  V4

## 1 name height weight tmp

## 2 stu1     58    115 1.1

## 3 stu2     59    117 1.2

## 指定行名

dataset4 <- read.table("./women1.txt", header = T, sep = "\t", row.names = 1) # **表中第一行一列元素被跳过**

head(dataset4)

##      height weight tmp

## stu1     58    115 1.1

## stu2     59    117 1.2

## stu3     60    120 1.3

## stu4     61    123 1.4

## stu5     62    126 1.5

## stu6     63    129 1.6

row.names(dataset4)

##  [1] "stu1"  "stu2"  "stu3"  "stu4"  "stu5"  "stu6"  "stu7"  "stu8"

##  [9] "stu9"  "stu10" "stu11" "stu12" "stu13" "stu14" "stu15"

women2.txt

\ 这是一些简单的测试数据

name	height	weight	tmp

/stu1/	58	115	1*1

/stu2/	59	117	1*2

/stu3/	60	""	1*3\注意：空格处经测试必须引起来，

					\否则会出先error“……line 3 did not have 4 elements”

/stu4/	61	123	1*4

/stu5/	62	NO	1*5

/stu6/	NO	NO	1*6

/stu7/	64	132	1*7

/stu8/	65	135	1*8

/stu9/	66	139	1*9

/stu10/	NA	NA	2*0

/stu11/	68	146	2*1

/stu12/	69	150	2*2

/stu13/	70	154	2*3

/stu14/	71	159	2*4

/stu15/	72	164	2*5

## dec = “.” 指定小数点数;na.strings = “NA” 指定什么样的字符表示值缺少;comment.char 只能设定一个

data1 <- read.table("./women2.txt", header = T, dec = "*", na.strings = c("", "NA", "NO"), comment.char = "\\")

head(data1)

##     name height weight tmp

## 1 /stu1/     58    115 1.1

## 2 /stu2/     59    117 1.2

## 3 /stu3/     60     NA 1.3

## 4 /stu4/     61    123 1.4

## 5 /stu5/     62     NA 1.5

## 6 /stu6/     NA     NA 1.6

sapply(data1[1:6,], is.na)

##       name height weight   tmp

## [1,] FALSE  FALSE  FALSE FALSE

## [2,] FALSE  FALSE  FALSE FALSE

## [3,] FALSE  FALSE   TRUE FALSE

## [4,] FALSE  FALSE  FALSE FALSE

## [5,] FALSE  FALSE   TRUE FALSE

## [6,] FALSE   TRUE   TRUE FALSE

sapply(data1, class)

##      name    height    weight       tmp

##  "factor" "integer" "integer" "numeric"

# quote的设定

data1 <- read.table("./women2.txt", header = T, dec = "*", na.strings = c("", "NA", "NO"), comment.char = "\\", quote = "/", as.is = F)

head(data1)

##   name height weight tmp

## 1 stu1     58    115 1.1

## 2 stu2     59    117 1.2

## 3 stu3     60     "" 1.3

## 4 stu4     61    123 1.4

## 5 stu5     62   <NA> 1.5

## 6 stu6     NA   <NA> 1.6

sapply(data1, class)

##      name    height    weight       tmp

##  "factor" "integer"  "factor" "numeric"

R语言中的read.table()的更多相关文章

R语言中的factor
对于初学者来说,R语言中的factor有些难以理解.如果直译factor为“因子”,使得其更加难以理解.我倾向于不要翻译,就称其为factor,然后从几个例子中理解: <span style=& ...
掌握R语言中的apply函数族（转）
转自:http://blog.fens.me/r-apply/ 前言刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算. 那么,这是 ...
R语言中apply函数
前言刚开始接触R语言时,会听到各种的R语言使用技巧,其中最重要的一条就是不要用循环,效率特别低,要用向量计算代替循环计算. 那么,这是为什么呢?原因在于R的循环操作for和while,都是基于R语言 ...
R语言中的MySQL操作
R语言中,针对MySQL数据库的操作执行其实也有很多中方式.本人觉得,熟练掌握一种便可,下面主要就个人的学习使用情况,总结其中一种情况-----使用RMySQL操作数据库. 1.下载DBI和RMySQ ...
R 语言中 data table 的相关，内存高效的增量式 data frame
面对的是这样一个问题,不断读入一行一行数据,append到data frame上,如果用dataframe, rbind() ,可以发现数据大的时候效率明显变低. 原因是每次bind 都是一次重新 ...
R语言中的Apriori关联规则的使用
1.下载Matrix和arules包 install.packages(c("Matrix","arules")) 2.载入引入Matrix和arules包 # ...
R语言中 fitted()和predict()的区别
fitted是拟合值,predict是预测值.模型是基于给定样本的值建立的,在这些给定样本上做预测就是拟合.在新样本上做预测就是预测. 你可以找一组数据试试,结果如何. fit<-lm(weig ...
R语言中Fisher判别的使用方法
最近编写了Fisher判别的相关代码时,需要与已有软件比照结果以确定自己代码的正确性,于是找到了安装方便且免费的R.这里把R中进行Fisher判别的方法记录下来. 1. 判别分析与Fisher判别不 ...
rugarch包与R语言中的garch族模型
来源:http://www.dataguru.cn/article-794-1.html rugarch包是R中用来拟合和检验garch模型的一个包.该包最早在http://rgarch.r-forg ...

随机推荐

BUAA 2020 软件工程热身作业
BUAA 2020 软件工程热身作业 Author: 17373051 郭骏项目内容这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰任健) 这个作业的要求在哪里第一次作业-热身! ...
阿里Nacos部署
Nacos的部署一.单机部署 **4.修改 Nacos 存储为 Mysql** 二.集群部署 1.机器部署列表 2.修改 `nacos/conf/application.properties`中的端 ...
spring security中ajax超时处理
spring security为我们的系统提供了方便的认证和授权操作.在系统中完成认证和授权后,一般页面页面上大多数是ajax和后台进行操作,那么这个时候可能就会面临session超时,ajax去访问 ...
单片机stm32零基础入门之--初识STM32 标准库
CMSIS 标准及库层次关系因为基于Cortex 系列芯片采用的内核都是相同的,区别主要为核外的片上外设的差异,这些差异却导致软件在同内核,不同外设的芯片上移植困难.为了解决不同的芯片厂商生产的Co ...
嵌入式开发板nfs挂载
板子要开始调试了,第一个头大的问题就是调试过程中更新的文件怎么更新到板子上,以前用sd卡拷贝来来回回太浪费时间了,adb也需要接线各种连接操作. 现在板子有wifi可用,是时候把nfs共享搭起来了. ...
accept error: Too many open files
今天测试socket服务器同一时间处理多个客户端连接问题,第一次测试1000个的时候没问题,第二次测试1000个服务器accept的时候就报错了 accept error: Too many open ...
ubuntn 一直循环登录界面（卸载nvidia驱动）
由于在Ubuntu下安装了Nvidia显卡驱动后开机一直处于循环登录界面,密码输入正确也是进不去,然后就决定卸载Nvidia显卡驱动.首先是在能使用tty1登录的情况下,使用 $ sudo apt-g ...
hdu 2199 Can you solve this equation?（二分法求多项式解）
题意给Y值,找到多项式 8*x^4 + 7*x^3 + 2*x^2 + 3*x + 6 == Y 在0到100之间的解. 思路从0到100,多项式是单调的,故用二分法求解. 代码 double c ...
Vue3学习（十）之页面、菜单、路由的使用
一.前言好几天没更文了,周末真的太冷了,在家躺了一天不爱动.今天给暖气了,相对不那么冷了,就可以继续更文了. 由文章标题不难看出,就是实现点击菜单跳转的意思,我写的很直白了,哈哈. 二.实现点击菜单 ...
linux 的逻辑卷管理
lvm 逻辑卷管理器关于逻辑卷管理lvm的一些操作新建磁盘 sdcfdisk /dev/sdc 创建分区,更改分区id 为8e,改变分区类型为 lvm linux 创建物理卷与pv相关 pvcre ...

R语言中的read.table()

R语言中的read.table()的更多相关文章

随机推荐

热门专题