1 向量

1.1 定义向量

向量使用c来赋值,向量中不能混合不同类型的数据

x<-c(2,3,7,6,8)  数值型num

y<-("one","two","three")  字符型chr

z<-c(TRUE,TRUE,FALSE)  逻辑型logi

查看变量的类型:class(x)

1.2 访问向量

访问中的元素,使用中括号(R语言区分大小写),R语言索引从1开始

访问第二个元素:x[2]

访问第1和第3个元素:x[c(1,3)]

访问第1都第3的元素:x[c(1:3)] 或者x[1:3]

2 矩阵

2.1 定义矩阵

矩阵是二维的,矩阵中的数据类型不能混合

矩阵创建使用matrx():

x<-matrix(1:20,nrow=5,ncol=4)

解释 : 1:20定义了矩阵中的数据是1到20,规定了5行4列,默认情况下矩阵按列填充

添加一个字段byrow=T,是否按行填充,设置为TRUE或者T :

x1<-matrix(1:20,nrow=5,ncol=4,byrow=T)

2.2 矩阵的索引

获取第1行:x1[1,]

获取第3列:x1[,3]

获取第3行第4列:x1[3,4]

获取第3行第1,2列:x1[3,c(1,2)]

3 数组

3.1 定义数组

数组可以是二维,三维,使用array创建,定义2行3列的4张表

定义变量:

d1<-c("m1","m2")

d2<-c("n2","n2","n3")

d3<-c("p1","p2","p3","p4")

使用array组合成数组:

x2<-array(1:24,c(2,3,4),dimnames = list(d1,d2,d3))

解释: 1:24用来个创建的数组填充数据,c(2,3,4)用来确定数组的维度,dimnames用来给创建的数组取名字(以下是部分截图)

4 数据框

4.1 定义数据框

数据框可以混合不同类型的数据

首先定义几个变量:

patientID<-c(1,2,3,4)

age<-c(26,30,27,48)

diabetes<-c("type1","type2","type1","type2")

status<-c("poor","improved","excellent","poor")

使用data.frame构成数据框:

pt<-data.frame(patientID,age,diabetes,status)

4.2 访问数据框

访问数据框用中括号,访问第1和第2列:p1<-pt[1:2]

使用列名,访问某列:p2<-pt[c("age","status")]

4.3频数表和交叉表

频数分析:table(pt$status)

交叉分析:table(pt$diabetes,pt$status)

4.4变量搜索路径指定

(1)用attach将表添加到搜索路径(为了避免每次都要写$):attach(pt)

不需要这个表用detach,语句是:detach(pt)

(2)不想每次写表名,还可以使用with:

with(mtcars,{

+ plot(mpg,disp)

+ plot(mpg,wt)

+ })

在实际应用中建议把表名写清楚,不建议这样做

5 因子factor

5.1名义型变量

diabetes<-c("type1","type2","type1","type2")

diabetes1<-factor(diabetes)

5.2 有序型变量order,值顺序指定level

status<-c("poor","improved","excellent","poor")

status1<-factor(status,ordered = T,levels = c("poor","improved","excellent"))

5.3 案例(作业)

有因子变量在表中:

patientID<-c(1,2,3,4)

age<-c(26,30,27,48)

diabetes<-c("type1","type2","type1","type2")

status<-c("poor","improved","excellent","poor")

diabetes1<-factor(diabetes)

status1<-factor(status,ordered = T,levels = c("poor","improved","excellent"))

Pt1<-data.frame(patientID,age,diabetes1,status1)

分析这个表使用summary(pt1),patientID和age为数值型,所以计算了它们的最大最小均值等,diabetes1和status1为因子变量,所以统计了它们的属性出现的次数。

 

6 列表list,可以混合以上各种数据

6.1 列表的定义

首先定义几个变量:

x<-"aaaa"

y<-c(22,44,55)

z<-matrix(1:9,nrow=3)

k<-c("one","two","three")

list1<-list(x,y,z,k)

给列表中的元素赋值:list2<-list(var1=x,var2=y,var3=z,var4=k)

6.2 列表的访问

用两个中括号或者访问名字

list2[[1]]

list2[["var1"]]

6.3 列表的用途

R语言的很多分析结果,都是以list形式返回的

R语言六种数据类型的更多相关文章

  1. 大数据平台R语言web UI应用架构 设计与开发

    1. 系统拓扑图 在日常业务分析中,R是非常常用的分析工具,而当数据量较大时,用R语言需要需用更多的时间来完成训练模型,spark作为大规模数据处理框架,采用内存计算,可以短时间内完成大量的数据的处理 ...

  2. R语言入门(一)简介安装

    数据挖掘常用的语言有R语言,python,SQL等,其中R语言最受欢迎.(注:SQL Server包含微软研究院开发的两种数据挖掘算法:Microsoft决策树和Microsoft聚集,此外还支持第三 ...

  3. 第二章 R语言数据结构

    R语言存储数据的结构包括:标量.向量.矩阵.数组.数据框和列表:可以处理的数据类型包括:数值型.字符型.逻辑型.复数型和原生型. 数据结构 向量 向量是用来存储数值型.字符型或逻辑型数据的一维数组.单 ...

  4. No.1 R语言在生物信息中的应用——序列读取及格式化输出

    目的:读入序列文件(fasta格式),返回一个数据框,内容包括--存储ID.注释行(anno).长度(len).序列内容(content) 一.问题思考: 1. 如何识别注释行和序列内容行 2. 如何 ...

  5. R语言 数据类型

    R语言数据类型 通常,在使用任何编程语言进行编程时,您需要使用各种变量来存储各种信息. 变量只是保留值的存储位置. 这意味着,当你创建一个变量,你必须在内存中保留一些空间来存储它们. 您可能想存储各种 ...

  6. R语言编程艺术# 数据类型向量(vector)

    R语言最基本的数据类型-向量(vector) 1.插入向量元素,同一向量中的所有的元素必须是相同的模式(数据类型),如整型.数值型(浮点数).字符型(字符串).逻辑型.复数型等.查看变量的类型可以用t ...

  7. R语言数据类型

    R语言数据类型[转!!]Zhao-Pace  https://www.cnblogs.com/zhao441354231/p/5970544.html   R语言用来存储数据的对象包括: 向量, 因子 ...

  8. R语言编程艺术#01#数据类型向量(vector)

    R语言最基本的数据类型-向量(vector) 1.插入向量元素,同一向量中的所有的元素必须是相同的模式(数据类型),如整型.数值型(浮点数).字符型(字符串).逻辑型.复数型等.查看变量的类型可以用t ...

  9. R语言数据类型与数据结构

    一.数据类型 5种 1.character 字符 2.numeric 数值 3.integer 整数 一般数字的存储会默认为数值类型,如果要强调是整数,需要在变量值后面加上 L. x <- 5L ...

随机推荐

  1. [bug] org.yaml.snakeyaml.error.YAMLException: java.nio.charset.MalformedInputException: Input length = 2

    原因 SpringBoot启动加载yml配置文件出现编码格式错误 参考 https://www.pianshen.com/article/2431144034/

  2. awk sed grep 常用命令

    文本间隔 在每一行后面增加一空行: sed G sed G v1 >v2 在每一行后面增加两行空行: sed 'G;G' 将第一个脚本所产生的所有空行删除(即删除所有偶数行): sed 'n;d ...

  3. python文件对象几种操作模式区别——文件操作方法详解

    文件对象的字节模式/b模式(以utf-8编码为例) 读操作 写操作 指针操作 ASCII字节 返回bytes/字节类型的Ascii 写入bytes类型字节 例如:b'This is ascii' 使用 ...

  4. Linux利用nc命令脚本批量检测服务器指定端口是否开放

    一.nc命令检测端口的用法 # nc -v -w 10 %IP% -z %PORT% -v 显示指令执行过程. -w <超时秒数> 设置等待连线的时间. -u 表示使用UDP协议 -z 使 ...

  5. Linux——定时清空日志内容和删除日志文件

    前言 最近在做性能压测试,会生成大量的日志,导致后续越压越慢,最终磁盘空间占满之类的问题.老是要手动删除日志文件,为避免此类问题发生,编写一个Linux日志定时清理的脚本,一劳永逸. 1.shell脚 ...

  6. Git-【技术干货】工作中Git的使用实践

    Git-[技术干货]工作中Git的使用实践 置顶 2019-09-17 21:02:16 web洋仔 阅读数 11444更多 分类专栏: Git   版权声明:本文为博主原创文章,遵循CC 4.0 B ...

  7. 把采集到的数据发送到一个Google Docs或者Google Form上 这个网站提供了参考和例子

    把采集到的数据发送到一个Google Docs或者Google Form上这个网站提供了参考和例子 http://www.instructables.com/id/Post-to-Google-Doc ...

  8. gpcj-07.为什么是连锁零售类公司

    1.量化分析的真面目 本课的目的: ·理解零售类公司价值分析的逻辑·学会量化分析公司的思路和原理前言的前沿 和大部分投资者不同,我们的投资核心之一,就是从下而上的分析.宏观经济对我们公司分析影响极少. ...

  9. pika详解(三)SelectConnection及其他Connection

    pika详解(三)SelectConnection及其他Connection   本文链接:https://blog.csdn.net/comprel/article/details/94661147 ...

  10. Step By Step(Lua数据持久化)

    Step By Step(Lua数据持久化) 1. 数据文件:    我们可以利用Lua中table的构造式来定义一种文件格式,即文件中的数据是table构造并初始化的代码,这种方式对于Lua程序而言 ...