R: data.frame 数据框的:查询位置、排序(sort、order)、筛选满足条件的子集。。
###################################################
问题:数据框 data.frame 查、排序等, 18.4.27
怎么对数据框 data.frame实施 查询位置、查询满足条件的个案数、、排序、 ???
解决方案:
#查询位置
weizhi <- which(iris$Sepal.Length >= 6.9) #返回一个向量,显示的是所有 >=6.9的行的行号
max(iris$Sepal.Length) #[1] 7.9
which(iris$Sepal.Length == max(iris$Sepal.Length)) #[1] 132
which(iris$Species == "setosa" & iris$Sepal.Length >= 5.1) #which 返回满足其内条件的元素的位置。
x[x==3] <- 25;x #将x中等于3的元素值变为25
x[x=1] <- 12;x #将x的第1个元素数值变为12
which.max(a) # 找出最大元素的下标
which.min(a) # 找出大小的元素下标
which(a==2) # 等于2的元素的下标
which(a>5) # 大于5的元素的下标
a[which.max(a)] # 找出最大的元素
a[which(a>5)] # 所有的值大于5的元素
#查询满足条件的个案数
length(which(iris$Species == "setosa" & iris$Sepal.Length >= 5.1))
sum(iris$Sepal.Length >= 6) #统计个数,统计 iris$Sepal.Length 中大于等于6的数有多少个
#排序
#order(); #输出原行号,按照要求排序后的向量 order返回的是排序后的索引。
order(iris$Sepal.Length) #[1] 9 4 7 3 2 10 5 8 1 6 ;返回原来的行号按照iris$Sepal.Length排序后的向量
inew = iris[order(iris$Sepal.Length),] #由于要对行排序,所以条件要写在 中括号内 行的位置。
inew2 = iris[order(iris$Sepal.Length,-iris2$Sepal.Width),] #默认升序 本例按iris$Sepal.Length升序,按iris$Sepal.Width降序。
#sort(); #直接输出排序后的结果。
讨论扩展:
另请参阅:
###################################################
问题:筛选子集(行子集) 18.4.24
根据 data.frame 中某列,如何筛选满足条件的行,组成一个子集
解决方案:
cond <- iris$Species == "setosa" & iris$Sepal.Length >= 5.1 #筛选条件,返回一个与 iris$Species 长度相同的布尔向量。满足条件的为TRUE。
# 和& 或| 不等于!= 大于> 小于< ,自由组合 #如果筛选对象是因子变量,需要带引号 == “”
筛选子集 法一:用 subset 选子集
iris_setosa1 <- subset(iris,cond);
iris_setosa1 <- subset(iris,cond,select = c(1:3)); #select 用来选择 “只取select内的列” 。
iris.del.col2 <- subset(iris,cond,select = -Sepal.Width)
iris.del.col2 <- subset(iris,cond,select = c(-Sepal.Width,-Petal.Width)) #以下均可:select = c(Sepal.Width,Petal.Width) select = c(Sepal.Width,5)
筛选子集 法二:
iris_setosa2 <- iris[cond,];
newdata <- iris[which(cond),c(1,2,5)] #选择满足条件的行和列,一并生成新变量
讨论扩展:
对列筛选:
subset(dfrm,select=c(colname1,colname2,...,colnames),subset = (temp)); #同时实现对行、列的筛选。。内部subset对行进行筛选。
student[which(student$Gender==”F”),”Age”] #筛选后,只取“Age列”,条件得到一个布尔向量:FALSE FALSE TRUE,然后使用which函数可以将布尔向量中TRUE的Index返回,
iris.Species2 = iris[iris$Species == "setosa",] #等价,更常用。和& 或| 不等于!= 大于> 小于< ,自由组合
#如果筛选对象是因子变量,需要带引号 == “”
newdata <- iris[which(iris$Species =='setosa' & iris$Sepal.Length > 5.0),c(1,2,5)]
iris_6 <- subset(iris,iris$Sepal.Length >6 | iris$Sepal.Width>4,select = c(1:3))
另请参阅:
R: data.frame 数据框的:查询位置、排序(sort、order)、筛选满足条件的子集。。的更多相关文章
- R语言Data Frame数据框常用操作
Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的. Data Frame每一列有列名,每一行也可 ...
- 转载:R语言Data Frame数据框常用操作
Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的. Data Frame每一列有列名,每一行也可 ...
- 用R语言提取数据框中日期对应年份(列表转矩阵)
用R语言提取数据框中日期对应年份(列表转矩阵) 在数据处理中常会遇到要对数据框中的时间做聚类处理,如从"%m/%d/%Y"中提取年份. 对应操作为:拆分成列表——列表转矩阵——利用 ...
- R语言中将数据框(data.frame)中字符型数据转化为数值型
as.data.frame(lapply(data,as.numeric))
- R语言学习——数据框
> #数据框可以包含不同模式(数值型.字符型.逻辑型等)的数据,是R中最常处理的数据结构.数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,c ...
- 2-7 R语言基础 数据框
#数据框 > df <- data.frame(id=c(1,2,3,4),name=c("a","b","c","d ...
- R: data.frame 生成、操作数组。重命名、增、删、改
################################################### 问题:生成.操作数据框 18.4.27 怎么生成数据框 data.frame.,,及其相关操 ...
- R Data Frame
https://www.datamentor.io/r-programming/data-frame/ Check if a variable is a data frame or not We ca ...
- R语言中数据框的横向合并与纵向合并
#横向合并ID<-c(1,2,3,4)name<-c("Jim","Tony","Lisa","Tom")s ...
随机推荐
- 【LeetCode】【数组归并】Merge k Sorted Lists
描述 Merge k sorted linked lists and return it as one sorted list. Analyze and describe its complexity ...
- java入门了解12
1.SequenceInputStream序列流:能将其他输入流的串联 用处:读完第一个再去读第二个输入流 用法:构造方法:SequenceInputStream(InputStream s1,Inp ...
- adobe flash player 下载地址
1. https://www.adobe.com/cn/products/flashplayer/distribution3.html
- Android_微信_设置
减少 内存的使用 (http://news.ifeng.com/a/20170716/51440541_0.shtml) 1.关闭“附近的人” 打开微信,依次点击[我]—[设置]—[通用]—[功能], ...
- python第七篇:Python 列表操作详解
Python列表操作详解 list函数 list() #生成一个空的列表 list(iterable) #用可迭代对象初始化一个列表 列表的 and 运算和 or 运算 列表and运算 > ...
- hash算法打散存储文件
1.首先,为防止一个目录下面出现太多文件,所以使用hash算法打散存储 举例代码: int hashcode = filename.hashCode();//得到hashCode int dir1 = ...
- django admin扩展user表password验证及set_password
一般如果扩展了django user内置表,在admin后台创建新用户的时候密码将会变成明文,故而导致登录不成功.所以我们在admin.py可以通过form自定义进行对password进行操作,可以双 ...
- How to reduce Index size on disk?减少ES索引大小的一些小手段
ES索引文件瘦身总结如下: 原始数据:(1)学习splunk,原始data存big string(2)原始文件还可以再度压缩倒排索引:(1)去掉不必要的倒排索引信息:例如文件位置倒排._source和 ...
- vue2.0项目实战使用axios发送请求
在Vue1.0的时候有一个官方推荐的 ajax 插件 vue-resource,但是自从 Vue 更新到 2.0 之后,官方就不再更新 vue-resource. 关于为什么放弃推荐? -> 尤 ...
- C++中Segmentation fault(Core Dump)错误处理
什么是Core Dump? Core的意思是内存, Dump的意思是扔出来, 堆出来. 开发和使用Unix程序时, 有时程序莫名其妙的down了, 却没有任何的提示(有时候会提示core dumped ...