一、数据的输入:
手动输入:edit( )函数
也可修改
mydata <- data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
 

二、创建新变量

mydata<-data.frame(x1 = c(2,2,6,4),
                   x2
= c(3,4,2,8))
 
①mydata$sumx <- mydata$x1+mydata$x2
mydata$meanx <- (mydata$x1+mydata$x2)/2
 
②attach(mydata)
mydata$sumx <- x1+x2
mydata$meanx <- (x1+x2)/2
detach(mydata)
 
③mydata <- transform(mydata,
                    sumx=
x1+x2,
                    meanx=(x1+x2)/2)
 
三、变量的重命名
函数:rename(dataframe,c(oldname="newname",oldname="newname",...))
此函数在reshape包中。

 
四、缺失值:
赋予确实值:
   <-na
检测缺失值:is.na( )  将返回同样大小的对象
排除缺失值:
x<-c(1,2,NA,3)
y<-sum(x,na.rm=TRUE)
na.rm=TRUE在计算之前移除缺失值并使用剩余值进行计算。
在使用函数处理不完整数据时,请务必查阅他们的帮助文档,检查这些函数是如何处理缺失数据的。
na.omit()移除所有含有确实值的观测。

 
五、日期值

 
附录:
manager <- c(1,2,3,4,5)
date <-
c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")
country <- c("US","US","Uk","Uk","Uk")
gender <- c("M","F","F","M","F")
age <- c(32,45,25,39,99)
q1 <- c(5,3,3,3,2)
q2 <- c(4,5,5,3,2)
q3 <- c(5,2,5,4,1)
q4 <- c(5,5,5,NA,2)
q5 <- c(5,5,2,NA,1)
leadership <- data.frame(manager,
date,country,gender,age,
                         q1,q2,q3,q4,q5,stringsAsFactors
= FALSE)
#变量的重编码
leadership$age[leadership$age == 99] <- NA
leadership$cat[leadership$age > 75] <- "Elder"
leadership$cat[leadership$age >= 55 & leadership$age
<= 75] <- "Middle Aged"
leadership$cat[leadership$age < 55] <- "Young"
#变量的重编码
leadership <- within(leadership,{
  agecat
<- NA
  agecat[age
> 75] <- "Elder"
  agecat[age
>= 55 & age <= 75] <- "Middle Aged"
  agecat[age
< 55] <- "Young"
})
#变量的重命名
fix(leadership) #调用交互式编辑器
#变量的重命名
library(reshape)
leadership <-
rename(leadership,c(manager="managerID",date="testDate"))
#变量的重命名
names(leadership)[2] <- "testDate"
#缺失值检测
is.na(leadership[,6:10])
#排除缺失值
newdata <- na.omit(leadership)

R语言数据管理(五)的更多相关文章

  1. 从零开始学习R语言(五)——数据结构之“列表(List)”

    本文首发于知乎专栏:https://zhuanlan.zhihu.com/p/60141740 也同步更新于我的个人博客:https://www.cnblogs.com/nickwu/p/125678 ...

  2. R语言数据管理(四):数据导出

    与read.*函数对应,导出函数为write.*函数. 比较常见的为write.csv和write.table. 一般格式: setwd("D:\\") write.table(y ...

  3. R语言数据管理(三):数据读入

    R的数据读入非常灵活,即可以在R软件中直接输入,也可以读入外部数据. 一.直接输入数据 ①c()函数 ②scan()函数 其功能类似c()函数,scan()实际上是一种键盘输入数据函数.当输入scan ...

  4. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  5. R语言读取Excel文档

    在R语言数据管理(三):数据读写一博文中,我曾写到有关读取xls.xlsx文件时一般将文档改成csv文件读取,这是一般做法.csv文件也有其缺点,修改较为麻烦,当文件数据较大时尤为明显.而生活中必不可 ...

  6. 《R语言实战》读书笔记--第五章 高级数据管理

    本章内容: 数学和统计函数 字符处理函数 循环和条件执行 自编函数 数据整合与重塑 5.1一个数据处理难题 5.2数值和字符处理函数 分为数值函数和字符串函数,下面是数学函数截图: ceiling.f ...

  7. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  8. R语言学习 第五篇:字符串操作

    文本数据存储在字符向量中,字符向量的每个元素都是字符串,而非单独的字符.在R中,可以使用双引号,或单引号表示字符. 一,字符串中的字符数量 函数nchar()用于获得字符串中的字符数量: > s ...

  9. 《R语言实战》读书笔记--第四章 基本数据管理

    本章内容: 操纵日期和缺失值 熟悉数据类型的转换 变量的创建和重编码 数据集的排序,合并与取子集 选入和丢弃变量 多说一句,数据预处理的时间是最长的……确实是这样的,额. 4.1一个示例 4.2创建新 ...

随机推荐

  1. #include <>与#include""区别

    <>先去系统目录中找头文件,如果没有在到当前目录下找.所以像标准的头文件 stdio.h.stdlib.h等用这个方法. 而""首先在当前目录下寻找,如果找不到,再到系 ...

  2. 模仿 BootstrapValidator 自制 模块化 表单验证

    index.html : <!DOCTYPE html> <html lang="en"> <head> <meta charset=&q ...

  3. git个人使用总结(界面版)

    最近开始使用GIT来管理测试文档,从0到1开始使用git 1.首先,使用网页登录GIT后,创建项目 2.创建项目后,需要配置一下访问者权限 3.然后在网页版GIT复制地址,git clone到 本地 ...

  4. swift 中的问号跟感叹号

    ?: 变量在使用过程中可能存在空值,则需要用?标记,否则赋空值会报错 ? 1 2 var mustNoNilValue: String = "Swift" var canNilVa ...

  5. 对LCD接口的认识

    LCD接口类型: 1.首先我们以传递的信号类型来区分主要有两大类:- 模拟信号: - VGA: Video Graphics Array- 数字信号 - TTL: Transistor Transis ...

  6. PHP浮点数运算精度造成的,订单金额支付经常少1分的问题

    最近碰见一个奇怪的问题,商城通过微信支付的订单经常少一分钱,经过排查是PHP浮点运算精度问题造成的 由PHP浮点数运算精度造成的,鸟哥的Bolg有详细的说明.http://www.laruence.c ...

  7. selenium 遇到chrome 弹出是否保存密码框

    --待验证(以下是java脚本) ChromeOptions options = new ChromeOptions(); options.addArguments("--start-max ...

  8. python学习 05 函数switch功能

    1.python没有switch功能,利用字典实现 如果用if else,可行但是效率不高

  9. 嵌入式驱动开发之sensor---sensor 图形传感器调试

    图像传感器(image sensor)复位顺序 1. 硬件复位寄存器:2. 软件复位寄存器:3. 设置时钟寄存器:4. 设置PLL倍频:5. 设置分辨率:6. 设置窗口控制:7. 设置输出顺序:8. ...

  10. 文件大小转换(b,kb,M,GB/TB)

    //转换单位 setupSize(1111111111111); function setupSize($fileSize) { $size = sprintf("%u", $fi ...