一、数据的输入:
手动输入:edit( )函数
也可修改
mydata <- data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
 

二、创建新变量

mydata<-data.frame(x1 = c(2,2,6,4),
                   x2
= c(3,4,2,8))
 
①mydata$sumx <- mydata$x1+mydata$x2
mydata$meanx <- (mydata$x1+mydata$x2)/2
 
②attach(mydata)
mydata$sumx <- x1+x2
mydata$meanx <- (x1+x2)/2
detach(mydata)
 
③mydata <- transform(mydata,
                    sumx=
x1+x2,
                    meanx=(x1+x2)/2)
 
三、变量的重命名
函数:rename(dataframe,c(oldname="newname",oldname="newname",...))
此函数在reshape包中。

 
四、缺失值:
赋予确实值:
   <-na
检测缺失值:is.na( )  将返回同样大小的对象
排除缺失值:
x<-c(1,2,NA,3)
y<-sum(x,na.rm=TRUE)
na.rm=TRUE在计算之前移除缺失值并使用剩余值进行计算。
在使用函数处理不完整数据时,请务必查阅他们的帮助文档,检查这些函数是如何处理缺失数据的。
na.omit()移除所有含有确实值的观测。

 
五、日期值

 
附录:
manager <- c(1,2,3,4,5)
date <-
c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")
country <- c("US","US","Uk","Uk","Uk")
gender <- c("M","F","F","M","F")
age <- c(32,45,25,39,99)
q1 <- c(5,3,3,3,2)
q2 <- c(4,5,5,3,2)
q3 <- c(5,2,5,4,1)
q4 <- c(5,5,5,NA,2)
q5 <- c(5,5,2,NA,1)
leadership <- data.frame(manager,
date,country,gender,age,
                         q1,q2,q3,q4,q5,stringsAsFactors
= FALSE)
#变量的重编码
leadership$age[leadership$age == 99] <- NA
leadership$cat[leadership$age > 75] <- "Elder"
leadership$cat[leadership$age >= 55 & leadership$age
<= 75] <- "Middle Aged"
leadership$cat[leadership$age < 55] <- "Young"
#变量的重编码
leadership <- within(leadership,{
  agecat
<- NA
  agecat[age
> 75] <- "Elder"
  agecat[age
>= 55 & age <= 75] <- "Middle Aged"
  agecat[age
< 55] <- "Young"
})
#变量的重命名
fix(leadership) #调用交互式编辑器
#变量的重命名
library(reshape)
leadership <-
rename(leadership,c(manager="managerID",date="testDate"))
#变量的重命名
names(leadership)[2] <- "testDate"
#缺失值检测
is.na(leadership[,6:10])
#排除缺失值
newdata <- na.omit(leadership)

R语言数据管理(五)的更多相关文章

  1. 从零开始学习R语言(五)——数据结构之“列表(List)”

    本文首发于知乎专栏:https://zhuanlan.zhihu.com/p/60141740 也同步更新于我的个人博客:https://www.cnblogs.com/nickwu/p/125678 ...

  2. R语言数据管理(四):数据导出

    与read.*函数对应,导出函数为write.*函数. 比较常见的为write.csv和write.table. 一般格式: setwd("D:\\") write.table(y ...

  3. R语言数据管理(三):数据读入

    R的数据读入非常灵活,即可以在R软件中直接输入,也可以读入外部数据. 一.直接输入数据 ①c()函数 ②scan()函数 其功能类似c()函数,scan()实际上是一种键盘输入数据函数.当输入scan ...

  4. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  5. R语言读取Excel文档

    在R语言数据管理(三):数据读写一博文中,我曾写到有关读取xls.xlsx文件时一般将文档改成csv文件读取,这是一般做法.csv文件也有其缺点,修改较为麻烦,当文件数据较大时尤为明显.而生活中必不可 ...

  6. 《R语言实战》读书笔记--第五章 高级数据管理

    本章内容: 数学和统计函数 字符处理函数 循环和条件执行 自编函数 数据整合与重塑 5.1一个数据处理难题 5.2数值和字符处理函数 分为数值函数和字符串函数,下面是数学函数截图: ceiling.f ...

  7. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  8. R语言学习 第五篇:字符串操作

    文本数据存储在字符向量中,字符向量的每个元素都是字符串,而非单独的字符.在R中,可以使用双引号,或单引号表示字符. 一,字符串中的字符数量 函数nchar()用于获得字符串中的字符数量: > s ...

  9. 《R语言实战》读书笔记--第四章 基本数据管理

    本章内容: 操纵日期和缺失值 熟悉数据类型的转换 变量的创建和重编码 数据集的排序,合并与取子集 选入和丢弃变量 多说一句,数据预处理的时间是最长的……确实是这样的,额. 4.1一个示例 4.2创建新 ...

随机推荐

  1. Vector的一种实现(二)

      增加了逆置迭代器的实现 以及swap功能   完整代码如下: #ifndef VECTOR_H_ #define VECTOR_H_ #include <stddef.h> #incl ...

  2. &&与&符号区别

    http://topic.csdn.net/u/20080915/16/f5125300-f69f-4da8-9c3a-a7458590553f.html && 与 &区别: ...

  3. Unity3d 发动机原理详细介绍

    Unity3d 发动机原理详细介绍 www.MyException.Cn   发布于:2013-10-08 16:32:36   浏览:46次 0     Unity3d 引擎原理详细介绍 体系结构 ...

  4. springboot 中使用AOP

    网上关于AOP的例子好多,各种名词解释也一大堆,反正名词各种晦涩,自己写个最最最简单的例子入门mark一下,以后再深入学习. maven依赖 <dependency> <groupI ...

  5. Hotel poj 3667

    Language: Default Hotel     Time Limit: 3000MS   Memory Limit: 65536K Total Submissions: 18020   Acc ...

  6. ActiveMQ与xml rpc

    最近项目在做平台间的消息传递,也让我对平台间消息的传递进行了深一步的探讨.先叙述一下概况 公司上一个版本用的是winform做的监控软件,主要做设备的通信和控制,基本的连接如下

  7. java心跳发送

    java心跳发送: 大家都知道.如果你在互联网公司,并且开发的是产品那你一定接触不到.心跳机制.心跳包 那什么是心跳机制呢? 心跳机制就是定时发送一个自定义的结构体(心跳包).确保连接的有效的机制. ...

  8. 如何使用eclipse创建Maven工程及其子模块

    http://blog.csdn.net/jasonchris/article/details/8838802 http://www.tuicool.com/articles/RzyuAj 1,首先创 ...

  9. Openstack(Kilo)安装系列之环境准备(一)

    本文采用VMware虚拟环境,使用CentOS 7.1作为openstack的基础环境. 一.基础平台 1.一台装有VMware的windows系统(可联网) 2.CentOS 7.1 64bit镜像 ...

  10. mysql-5.1.73多实例安装启动

    一.源码包下载:http://download.softagency.net/MySQL/Downloads/MySQL-5.1/ 二.编译安装 groupadd mysql useradd -r - ...