[读书笔记] R语言实战 (二) 创建数据集
R中的数据结构:标量,向量,数组,数据框,列表

1. 向量:储存数值型,字符型,或者逻辑型数据的一维数组,用c()创建
** R中没有标量,标量以单元素向量的形式出现
2. 矩阵:二维数组,和向量一样只能是相同模式, 可用matrix() 创建
#byrow指定是否按行填充,默认是按列填充,dimnames包含可选的字符向量型列名和行名
mymatrix <- matrix(vector, nrow = number_of_rows, ncol =
number_of_columns, byrow = TRUE/FALSE, dimnames =
list(char_vector_rownames, char_vector_colnames)
3. 数组:和矩阵类似,维度可以大于2,通过array()函数创建
4. 数据框:不同的列可以包含不同的模式, data.frame()创建
#创建向量
a <- c(1,2,7,4,10,6)
a[c(1,3,5)]
#创建矩阵,按列填充
y <- matrix(1:20,nrow=5,ncol=4)
y
#按行填充
y <- matrix(1:20,nrow=5,ncol=4,byrow = TRUE)
y
#添加行名,列名
cells <- c(1,26,24,68)
rnames <- c("R1","R2")
cnames <- c("C1","C2")
mymatrix <- matrix(cells,nrow=2,ncol=2,byrow=TRUE,dimnames=list(rnames,cnames))
mymatrix #创建数组
dim1 <- c("A1","A2")
dim2 <- c("B1","B2","B3")
dim3 <- c("C1","C2","C3","C4")
z <- array(1:24,c(2,3,4),dimnames=list(dim1,dim2,dim3))
z
#创建数据框
patientID <- c(1,2,3,4)
age <-c(25,34,28,52)
diabetes <- c("Type1","Type2","Type2","Type1")
patientData <- data.frame(patientID,age,diabetes)
patientData
5. attach(), detach(), with()
attach()可以将数据框添加到R的搜索路径当中
detach() 将数据框从搜索路径删除
6. 列表:一些对象(或成分,component)的有序集合,某个列表可能是若干向量、矩阵、数据框、甚至其他列表的组合。可以用list()创建列表
列表是R中重要的数据结构:1)允许以一种简单的方式组织和重新调用不相干的信息,2)R中许多运行结果都是以列表的形式返回。
7. 数据输入
1) 键盘输入 edit() 函数
2) 从带分隔符的文本文件导入数据 read.table()
3) 导入EXCEL数据read.xlsx()
4) 其他
8. 处理对象实用函数
#创建向量
a1 <- c(1,4,6,8,5)
a2 <- c(5,8,6,4,1)
length(a1)
#创建3*4矩阵按行填充
mat1 = matrix(1:12,nrow=3,ncol=4,byrow=TRUE,dimnames = list(c('r1','r2','r3'),c('c1','c2','c3','c4')))
#显示矩阵维度
dim(mat1)
#显示对象结构
str(mat1)
#显示对象中各个成分的名称
names(mat1)<-c('stupid','smart')
names(mat1)
#按列合并对象
cbind(a1,a2)
#按行合并对象
rbind(a1,a2)
#显示当前对象列表
ls()
#列出对象开始部分
head(mat1)
#列出对象结束部分
tail(a1)
[读书笔记] R语言实战 (二) 创建数据集的更多相关文章
- [读书笔记] R语言实战 (一) R语言介绍
典型数据分析的步骤: R语言:为统计计算和绘图而生的语言和环境 数据分析:统计学,机器学习 R的使用 1. 区分大小写的解释型语言 2. R语句赋值:<- 3. R注释: # 4. 创建向量 c ...
- [读书笔记] R语言实战 (四) 基本数据管理
1. 创建新的变量 mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8)) #方法一 mydata$sumx<-mydata$x1+mydata$x ...
- [读书笔记] R语言实战 (十三) 广义线性模型
广义线性模型扩展了线性模型的框架,它包含了非正态的因变量分析 广义线性模型拟合形式: $$g(\mu_\lambda) = \beta_0 + \sum_{j=1}^m\beta_jX_j$$ $g( ...
- [读书笔记] R语言实战 (六) 基本图形方法
1. 条形图 barplot() #载入vcd包 library(vcd) #table函数提取各个维度计数 counts <- table(Arthritis$Improved) count ...
- [读书笔记] R语言实战 (十四) 主成分和因子分析
主成分分析和探索性因子分析是用来探索和简化多变量复杂关系的常用方法,能解决信息过度复杂的多变量数据问题. 主成分分析PCA:一种数据降维技巧,将大量相关变量转化为一组很少的不相关变量,这些无关变量称为 ...
- [读书笔记] R语言实战 (三) 图形初阶
创建图形,保存图形,修改特征:标题,坐标轴,标签,颜色,线条,符号,文本标注. 1. 一个简单的例子 #输出到图形到pdf文件 pdf("mygrapg.pdf") attach( ...
- [读书笔记] R语言实战 (五) 高级数据管理
1. 数值函数 1) 数学函数 2) 统计函数 3. 数据标准化 scale() 函数对矩阵或者数据框的指定列进行均值为0,标准化为1的标准化 mydata <- data.frame(c1=c ...
- 《R语言实战》读书笔记--为什么要学
本人最近在某咨询公司实习,涉及到了一些数据分析的工作,用的是R语言来处理数据.但是在应用的过程中,发现用R很不熟练,所以再打算学一遍R.曾经花一个月的时间看过一遍<R语言编程艺术>,还用R ...
- R语言实战(一)介绍、数据集与图形初阶
本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章 R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...
随机推荐
- Django 连接MySQL 通过pymysql 库
ython3 如何安装pymysql 库,在此不再做多的讲解,如果有想知道如何安装的朋友,请求参考下面的连接地址: 第一步:应用setting.py 文件设置mysql 数据库连接相关属性. DA ...
- Nginx 的安装 与 启动
没有图文说明,是我看着视频一步一步照做的,安装过程了,也随便把步骤记录下来了. 我是新装 Linux 服务器,所以安装过程中出现的错误也是第一遇到,希望对你们有所帮助. 也是方便自己以后再次安装 ni ...
- python pymysql存储
# _*_ coding:utf-8 _*_ import requests from bs4 import BeautifulSoup import re import pymysql def cr ...
- 项目工程的包package与文件夹的关系
项目工程的包package与文件夹的关系: 1. 包名与文件夹是分层关系,包名只是一个字符串而已,包名.对应的是层级的文件夹. 如,com.Immoc.Access包,只是一个字符串.但他对应的win ...
- MFC学习碎片
(1)MFC程序中弹出框: MessageBox(str,_T("程序执行结果"),MB_OK); AfxMessageBox("Hello&quo ...
- 【java项目实战】代理模式(Proxy Pattern),静态代理 VS 动态代理
这篇博文,我们主要以类图和代码的形式来对照学习一下静态代理和动态代理.重点解析各自的优缺点. 定义 代理模式(Proxy Pattern)是对象的结构型模式,代理模式给某一个对象提供了一个代理对象,并 ...
- Android学习之——优化篇(1)
一.优化的品质 1.简练.2.可读性强.3.模块化:4.层次性:5.设计良好.6.高效.7.优雅:8.清晰. 二.常见的编程规范 1. 基本要求 · 结构清晰,简单易懂.单个函数不超过100行 ...
- NAS配置Time Machine,在D-Link DNS-320上的配置笔记
今天打算把Time Machine备份的工作交给NAS,曾经是放在一块外置硬盘上的,尽管速度要比NAS快,可是每次插拔外接都有些麻烦.而NAS又具有实时在线.定时关机启动的功能.配合Time Mach ...
- 英语发音规则---K字母
英语发音规则---K字母 一.总结 一句话总结: 1.K发[k]音? kind [kaɪnd] n. 种类 bike [baɪk] n. 自行车 skate [skeɪt] vi. 滑冰 make [ ...
- lightoj--1410--Consistent Verdicts(技巧)
Consistent Verdicts Time Limit: 5000MS Memory Limit: 32768KB 64bit IO Format: %lld & %llu Su ...