array, matrix, list and dataframe
总结一下“入门3R”(Reading, ‘Riting, ‘Rrithmetic)中的读和写,不同的数据结构下的读写还是有点区别的。
vector
命名
1 |
month.days<-c(31,28,31,30,31,30,31,31,30,31,30,31) |
操作文本
1.文本分离
1 |
pangram<-"The quick brown fox jumps over the lazy dog" |
strplit()
函数将pangram
用空格切开,这个函数的返回值是list
1 |
words<-strsplit(pangram," ")[[1]] |
可以取出字符串数组
2.文本连接
1 |
paste(LETTERS[1:5],1:5,sep="_",collapse="---") |
用空格连接words
中的元素,paste()
接收的参数应该是多个变量,sep
决定多个向量之间的连接符,而collapse
决定统一向量中的元素怎么合并。
3.文本排序
1 |
sort(letters,decreasing=TRUE) |
4.查找文本
1 |
substr(state.name,start=3,stop=6) |
grep(pattern,x)
返回的是符合pattern的元素的在x中的位置
5.文本替换
1 |
gsub("cheap","sheep's","A wolf in cheap clothing") |
1 |
x<-c("file_a.csv","file_b.csv","file_c.csv") |
因子分类
factor(x,levels,labels)
可以创建R因子,而levels
指的是x的输入值,labels
表示新创建的因子的输出值。
因子转换
1 |
numbers<-factor(c(9,8,10,8,9)) |
有序因子
类别数据的统计
1 |
table(state.region) |
有序变量
- 使用
factor()
函数,并且指定参数ordered=TRUE
- 使用
ordered()
函数
matrix
1 |
matrix(data,ncol,nrow,byrow) |
索引、修改和命名
1 |
first.matrix<-matrix[1:12,ncol=4,byrow=TRUE] |
计算
1 |
t()###转置 |
array
向量和矩阵都是数组.
1 |
array(1:24,dim=c(3,4,2))###创建一个三维数组 |
data.frame
由矩阵创建 x.df<-as.data.frame(x)
由向量创建 data<-data.frame(x,y,z)
如果创建的变量是字符串类型,R会自动转换成因子,可以用stringAsFactor=FALSE
保持字符串类型
1 |
names(data)[2]<-'B' ###命名表头 |
操作data.frame中的值
data.frame并不是向量,而是一组向量列表。但是数据操作时可以当做矩阵来处理,访问单个变量时可以用$
,访问多个变量时可以用[]
1 |
#########修改值 |
list
1 |
#######创建list |
提取列表中的元素
- 使用
[[]]
返回元素本身 - 使用
[]
返回选定元素的列表
1 |
#########修改元素值 |
array, matrix, list and dataframe的更多相关文章
- numpy中list array matrix比较
用python中的numpy包的时候不小心踩了array和matrix的大坑,又引申一下比较list array matrix之间的异同.数据结构(Data Structures)基本上人如其名——它 ...
- array / matrix subarray/submatrix sum
Maximal Subarray Sum : O(n) scan-and-update dynamic programming, https://en.wikipedia.org/wiki/Maxim ...
- Pramp mock interview (4th practice): Matrix Spiral Print
March 16, 2016 Problem statement:Given a 2D array (matrix) named M, print all items of M in a spiral ...
- C#+无unsafe的非托管大数组(large unmanaged array in c# without 'unsafe' keyword)
C#+无unsafe的非托管大数组(large unmanaged array in c# without 'unsafe' keyword) +BIT祝威+悄悄在此留下版了个权的信息说: C#申请一 ...
- C++_Eigen函数库用法笔记——The Array class and Coefficient-wise operations
The advantages of Array Addition and subtraction Array multiplication abs() & sqrt() Converting ...
- 【LeetCode】74. Search a 2D Matrix
Difficulty:medium More:[目录]LeetCode Java实现 Description Write an efficient algorithm that searches f ...
- Spark MLlib 之 大规模数据集的相似度计算原理探索
无论是ICF基于物品的协同过滤.UCF基于用户的协同过滤.基于内容的推荐,最基本的环节都是计算相似度.如果样本特征维度很高或者<user, item, score>的维度很大,都会导致无法 ...
- pandas 数据结构基础与转换
pandas 最常用的三种基本数据结构: 1.dataFrame: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Data ...
- pandas 之 特征工程
import numpy as np import pandas as pd So far(到目前为止) in this chapter we've been concerned with rearr ...
随机推荐
- 93.QuerySet转换为SQL的条件:迭代,切片(指定步长),len函数,list函数,判断
生成一个QuerySet对象并不会马上转换为SQL语句去执行. books = Book.objects.filter(pk=3) print(connection.queries) 打印出djang ...
- 架构之道(5) - APP和Web的后台架构
当一个项目,同时需要Web.手机H5.Android,三平台同时可以测览,那就需要很简洁而有力的架构. 而我这就经历了这麽一个项目,先开发网站,然后是手机H5,最后是Android. 自信男人,无须多 ...
- 获取deeplearning电子书
deeplearning 电子书 http://www.deeplearningbook.org/ 获取文件名,有顺序 curl http://www.deeplearningbook.org/ | ...
- dsp
- DNA methylation|Transcription factors|PTM|Chromosome conformation|表观遗传学测序技术
生物医疗大数据-DNA element functions and identification Genetic vs epigenetic GENETICS 遗传学 DNA Code: 64 tr ...
- python学习笔记(26)-request模块
python学习笔记 #requests import requests #from class_005.http_resuest import HttpRequest login_url = &qu ...
- Python_实战爬虫
# -*- coding: utf-8 -*-__auther__ = "jiachaojun"__time__ = '2020/1/12 11:03'import request ...
- fibonacci-Heap(斐波那契堆)原理及C++代码实现
斐波那契堆是一种高级的堆结构,建议与二项堆一起食用效果更佳. 斐波那契堆是一个摊还性质的数据结构,很多堆操作在斐波那契堆上的摊还时间都很低,达到了θ(1)的程度,取最小值和删除操作的时间复杂度是O(l ...
- KMP匹配(模板)
先粘上我入门KMP时看的大佬的博客:orz orz 从头到尾彻底理解KMP 我觉得这篇已经讲的很详细了,希望大家能坚持看下去. 步骤 ①寻找前缀后缀最长公共元素长度对于P = p0 p1 ...pj- ...
- LeetCode No.121,122,123
No.121 MaxProfit 买卖股票的最佳时机 题目 给定一个数组,它的第 i 个元素是一支给定股票第 i 天的价格. 如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你 ...