array, matrix, list and dataframe
总结一下“入门3R”(Reading, ‘Riting, ‘Rrithmetic)中的读和写,不同的数据结构下的读写还是有点区别的。
vector
命名
1 |
month.days<-c(31,28,31,30,31,30,31,31,30,31,30,31) |
操作文本
1.文本分离
1 |
pangram<-"The quick brown fox jumps over the lazy dog" |
strplit()函数将pangram用空格切开,这个函数的返回值是list
1 |
words<-strsplit(pangram," ")[[1]] |
可以取出字符串数组
2.文本连接
1 |
paste(LETTERS[1:5],1:5,sep="_",collapse="---") |
用空格连接words中的元素,paste()接收的参数应该是多个变量,sep决定多个向量之间的连接符,而collapse决定统一向量中的元素怎么合并。
3.文本排序
1 |
sort(letters,decreasing=TRUE) |
4.查找文本
1 |
substr(state.name,start=3,stop=6) |
grep(pattern,x)返回的是符合pattern的元素的在x中的位置
5.文本替换
1 |
gsub("cheap","sheep's","A wolf in cheap clothing")
|
1 |
x<-c("file_a.csv","file_b.csv","file_c.csv")
|
因子分类
factor(x,levels,labels)可以创建R因子,而levels指的是x的输入值,labels表示新创建的因子的输出值。
因子转换
1 |
numbers<-factor(c(9,8,10,8,9)) |
有序因子
类别数据的统计
1 |
table(state.region) |
有序变量
- 使用
factor()函数,并且指定参数ordered=TRUE - 使用
ordered()函数
matrix
1 |
matrix(data,ncol,nrow,byrow) |
索引、修改和命名
1 |
first.matrix<-matrix[1:12,ncol=4,byrow=TRUE] |
计算
1 |
t()###转置 |
array
向量和矩阵都是数组.
1 |
array(1:24,dim=c(3,4,2))###创建一个三维数组 |
data.frame
由矩阵创建 x.df<-as.data.frame(x)
由向量创建 data<-data.frame(x,y,z)
如果创建的变量是字符串类型,R会自动转换成因子,可以用stringAsFactor=FALSE保持字符串类型
1 |
names(data)[2]<-'B' ###命名表头 |
操作data.frame中的值
data.frame并不是向量,而是一组向量列表。但是数据操作时可以当做矩阵来处理,访问单个变量时可以用$,访问多个变量时可以用[]
1 |
#########修改值 |
list
1 |
#######创建list |
提取列表中的元素
- 使用
[[]]返回元素本身 - 使用
[]返回选定元素的列表
1 |
#########修改元素值 |
array, matrix, list and dataframe的更多相关文章
- numpy中list array matrix比较
用python中的numpy包的时候不小心踩了array和matrix的大坑,又引申一下比较list array matrix之间的异同.数据结构(Data Structures)基本上人如其名——它 ...
- array / matrix subarray/submatrix sum
Maximal Subarray Sum : O(n) scan-and-update dynamic programming, https://en.wikipedia.org/wiki/Maxim ...
- Pramp mock interview (4th practice): Matrix Spiral Print
March 16, 2016 Problem statement:Given a 2D array (matrix) named M, print all items of M in a spiral ...
- C#+无unsafe的非托管大数组(large unmanaged array in c# without 'unsafe' keyword)
C#+无unsafe的非托管大数组(large unmanaged array in c# without 'unsafe' keyword) +BIT祝威+悄悄在此留下版了个权的信息说: C#申请一 ...
- C++_Eigen函数库用法笔记——The Array class and Coefficient-wise operations
The advantages of Array Addition and subtraction Array multiplication abs() & sqrt() Converting ...
- 【LeetCode】74. Search a 2D Matrix
Difficulty:medium More:[目录]LeetCode Java实现 Description Write an efficient algorithm that searches f ...
- Spark MLlib 之 大规模数据集的相似度计算原理探索
无论是ICF基于物品的协同过滤.UCF基于用户的协同过滤.基于内容的推荐,最基本的环节都是计算相似度.如果样本特征维度很高或者<user, item, score>的维度很大,都会导致无法 ...
- pandas 数据结构基础与转换
pandas 最常用的三种基本数据结构: 1.dataFrame: https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Data ...
- pandas 之 特征工程
import numpy as np import pandas as pd So far(到目前为止) in this chapter we've been concerned with rearr ...
随机推荐
- [Algo] 649. String Replace (basic)
Given an original string input, and two strings S and T, replace all occurrences of S in input with ...
- [Algo] 280. Sort With 2 Stacks
Given an array that is initially stored in one stack, sort it with one additional stacks (total 2 st ...
- 吴裕雄--天生自然TensorFlow高层封装:使用TFLearn处理MNIST数据集实现LeNet-5模型
# 1. 通过TFLearn的API定义卷机神经网络. import tflearn import tflearn.datasets.mnist as mnist from tflearn.layer ...
- Springboot配置注入
springboot中如何将yml 配置文件中配置,在类中注入使用 ①第一种使用@value方式 ################## 配置文件 ######################### d ...
- Linux从一台linux机器复制文件到另一台linux机器
1.功能说明 scp 用于将文件/目录从一台linux系统复制到另一台linux系统.传输协议为SSH协议,保证了传输数据的安全性 其格式如下: (1)scp 本地linux系统文件路径 远程用 ...
- vim 复制 单个 单词: 移动光标到单词词首,快速摁 yw
vim 复制 单个 单词: 移动光标到单词词首,快速摁 yw
- Nginx_安全2
Nginx与安全有关的配置 隐藏版本号 http { server_tokens off;} 经常会有针对某个版本的nginx安全漏洞出现,隐藏nginx版本号就成了主要的安全优化手段之一,当然 ...
- 39)PHP,选取数据库中的两列
首先是我的文件关系: 我的b.php是主php文件,BBB.php是配置文件,login.html是显示文件, b.php文件代码: <?php /** * Created by PhpStor ...
- Spring Cloud服务消费者(rest+ribbon)
在上一篇文章,讲了服务的注册和发现.在微服务架构中,业务都会被拆分成一个独立的服务,服务与服务的通讯是基于http restful的.Spring cloud有两种服务调用方式,一种是ribbon+r ...
- java 解析URL里的主域名及参数工具类
java 解析URL里的协议及参数工具类,解析URL中的主域名,并统一把协议修改成http或去掉协议 public class UrlDomainUtils { private static fina ...