R语言系列:生成数据
生成规则数据
1、使用“:“,如x=1:10,注意该方法既可以递增也可以递减,如y=10:1
2、seq,有两种用法:①seq(起点,终点,步长); ②seq(length=9, from=1, to=5)
seq还有一种简写:seq(x) #相当于1:length(x),但当length(x)为0时,返回integer(0)
3、c(1,2,8)
4、使用scan(),可以等待键盘输入。输入过程中,可以使用空格分隔每个元素,也可以一行输入一个元素。输入完毕只需键入一个空行即可。
5、rep(x,n) #将x重复n次,可使用each限定为依次重复形式
rep(1:3,3)
[1] 1 2 3 1 2 3 1 2 3
rep(1:3,each=3)
[1] 1 1 1 2 2 2 3 3 3
rep(1:3,c(1,2,3))
[1] 1 2 2 3 3 3
6、sequence(4,9)构造一个包含1:4和1:9共13个元素的向量
7、gl(k,n,length=,label=)构造一个因子序列。k为水平数,n为每个水平连续出现的次数,length为整个序列的长度,label为因子标签。
举例:gl(3,5,length=20,label=c('a','b','c'))
8、expand.grid(a=1:3,b=1:4,c=c('x','y','z'))构造一个数据框,将各参数的各水平完全搭配。
9、paste:该函数每次从每个参数中提取一个元素组成一个字符串,直至元素最多的参数取完,其它元素不足的参数循环补足。 可接受多个参数,每个参数可包括多个元素。例:paste(c("X","Y"), 1:10, sep="")
10、combn(x, n) #生成x中取n个元素的所有组合
常用随机数字
runif(n,min=0,max=1) #uniform,均匀分布
rnorm(n,mean=0,sd=1) #Gaussian(normal),正态分布
rexp(n,rate=1) #exponential,指数分布
rlnorm(n,meanlog=0,sdlog=1) #lognormal,对数正态分布
随机抽样
sample(x, n, replace=FALSE, prob=)
sample(10) #随机排列1:10,默认不重复抽样
sample(10, 5) #从1:10中随机抽5个,不重复抽样
x=10:20; sample(x); #随机排列x
sample(10, replace=TRUE) #从1:10中随机抽10次,允许重复抽样
sample(0:1, 100, replace=TRUE) #100次伯努利试验
sample(c(0,1), 10, replace=TRUE, prob=c(0.1, 0.9)) #分别以0.1和0.9的概率抽取0和1
字符切割
strsplit(x, split, fixed = FALSE, perl = FALSE)
#根据split将x分割,若split=“”,则将x分为单个字符。
#默认split为正则表达式,可使用fixed=TRUE,对split做精确匹配
#当perl=TRUE时,使用perl的正则表达式规则
#当分隔符为?, +, {, |, (, )时,要使用'\\'来消除特殊含义
字符连接
paste(letters,collapse='') #将26个小写字母连成一个字符串
#使用collapse指定的连接符,连接paste的结果为一个字符串
#鉴别以下几种情况
paste(letters[1:5]) #不能连接,输出5个字母:"a" "b" "c" "d" "e"
paste("a", "b", "c", "d", "e", sep='') #输出"abcde",注意和前者的差别
paste(1:3,4:6,collapse='-') #输出"1 4-2 5-3 6"
paste(1:3,4:6,sep='',collapse='-') #输出"14-25-36"
paste(c(1:3,4:6),collapse='-') #输出"1-2-3-4-5-6"
R语言中的内嵌常量
LETTERS #26个大写字母
letters #26个小写字母
month.abb #12个月份的三字母缩写
month.name #12个月份的全称
pi #3.14...
字母和月份可以取部分子集,例:letters[c(1:8)]
R语言系列:生成数据的更多相关文章
- R语言系列:数据的基本运算
基本运算符号 1.基本数学计算 +.-.*./.^.%%(求模).%/%(整除) 注意:求模运算两边若为小数,则整数和小数部分分别求模.例:5.6%%2.2 2.比较运算 >.< ...
- [译]用R语言做挖掘数据《二》
数据探索 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...
- R语言分析朝阳医院数据
R语言分析朝阳医院数据 本次实践通过分析朝阳医院2016年销售数据,得出“月均消费次数”.“月均消费金额”.“客单价”.“消费趋势”等结果,并据此作出可视化图形. 一.读取数据: library(op ...
- R语言实现金融数据的时间序列分析及建模
R语言实现金融数据的时间序列分析及建模 一 移动平均 移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...
- R语言处理Web数据
R语言处理Web数据 许多网站提供的数据,以供其用户的消费.例如,世界卫生组织(WHO)提供的CSV,TXT和XML文件的形式的健康和医疗信息报告.基于R程序,我们可以通过编程提取这些网站的具体数据. ...
- 利用R语言进行交互数据可视化(转)
上周在中国R语言大会北京会场上,给大家分享了如何利用R语言交互数据可视化.现场同学对这块内容颇有兴趣,故今天把一些常用的交互可视化的R包搬出来与大家分享. rCharts包 说起R语言的交互包,第一个 ...
- R语言︱处理缺失数据&&异常值检验、离群点分析、异常值处理
在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值.异常值.不一致的值.重复数据及含有特殊符号(如#.¥.*)的数据 数 ...
- [译]用R语言做挖掘数据《七》
时间序列与数据挖掘 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用 ...
- [译]用R语言做挖掘数据《六》
异常值检测 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...
随机推荐
- jQuery.when().done()
在使用jQuery.when()调用外部声明方法时,如果方法不为Deferred(延时)对象,则done会立即执行,所有需要在调用的方法声明一个var deferred = $.Deferred(); ...
- Codeforces.542E.Playing on Graph(二分图)
题目链接 \(Description\) 给出一个n个点m条边的无向图. 你每次需要选择两个没有边相连的点,将它们合并为一个新点,直到这张图变成了一条链. 最大化这条链的长度,或输出无解. n< ...
- Python图形编程探索系列-05-用控制变量构建对话程序
跳转到自己的博客 控制变量 变量 符号 意义 默认值 1 var = tk.BooleanVar() 布尔型 0 2 var = tk.StringVar() 字符串控制变量 空字符串 3 var = ...
- 深港DJ好听的歌曲
好听女声 Dj陈爷-全中文全国语慢歌连版音乐挑选磁性女声翻唱慢摇串烧 http://www.vvvdj.com/play/154270.html DjPad仔-全中文国粤语Rnb音乐清风主流吃鸡学猫叫 ...
- spring源码分析系列 (5) spring BeanFactoryPostProcessor拓展类PropertyPlaceholderConfigurer、PropertySourcesPlaceholderConfigurer解析
更多文章点击--spring源码分析系列 主要分析内容: 1.拓展类简述: 拓展类使用demo和自定义替换符号 2.继承图UML解析和源码分析 (源码基于spring 5.1.3.RELEASE分析) ...
- boost 1.67编译VS2017版本
最近想系统学习并使用一下boost的asio异步网络库,所以需要编译boost库使用,下面简单介绍如何编译. 编译环境 boost1.67版本,windows 10,VS2017 下载boost 建议 ...
- Chrome上网问题解决记录
浏览器打开网站缓慢,甚至等待很久后直接烂页面 注意观察浏览器左下角会显示: 正在建立安全连接... 环境: 操作系统:Win10 Chrome版本: 69.x 解决办法:http://bbs.360. ...
- Netbeans异常之cannet locate java installation in specified jdkhome
原因:更改了jdk安装版本 方法:修改netbeans安装目录下ect下netbeans文件, 详细代码位置: # Default location of JDK: # (set by install ...
- __x__(24)0907第四天__ display 和 visibility
<a>百度</a> 也是内联元素,无法设置width和height <img>可以设置width和height,但是不会占用一行,所以是典型的行内块元素inl ...
- hdu 4339 Query(两种思路求解)
Query Time Limit: 20000/10000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others) Total Su ...
转载▼