R语言系列:生成数据

(2014-05-04 17:41:57)

标签:

r语言

教育

分类: 生物信息

生成规则数据
1、使用“:“,如x=1:10,注意该方法既可以递增也可以递减,如y=10:1
2、seq,有两种用法:①seq(起点,终点,步长); ②seq(length=9, from=1, to=5)
    seq还有一种简写:seq(x)    #相当于1:length(x),但当length(x)为0时,返回integer(0)
3、c(1,2,8)
4、使用scan(),可以等待键盘输入。输入过程中,可以使用空格分隔每个元素,也可以一行输入一个元素。输入完毕只需键入一个空行即可。
5、rep(x,n)    #将x重复n次,可使用each限定为依次重复形式
    rep(1:3,3)

[1] 1 2 3 1 2 3 1 2 3

rep(1:3,each=3)

[1] 1 1 1 2 2 2 3 3 3

rep(1:3,c(1,2,3))
[1] 1 2 2 3 3 3

6、sequence(4,9)构造一个包含1:4和1:9共13个元素的向量
7、gl(k,n,length=,label=)构造一个因子序列。k为水平数,n为每个水平连续出现的次数,length为整个序列的长度,label为因子标签。
举例:gl(3,5,length=20,label=c('a','b','c'))
8、expand.grid(a=1:3,b=1:4,c=c('x','y','z'))构造一个数据框,将各参数的各水平完全搭配。
9、paste:该函数每次从每个参数中提取一个元素组成一个字符串,直至元素最多的参数取完,其它元素不足的参数循环补足。 可接受多个参数,每个参数可包括多个元素。例:paste(c("X","Y"), 1:10, sep="")
10、combn(x, n)    #生成x中取n个元素的所有组合

常用随机数字 
runif(n,min=0,max=1)    #uniform,均匀分布 
rnorm(n,mean=0,sd=1)    #Gaussian(normal),正态分布 
rexp(n,rate=1)    #exponential,指数分布 
rlnorm(n,meanlog=0,sdlog=1)    #lognormal,对数正态分布

随机抽样
sample(x, n, replace=FALSE, prob=)
sample(10)    #随机排列1:10,默认不重复抽样
sample(10, 5)    #从1:10中随机抽5个,不重复抽样
x=10:20; sample(x);    #随机排列x
sample(10, replace=TRUE)    #从1:10中随机抽10次,允许重复抽样
sample(0:1, 100, replace=TRUE)    #100次伯努利试验
sample(c(0,1), 10, replace=TRUE, prob=c(0.1, 0.9))    #分别以0.1和0.9的概率抽取0和1

字符切割
strsplit(x, split, fixed = FALSE, perl = FALSE)
    #根据split将x分割,若split=“”,则将x分为单个字符。
    #默认split为正则表达式,可使用fixed=TRUE,对split做精确匹配
    #当perl=TRUE时,使用perl的正则表达式规则
    #当分隔符为?, +, {, |, (, )时,要使用'\\'来消除特殊含义

字符连接
paste(letters,collapse='')    #将26个小写字母连成一个字符串
    #使用collapse指定的连接符,连接paste的结果为一个字符串
    #鉴别以下几种情况
paste(letters[1:5])    #不能连接,输出5个字母:"a" "b" "c" "d" "e"
paste("a", "b", "c", "d", "e", sep='')    #输出"abcde",注意和前者的差别
paste(1:3,4:6,collapse='-')    #输出"1 4-2 5-3 6"
paste(1:3,4:6,sep='',collapse='-')    #输出"14-25-36"
paste(c(1:3,4:6),collapse='-')    #输出"1-2-3-4-5-6"

R语言中的内嵌常量
LETTERS    #26个大写字母
letters    #26个小写字母
month.abb    #12个月份的三字母缩写
month.name    #12个月份的全称
pi    #3.14...
字母和月份可以取部分子集,例:letters[c(1:8)]

R语言系列:生成数据的更多相关文章

  1. R语言系列:数据的基本运算

    基本运算符号  1.基本数学计算  +.-.*./.^.%%(求模).%/%(整除)  注意:求模运算两边若为小数,则整数和小数部分分别求模.例:5.6%%2.2  2.比较运算  >.< ...

  2. [译]用R语言做挖掘数据《二》

    数据探索 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...

  3. R语言分析朝阳医院数据

    R语言分析朝阳医院数据 本次实践通过分析朝阳医院2016年销售数据,得出“月均消费次数”.“月均消费金额”.“客单价”.“消费趋势”等结果,并据此作出可视化图形. 一.读取数据: library(op ...

  4. R语言实现金融数据的时间序列分析及建模

    R语言实现金融数据的时间序列分析及建模 一 移动平均    移动平均能消除数据中的季节变动和不规则变动.若序列中存在周期变动,则通常以周期为移动平均项数.移动平均法可以通过数据显示出数据长期趋势的变动 ...

  5. R语言处理Web数据

    R语言处理Web数据 许多网站提供的数据,以供其用户的消费.例如,世界卫生组织(WHO)提供的CSV,TXT和XML文件的形式的健康和医疗信息报告.基于R程序,我们可以通过编程提取这些网站的具体数据. ...

  6. 利用R语言进行交互数据可视化(转)

    上周在中国R语言大会北京会场上,给大家分享了如何利用R语言交互数据可视化.现场同学对这块内容颇有兴趣,故今天把一些常用的交互可视化的R包搬出来与大家分享. rCharts包 说起R语言的交互包,第一个 ...

  7. R语言︱处理缺失数据&&异常值检验、离群点分析、异常值处理

    在数据挖掘的过程中,数据预处理占到了整个过程的60% 脏数据:指一般不符合要求,以及不能直接进行相应分析的数据 脏数据包括:缺失值.异常值.不一致的值.重复数据及含有特殊符号(如#.¥.*)的数据 数 ...

  8. [译]用R语言做挖掘数据《七》

    时间序列与数据挖掘 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用 ...

  9. [译]用R语言做挖掘数据《六》

    异常值检测 一.实验说明 1. 环境登录 无需密码自动登录,系统用户名shiyanlou,密码shiyanlou 2. 环境介绍 本实验环境采用带桌面的Ubuntu Linux环境,实验中会用到程序: ...

随机推荐

  1. 蓝牙扫描工具btscanner修复暴力扫描模式

    蓝牙扫描工具btscanner修复暴力扫描模式   在btscanner 2.1-5版本中,当用户按下快捷键b,执行暴力扫描模式,会出现程序奔溃问题.该问题现在已经修复.用户只需要更新系统,将btsc ...

  2. 各种梯度下降 bgd sgd mbgd adam

    转载  https://blog.csdn.net/itchosen/article/details/77200322 各种神经网络优化算法:从梯度下降到Adam方法     在调整模型更新权重和偏差 ...

  3. Bzoj5332: [Sdoi2018]旧试题

    国际惯例的题面首先我们进行一些相对显然的数学变化.解释一下第二行的那个变形,如果一个数是ijk的因数,那么它一定能被分解成三部分分别是i,j,k的因数.我们钦定一个质数只能在三部分的一个中出现.如果一 ...

  4. BZOJ.3598.[SCOI2014]方伯伯的商场之旅(贪心 数位DP)

    题目链接 先考虑,对于确定的一个数,怎样移动代价最少(或者移到哪个位置最优)? 假设我们都移到下标\(1\)位置(设集合点为\(1\)),那么移动到下标\(2\)与\(1\)相比代价差为:\(下标&l ...

  5. jd-gui的使用方法

    java的反编译工具,简单使用: 打开文件.单击“file”从中选择“Open File ...“选项,弹出一个文件选择框,可以选择要打开的文件,或者直接单击文件夹图标,直接弹出文件选择框:从文件选择 ...

  6. C++ 代码格式化工具Astyle

    1.下载Asyle程序. win版本:https://sourceforge.net/projects/astyle/ 2.将bin/AStyle.exe拷到源码目录中,在命令行终端执行. AStyl ...

  7. __Linux__文件和目录

    Linux 目录 /:根目录,一般根目录下只存放目录,在Linux下有且只有一个根目录.所有的东西都是从这里开始.当你在终端里输入“/home”,你其实是在告诉电脑,先从/(根目录)开始,再进入到ho ...

  8. (转) Java RandomAccessFile与MappedByteBuffer

    RandomAccessFile RandomAccessFile是用来访问那些保存数据记录的文件的,你就可以用seek( )方法来访问记录,并进行读写了.这些记录的大小不必相同:但是其大小和位置必须 ...

  9. 1分钟试用PowerShell 5.0新功能PowerShellGet安装Script Browser和Script Analyzer

    微软PowerShell 产品组上周发布了PowerShell 5.0 PowerShellGet功能.有了它,IT 人员可以方便地搜索,安装,更新PowerShell Module.在这篇博客中,我 ...

  10. iOS中自动登录的设计

    1.//这是登录控制器页面 - (void)viewDidLoad { [super viewDidLoad]; //lt.iSNextAutoLogin是单利中的一个属性,用来保存下次是否自动登录 ...