R语言初识
# 创建数据集&基本数据管理
1、向量 创建函数 c() a <- c(1,2,3,4)
a[c(i,j)] :[]给定元素所处位置的数值,即向量a中第i和第j个元素,a[2]第二个元素即2
length(a):返回向量a中元素的个数
2、矩阵 创建函数 X<-matrix(数据,nrow=n,ncol=m)
+使用下标及方括号[]来选择矩阵中的行、列或元素,X[i,],第i行
+将矩阵转化为数据框 dataframe <-as.data.frame(matircname)
3、数组 创建函数 <-array()
4、数据框:将不同类型数据集放入一个矩阵中, mydata<-data.frame(变量1,变量2,。。)
+指明数据框中的变量方式:mydata$变量名
+使用下标及方括号[],mydata[1:i],1到i列
+指定列明,,mydata[c("column1","column2")]
----
+利用函数attach()将数据框添加到R的搜索中,也可以利用with()
+names(dataframe):生成一个包含所有变量名的字符型向量
5、因子:名义型变量及有序型变量称为因子,<-factor(因子),(把因子转译成数字)
6、列表:可以整合向量、矩阵、数据框及其他列表的组合,创建函数 <-list()
7、创建新变量
+ dataframe$varietyname <-dataframe$variety1 +/-/*/ dataframe$varerity2;;
+ attach(dataframe) dataframe$varietyname <-variety1+variety2
detach(dataframe)
+dataframe <-transform(dataframe,variety=variety1+/-/ variety2)
7、变量的重编吗 数据框$变量[dataframe$varity condition] <-expression:
当变量满足什么条件时,将expression赋值给新变量,或者用函数with()
8、变量的重命名 rename() 或name()
9.函数is.na():检测缺失值是否存在
10.na.rm=true,可在计算之前移除缺失值并使用剩余值进行计算
11、na.omit()可以删除所有含有缺失数据的行
12、as.date(X,"input_format")用于将日期以字符串形式输入R中转化为以数值形式存储的日期变量
13、Sys.date()返回当天的日期,date()则返回当前的日期和时间
14、format(x,format="%B %d %Y"):输出指定格式的日期值
15、函数difftime(newday,oldday,units="week/day/year")计算时间间隔,并以星期,天,时等表示
16、函数as.character(),将日期转换为字符型变量
17、order()函数对数据框变量进行排序
18、数据集的横向合并即添加列,使用函数merge(),
+ 利用相同变量内连接 新数据框名 <- merge(dataframeA,dataframeB,by="变量"/by=c("bianliang1","bianliang2"))
+ 无相同变量的连接 cbline( A,B)
19、数据集的纵向合并函数添加观测 rbline(A,B),条件A与和变量数要相同
-----
#数据管理
1、scale()对矩阵或数据框的指定列进行均值为0、标准差为1的标准化
+ newdata <-scale(dataframe)
+ newdata <-transform(dataframe,variety=scale(variety)*SD+M)
2、概率函数
密度函数dorm,
分布函数pnorm,
分位数函数qnorm,
随机数生成函数rnorm
3、函数runif()用来生成0~1区间上服从均匀分布的伪随机数。可以通过set.seed()设定随机数种子
4、根据指定的均值和协方差生成多元正态数据:MASS包中的mvrnorm()函数
mvrnorm(n,mean,sigma),然后使用函数as.data.frame()矩阵转化成数据框
5、函数apply(矩阵/数组/数据框,维度下标,分析函数),对指定的维度(行)进行分析
lapply/sapply将函数应用到list列表中
6、转置:函数t()对一个矩阵或者数据框进行转置
7、数据整合:将多组观测替换为根据这些观测计算的描述性统计量
* 函数aggregate(x待折叠的数据对象,by=list(变量1,变量2),计算描述性统计函数)
* reshape包,融合melt()函数及重铸cast()函数
----
#基本统计分析
一、描述性统计量
1、summary()计算描述性统计量;
2、*Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值得数目、平均值、分位数以及五个最大的值和最小的值
*pastecs包中stat.desc()函数或者describe()函数计算描述性统计量
二、分组计算描述性统计量
1、分组计算描述性统计量,利用函数aggregate()
+ aggregate(数据集中的[变量组],by=list(变量名=数据集$变量),function(比如mean.sd等)),一次执行一个函数
+一次执行多个函数,使用自定义函数及by(),见P134
2、doBy包中的summaryBY()
3、psych包中的describe.by()
4、reshape包
三、频数表
R语言初识的更多相关文章
- 【R语言系列】R语言初识及安装
一.R是什么 R语言是由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman两个人共同发明. 其词法和语法分别源自Schema和S语言. R定义:一个能够自由幼小的用于统计计算和绘 ...
- R语言入门(1)-初识R语言
设置R语言环境为英文环境 其实不设置也行...就是报错提示的内容是中文的话, 会不太好理解.. 1. 首先在用户根目录下cat查看一下, 发现没有.Renviron文件, 这个是R语言的环境配置文件. ...
- RLearning第1弹:初识R语言
R作为一种统计分析软件,是集统计分析与图形显示于一体的.体积小.开源.很强的互动性.自从学了R本人就很少再用matlab了... 一.R语言由函数和赋值构成. R使用<-(最好养成使用习惯),而 ...
- R语言作为BI中ETL的工具
R语言作为BI中ETL的工具,增删改 R语言提供了强大的R_package与各种数据库进行数据交互. 外加其强大数据变换清洗函数,为ETL提供一条方便快捷的道路. RODBC ROracal RMys ...
- R语言环境安装与基本使用
R语言安装包可以从这个地址选择合适的URL去下载:https://cran.r-project.org/mirrors.html,这里使用这个https://mirrors.tuna.tsinghua ...
- R语言绘制空间热力图
先上图 R语言的REmap包拥有非常强大的空间热力图以及空间迁移图功能,里面内置了国内外诸多城市坐标数据,使用起来方便快捷. 开始 首先安装相关包 install_packages("dev ...
- [R]R语言中的%>%和%.%
最近在网上看R的代码,常常看到 x %>% y 的写法. 样子看着像是pipe的用法,搜了一下, 没找到语法的相关说明. 今天突然开窍,想着 %>% 可能不是语言本身支持的语法,可能是某个 ...
- .Net调用R语言
///加载自己写的R语言算法库 public List<double> GetZTFB(double[] data) { List<double> par = new List ...
- 用R语言的quantreg包进行分位数回归
什么是分位数回归 分位数回归(Quantile Regression)是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位.十分位.百分位等)来得到被解释变量的条件分布的相应的分位数 ...
随机推荐
- git的使用01
直接下载安装git,这里就不演示了,如果安装成功,在桌面任意空白处单击鼠标右键,会多出两个选项 Git Gui Here和Git Bash Here,我们一般使用git bash here 右键之后点 ...
- 天猫首页迷思之-jquery实现整个div的懒加载(1)
懒加载是众所周知的减少网页负载,提高性能的方法,不少大型用图片用的多的网站都用到了. 于是我网上一搜,得到一插件:jquery.lazyload 网址:http://www.appelsiini ...
- 远程服务器的SqlServer允许本地连接
最近做项目都是直接在阿里云买的服务器,并且SqlServer也是安装好的.但是默认的时候,这个服务器上的SqlServer并不允许直接在本地的SqlServer客户端访问,尽管服务器有公网IP. 想要 ...
- css实现web前端最美的loading加载动画!
这些好看的loading效果,你还只会用第三方库吗?CSS3教你实现 前言 loading效果在实际开发中是很常见的,尤其是在Ajax请求的时候,可以给用户一个很好的交互体验. 今天这篇文章我们一起 ...
- 计蒜客 28437.Big brother said the calculation-线段树+二分-当前第k个位置的数 ( ACM训练联盟周赛 M)
M. Big brother said the calculation 通过线段树维护. 这个题和杭电的一道题几乎就是一样的题目.HDU5649.DZY Loves Sorting 题意就是一个n的排 ...
- 大数据技术之_16_Scala学习_09_函数式编程-高级
第十三章 函数式编程-高级13.1 偏函数(partial function)13.1.1 提出一个需求,引出思考13.1.2 解决方式-filter + map 返回新的集合13.1.3 解决方式- ...
- Excel设置下拉菜单并隐藏下拉菜单来源单元格内容
一.问题来源 做实验室的进展统计表,老师让加上开始时间和完成时间,时间格式:周几_上午(下午.晚上). 这样就可以了做下拉菜单,方便填写,而且格式统一,方便查看. 二.解决办法 2.1 下来菜单 红框 ...
- 用CSS3产生动画效果
相关属性: @keyframes规则:定义动画 语法:@keyframes animationname{keyframes-selector {CSS-style;}} animationname:动 ...
- ubuntu10.10编译TQ2440的x86-qtopia-2.2.0编译问题解决精简版
转:http://blog.csdn.net/zyxlinux888/article/details/6705480 操作:1.要安装系统缺失的类库和安装包(有些是非必须的):zyx@zyx:/$ s ...
- 查看sqlserver的端口号
背景 这几天想写一个使用java连接sqlserver的数据库连接测试程序.但是在查看数据库连接字符格式以后发现需要sqlserver数据库服务的端口号.在安装sqlserver的时候也没有提到端口号 ...