R语言实战 第7章
# 01 描述性统计分析 --------------------------------------------------------------
#针对总体的
mycavs = mtcars[,c(1,4,6)]
names(mtcars)
#"mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear" "carb"
#关注的焦点没加仑汽车行驶的mpg 英里数 hp 马力 wt车重
summary(mycavs)
library(psych)
describe(mycavs)
detach(psych)
#针对分组的
aggregate(mycavs,by=list(mtcars$am),mean)
#可以调用的函数只有平均数、标准差这样的单返回值函数
describeBy(mycavs,list(mtcars$am))
##多个分组的话就是 list(name1=groupvar1,name2=groupvar2....)
#分类跟分类的频数表
#一维
library(vcd)
names(Arthritis)
sapply(head(Arthritis),class)
##"ID" "Treatment" "Sex" "Age" "Improved"
#一项风湿性关节炎新疗法的双盲临床实验
mytable = table(Arthritis$Improved)
mytable
#None Some Marked
#42 14 28
prop.table(mytable) ##转换成比例
prop.table(mytable)*100 ##转换成百分比
#二维
table(Arthritis$Improved,Arthritis$Treatment)
xtabs(~Treatment+Improved,data =Arthritis ) ->mytable
# Improved
#Treatment None Some Marked
#Placebo 29 7 7
#Treated 13 7 21
prop.table(mytable,1) ##转换成行比例
prop.table(mytable,2) ##转换成列比例
##多维度
table(Arthritis$Improved,Arthritis$Treatment,Arthritis$Sex)
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
ftable(mytable)
##ftable,让三维分组更加紧凑
ftable(prop.table(mytable,c(1,2)))
# 02 独立性检验 ----------------------------------------------------------------
#H0数据独立 数据之间没什么关系
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.001463 数据之间不独立,存在关系
mytabls = xtabs(~Sex+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.08889 数据之间独立,不存在什么关系
fisher.test(mytabls)
##fisher.test Fisher精确检验,比chisq.test更加严谨一点
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
mantelhaen.test(mytable)
##H0 两个名义变量在第三个变量中的每一层都是条件独立
# p-value = 0.0006647 结果表明患者接受的治疗得到的改善在性别的每一水平并不独立
# 03 相关性的度量 ---------------------------------------------------------------
#二维列联表的相关
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
assocstats(mytabls)
colnames(state.x77)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
[7] "Frost" "Area"
state = state.x77[,1:6]
cov(state)
##协方差
cor(state)
#采用皮尔逊的相关系数
##function (x, y = NULL, use = "everything", method = c("pearson",
"kendall", "spearman"))
#偏相关
library(ggm)
colnames(state)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
pcor(c(1,5,2,3,6),state)
# 04 相关显著性的检验 -------------------------------------------------------------
cor.test(state[,3],state[,5])
#H0 不相关
cor.test(state[,1],state[,6])
#cor.test只能是一个一个的对其进行显著性检验
##corr.test 一个进行矩阵的相关
library(psych)
corr.test(state)
##人口跟高中毕业是相关系数是-0.1 ,但是不能拒绝显著性为0
pcor(c(,,,,),state)->r
c(,,,,)->q
pcor.test(r,q,state)
# 05 t检验 ------------------------------------------------------------------
##服从正态分布的 独立两组、不独立两组、多组
##不服从正态分的 两组 多组的 均值比较
## HO 都是均值相等 独立
install.packages("MASS")
R语言实战 第7章的更多相关文章
- R入门<三>-R语言实战第4章基本数据管理摘要
入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好 ...
- R语言实战(三)基本图形与基本统计分析
本文对应<R语言实战>第6章:基本图形:第7章:基本统计分析 =============================================================== ...
- R语言实战(二)数据管理
本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...
- R语言实战(一)介绍、数据集与图形初阶
本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章 R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...
- R语言实战(四)回归
本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来 ...
- R语言实战(五)方差分析与功效分析
本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ================================================================ ...
- 《数据挖掘:R语言实战》
<数据挖掘:R语言实战> 基本信息 作者: 黄文 王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版 ...
- R语言实战(十)处理缺失数据的高级方法
本文对应<R语言实战>第15章:处理缺失数据的高级方法 本文仅在书的基础上进行简单阐述,更加详细的缺失数据问题研究将会单独写一篇文章. 处理缺失值的一般步骤: 识别缺失数据: 检查导致数据 ...
- R语言实战(九)主成分和因子分析
本文对应<R语言实战>第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分. 探索性因子分析(EFA)是 ...
随机推荐
- Selenium自动化面试题
(1)selenium的工作原理? ① 脚本启动driver ② driver去驱动浏览器作为远程服务器 ③ 执行脚本发送请求 ④ 服务器解析请求作出相应操作,并返回给客户端(脚本) ( ...
- 记录一次VMware与xshell远程链接的总结
VMware 与xshell链接 说在前面 用了一年多的virtualbox,虚拟机环境的配置算是理清了,可最近参加红帽培训,大家用的都是VMware,想想我也试试吧,刚好再熟悉一下,于是就捣鼓了很久 ...
- Linux服务器绑定多网卡IP
需求:在1台Linux上绑定两个公网IP,实现扩展IP用于专用的服务 问题:添加了一个网卡上绑定1个弹性IP,主网卡绑定的公网ip可以正常访问,但是扩展网卡的公网ip无法访问. 原因:没有设置路由规则 ...
- CCF-CSP题解 201803-3 URL映射
题目要求写一个简易的URL规则和URL地址匹配的程序. 说说我的思路. 将URL规则和地址都截成片段用结构体\(<type, str[]>\)存储.对于URL规则,\(type\)为0代表 ...
- django查询中模糊的知识点,filter(blog=blog),filter(username=username).first()--这两者只需一招让你分清QuerySet对象,和用户字典对象
只需一招让你分清QuerySet对象,和用户字典对象 article_list = models.Article.objects.filter(blog=blog) user_obj = models ...
- Java8 Stream —— 更丝滑的集合操作方式
一.概念 Stream是一种可供流式操作的数据视图有些类似数据库中视图的概念它不改变源数据集合如果对其进行改变的操作它会返回一个新的数据集合. 总的来讲它有三大特性:在之后我们会对照着详细说明 ...
- js问题记录(一) -- 关于for in, sort(), 及prototype
1.关于for in for in : 遍历对象中的可枚举的属性 例子1:for in 遍历对象的键为String类型,所以调用时用Object[key]形式,而不用Object.key形式 < ...
- django admin配置以及使用
admin组件使用 Django 提供了基于 web 的管理工具(django 2.0+, python3.6+). Django 自动管理工具是 django.contrib 的一部分.你可以在项目 ...
- mysql复制表结构和表数据
我们知道,在SQL Server中,如果要复制表结构和表数据的话,可以使用select into语句. select * into yanggb1 from yanggb; 但是在MySQL中是不支持 ...
- MyBatis进阶讲解+ssm集成
1.sql映射器Mapper MyBatis基于动态代理机制,让我们无需再编写Dao的实现. 传统Dao接口,现在名称统一以Mapper结尾,还有我们映射器配置文件要和映射器在同一个包. 1.1使用映 ...