R语言实战 第7章
# 01 描述性统计分析 --------------------------------------------------------------
#针对总体的
mycavs = mtcars[,c(1,4,6)]
names(mtcars)
#"mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear" "carb"
#关注的焦点没加仑汽车行驶的mpg 英里数 hp 马力 wt车重
summary(mycavs)
library(psych)
describe(mycavs)
detach(psych)
#针对分组的
aggregate(mycavs,by=list(mtcars$am),mean)
#可以调用的函数只有平均数、标准差这样的单返回值函数
describeBy(mycavs,list(mtcars$am))
##多个分组的话就是 list(name1=groupvar1,name2=groupvar2....)
#分类跟分类的频数表
#一维
library(vcd)
names(Arthritis)
sapply(head(Arthritis),class)
##"ID" "Treatment" "Sex" "Age" "Improved"
#一项风湿性关节炎新疗法的双盲临床实验
mytable = table(Arthritis$Improved)
mytable
#None Some Marked
#42 14 28
prop.table(mytable) ##转换成比例
prop.table(mytable)*100 ##转换成百分比
#二维
table(Arthritis$Improved,Arthritis$Treatment)
xtabs(~Treatment+Improved,data =Arthritis ) ->mytable
# Improved
#Treatment None Some Marked
#Placebo 29 7 7
#Treated 13 7 21
prop.table(mytable,1) ##转换成行比例
prop.table(mytable,2) ##转换成列比例
##多维度
table(Arthritis$Improved,Arthritis$Treatment,Arthritis$Sex)
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
ftable(mytable)
##ftable,让三维分组更加紧凑
ftable(prop.table(mytable,c(1,2)))
# 02 独立性检验 ----------------------------------------------------------------
#H0数据独立 数据之间没什么关系
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.001463 数据之间不独立,存在关系
mytabls = xtabs(~Sex+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.08889 数据之间独立,不存在什么关系
fisher.test(mytabls)
##fisher.test Fisher精确检验,比chisq.test更加严谨一点
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
mantelhaen.test(mytable)
##H0 两个名义变量在第三个变量中的每一层都是条件独立
# p-value = 0.0006647 结果表明患者接受的治疗得到的改善在性别的每一水平并不独立
# 03 相关性的度量 ---------------------------------------------------------------
#二维列联表的相关
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
assocstats(mytabls)
colnames(state.x77)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
[7] "Frost" "Area"
state = state.x77[,1:6]
cov(state)
##协方差
cor(state)
#采用皮尔逊的相关系数
##function (x, y = NULL, use = "everything", method = c("pearson",
"kendall", "spearman"))
#偏相关
library(ggm)
colnames(state)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
pcor(c(1,5,2,3,6),state)
# 04 相关显著性的检验 -------------------------------------------------------------
cor.test(state[,3],state[,5])
#H0 不相关
cor.test(state[,1],state[,6])
#cor.test只能是一个一个的对其进行显著性检验
##corr.test 一个进行矩阵的相关
library(psych)
corr.test(state)
##人口跟高中毕业是相关系数是-0.1 ,但是不能拒绝显著性为0
pcor(c(,,,,),state)->r
c(,,,,)->q
pcor.test(r,q,state)
# 05 t检验 ------------------------------------------------------------------
##服从正态分布的 独立两组、不独立两组、多组
##不服从正态分的 两组 多组的 均值比较
## HO 都是均值相等 独立
install.packages("MASS")
R语言实战 第7章的更多相关文章
- R入门<三>-R语言实战第4章基本数据管理摘要
入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好 ...
- R语言实战(三)基本图形与基本统计分析
本文对应<R语言实战>第6章:基本图形:第7章:基本统计分析 =============================================================== ...
- R语言实战(二)数据管理
本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...
- R语言实战(一)介绍、数据集与图形初阶
本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章 R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...
- R语言实战(四)回归
本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来 ...
- R语言实战(五)方差分析与功效分析
本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ================================================================ ...
- 《数据挖掘:R语言实战》
<数据挖掘:R语言实战> 基本信息 作者: 黄文 王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版 ...
- R语言实战(十)处理缺失数据的高级方法
本文对应<R语言实战>第15章:处理缺失数据的高级方法 本文仅在书的基础上进行简单阐述,更加详细的缺失数据问题研究将会单独写一篇文章. 处理缺失值的一般步骤: 识别缺失数据: 检查导致数据 ...
- R语言实战(九)主成分和因子分析
本文对应<R语言实战>第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分. 探索性因子分析(EFA)是 ...
随机推荐
- JVM系列三(垃圾收集器).
一.概述 1. 哪些内存需要回收 上篇文章 我们介绍了 Java 内存运行时区域的各个部分,其中程序计数器.虚拟机栈.本地方法栈三个区域随线程而生,随线程而灭,在这几个区域内就不需要过多考虑回收的问题 ...
- 【Eclipse】Spring Tool Suite插件
Spring Tool Suite插件 最新下载地址:https://spring.io/tools3/sts/all 以前下载地址:https://spring.io/tools3/sts/lega ...
- WebSocket重连实现
方式一.使用第三方库实现 比如:reconnecting-websocket.jsReconnectingWebSocket,代码:https://github.com/joewalnes/recon ...
- 《Java基础知识》Java Lambda表达式
接触Lambda表达式的时候,第一感觉就是,这个是啥?我居然看不懂,于是开始寻找资料,必须弄懂它. 先来看一个案例: @FunctionalInterface public interface MyL ...
- 使用 API 网关构建微服务-2
「Chris Richardson 微服务系列」使用 API 网关构建微服务 Posted on 2016年5月12日 编者的话|本文来自 Nginx 官方博客,是微服务系列文章的第二篇,本文将探讨: ...
- [系列] Go 使用 defer 函数 要注意的几个点
概述 defer 函数大家肯定都用过,它在声明时不会立刻去执行,而是在函数 return 后去执行的. 它的主要应用场景有异常处理.记录日志.清理数据.释放资源 等等. 这篇文章不是分享 defer ...
- SpringBoot内容聚合
分类整理一些内容,方便需要时回过头来看,整理不易,如有疏漏,请多担待!之后要查看这篇文章,公众号后台回复 “Springboot聚合” SpringBoot+Mybatis多模块(module)项目搭 ...
- C#_.NetCore_WebAPI项目_EXCEL数据导出(ExcelHelper_第二版_优化逻辑)
项目需要引用NPOI的Nuget包:DotNetCore.NPOI-v1.2.2 本篇文章是对WebAPI项目使用NPOI操作Excel时的帮助类:ExcelHelper的改进优化做下记录: 备注:下 ...
- redlock算法及其问题
背景 redlock算法是为了解决什么问题呢? 在单redis实例实现分布式锁时,可能会出现线程A设置完锁后,master挂掉,slave提升为master,因为异步复制的特性,线程A设置的锁丢失了, ...
- ConcurrentHashMap源码走读
目录 ConcurrentHashMap源码走读 简介 放入数据 容器元素总数更新 容器扩容 协助扩容 遍历 ConcurrentHashMap源码走读 简介 在从JDK8开始,为了提高并发度,Con ...