R语言实战 第7章
# 01 描述性统计分析 --------------------------------------------------------------
#针对总体的
mycavs = mtcars[,c(1,4,6)]
names(mtcars)
#"mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am" "gear" "carb"
#关注的焦点没加仑汽车行驶的mpg 英里数 hp 马力 wt车重
summary(mycavs)
library(psych)
describe(mycavs)
detach(psych)
#针对分组的
aggregate(mycavs,by=list(mtcars$am),mean)
#可以调用的函数只有平均数、标准差这样的单返回值函数
describeBy(mycavs,list(mtcars$am))
##多个分组的话就是 list(name1=groupvar1,name2=groupvar2....)
#分类跟分类的频数表
#一维
library(vcd)
names(Arthritis)
sapply(head(Arthritis),class)
##"ID" "Treatment" "Sex" "Age" "Improved"
#一项风湿性关节炎新疗法的双盲临床实验
mytable = table(Arthritis$Improved)
mytable
#None Some Marked
#42 14 28
prop.table(mytable) ##转换成比例
prop.table(mytable)*100 ##转换成百分比
#二维
table(Arthritis$Improved,Arthritis$Treatment)
xtabs(~Treatment+Improved,data =Arthritis ) ->mytable
# Improved
#Treatment None Some Marked
#Placebo 29 7 7
#Treated 13 7 21
prop.table(mytable,1) ##转换成行比例
prop.table(mytable,2) ##转换成列比例
##多维度
table(Arthritis$Improved,Arthritis$Treatment,Arthritis$Sex)
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
ftable(mytable)
##ftable,让三维分组更加紧凑
ftable(prop.table(mytable,c(1,2)))
# 02 独立性检验 ----------------------------------------------------------------
#H0数据独立 数据之间没什么关系
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.001463 数据之间不独立,存在关系
mytabls = xtabs(~Sex+Improved,data =Arthritis )
chisq.test(mytabls)
#p-value = 0.08889 数据之间独立,不存在什么关系
fisher.test(mytabls)
##fisher.test Fisher精确检验,比chisq.test更加严谨一点
xtabs(~Treatment+Improved+Sex,data =Arthritis ) ->mytable
mantelhaen.test(mytable)
##H0 两个名义变量在第三个变量中的每一层都是条件独立
# p-value = 0.0006647 结果表明患者接受的治疗得到的改善在性别的每一水平并不独立
# 03 相关性的度量 ---------------------------------------------------------------
#二维列联表的相关
mytabls = xtabs(~Treatment+Improved,data =Arthritis )
assocstats(mytabls)
colnames(state.x77)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
[7] "Frost" "Area"
state = state.x77[,1:6]
cov(state)
##协方差
cor(state)
#采用皮尔逊的相关系数
##function (x, y = NULL, use = "everything", method = c("pearson",
"kendall", "spearman"))
#偏相关
library(ggm)
colnames(state)
#[1] "Population" "Income" "Illiteracy" "Life Exp" "Murder" "HS Grad"
pcor(c(1,5,2,3,6),state)
# 04 相关显著性的检验 -------------------------------------------------------------
cor.test(state[,3],state[,5])
#H0 不相关
cor.test(state[,1],state[,6])
#cor.test只能是一个一个的对其进行显著性检验
##corr.test 一个进行矩阵的相关
library(psych)
corr.test(state)
##人口跟高中毕业是相关系数是-0.1 ,但是不能拒绝显著性为0
pcor(c(,,,,),state)->r
c(,,,,)->q
pcor.test(r,q,state)
# 05 t检验 ------------------------------------------------------------------
##服从正态分布的 独立两组、不独立两组、多组
##不服从正态分的 两组 多组的 均值比较
## HO 都是均值相等 独立
install.packages("MASS")
R语言实战 第7章的更多相关文章
- R入门<三>-R语言实战第4章基本数据管理摘要
入门书籍:R语言实战 进度:1-4章 摘要: 1)实用的包 forecast:用于做时间序列预测的,有auto.arima函数 RODBC:可以用来读取excel文件.但据说R对csv格式适应更加良好 ...
- R语言实战(三)基本图形与基本统计分析
本文对应<R语言实战>第6章:基本图形:第7章:基本统计分析 =============================================================== ...
- R语言实战(二)数据管理
本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...
- R语言实战(一)介绍、数据集与图形初阶
本文对应<R语言实战>前3章,因为里面大部分内容已经比较熟悉,所以在这里只是起一个索引的作用. 第1章 R语言介绍 获取帮助函数 help(), ? 查看函数帮助 exampl ...
- R语言实战(四)回归
本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来 ...
- R语言实战(五)方差分析与功效分析
本文对应<R语言实战>第9章:方差分析:第10章:功效分析 ================================================================ ...
- 《数据挖掘:R语言实战》
<数据挖掘:R语言实战> 基本信息 作者: 黄文 王正林 丛书名: 大数据时代的R语言 出版社:电子工业出版社 ISBN:9787121231223 上架时间:2014-6-6 出版 ...
- R语言实战(十)处理缺失数据的高级方法
本文对应<R语言实战>第15章:处理缺失数据的高级方法 本文仅在书的基础上进行简单阐述,更加详细的缺失数据问题研究将会单独写一篇文章. 处理缺失值的一般步骤: 识别缺失数据: 检查导致数据 ...
- R语言实战(九)主成分和因子分析
本文对应<R语言实战>第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分. 探索性因子分析(EFA)是 ...
随机推荐
- 《手把手教你》系列进阶篇之4-python+ selenium自动化测试 - python几种超神操作你都知道吗?(详细教程)
1. 简介 今天分享和讲解的超神操作,对于菜鸟来说是超神的操作,对于大佬来说也就是几个简单方法的封装和调用.这里讲解和分享这部分主要是为了培养小伙伴们和童鞋们的面向对象的开发思维,对比这样做的好处让你 ...
- CentOS6.8系统最小化安装
一.CentOS系统版本 CentOS-6.8-x86_64 二.安装系统 1.打开VMware主页点击创建虚拟机 2.选择镜像 3.启动虚拟机 4.键入回车键直接进行安装 5.按Tab键选择Skip ...
- Redis-API
Redis-API 简介 Redis 是一个基于内存的高效的键值行非关系型数据库,存取效率极高. python提供了两个类:分别为Redis和StrictRedis来实现Redis的命令操作.Redi ...
- 线程提供了一个方法:void join() ,join可以协调线程之间的同步运行。
package seday09; /** * @author xingsir * 线程提供了一个方法:void join() ,join可以协调线程之间的同步运行. * 此方法允许执行这个方法的线程在 ...
- 松软科技Web课堂:JavaScript Break 和 Continue
break 语句“跳出”循环. continue 语句“跳过”循环中的一个迭代. Break 语句 在本教程稍早的章节中,您已见到了 break 语句.它被用于“跳出” switch 语句. brea ...
- 「SAP技术」SAP VL02N 执行批次拆分报错,说不允许批次拆分?
1,如下新建的DN 80017843,storage location 字段值为空.VL02N 试图去做批次拆分失败,系统报错说,Batch split is not permitted for ma ...
- 【原】MAC安装Flutter
系统环境要求 Flutter因为是新出的框架,所以对系统还是有一定的要求的. MacOS(64-bit) 磁盘空间:大于700M,如果算上Android Studio等编辑工具,尽量大于3G. 命令号 ...
- MySql事务的简单使用
4个特性 原子性:一个事务中的所有操作,要么全部完成,要么全部不完成,不会结束在中间某个环节.事务在执行过程中发生错误,会被回滚(rollback)到事务开始前的状态 一致性:在事务开始前和事务结束以 ...
- Linux - CentOS 7 通过Yum源安装 MySql 5.7
添加MySQL Yum存储库 从官网下载最新的mysql源 官网地址:https://dev.mysql.com/downloads/repo/yum/ 选择并下载适用于平台的发行包. 然后,在Lin ...
- Gemini.Workflow 双子工作流高级教程:对外API控制引擎:总述
前言: 双子工作流提供了一套对外的API,用于控制整体系统运转,下面就来看看介绍,其实很简单的. 对外API控制引擎总介: Gemini.Workflow 双子工作流,对外提供的API,都在Gemin ...