[R语言统计]频数表
频数表在统计学中是一个非常基本并且重要的概念,我们这里就来讲解它的基本用法。
首先我们需要载入数据,并查看数据的基本信息
- install.packages('vcd') #安装vcd包,其中有可以利用的数据Arthritis
- library(vcd)
- 载入需要的程辑包:grid
- > head(Arthritis)#################################################
- ID Treatment Sex Age Improved
- 1 57 Treated Male 27 Some
- 2 46 Treated Male 29 None
- 3 77 Treated Male 30 None
- 4 17 Treated Male 32 Marked
- 5 36 Treated Male 46 Marked
- 6 23 Treated Male 58 Marked
- > class(Arthritis)################################################
- [1] "data.frame"
- > summary(Arthritis)##############################################
- ID Treatment Sex Age Improved
- Min. : 1.00 Placebo:43 Female:59 Min. :23.00 None :42
- 1st Qu.:21.75 Treated:41 Male :25 1st Qu.:46.00 Some :14
- Median :42.50 Median :57.00 Marked:28
- Mean :42.50 Mean :53.36
- 3rd Qu.:63.25 3rd Qu.:63.00
- Max. :84.00 Max. :74.00
从结果中看以看出,Arthritis是一个data.frame结构的数据。其中ID和Age是numeric型的数据,其他三个都是factor型的数据。
创建一维列联表
- > a<-table(Arthritis$Improved)#创建一维列联表
- > class(a) #查看变量a的类型
- [1] "table"
- > a
- None Some Marked
- 42 14 28
从结果中可以看出,就是如下的表格
| None | Some | Marked |
| 42 | 14 | 28 |
创建二维列联表
- > b<-table(Arthritis$Sex,Arthritis$Improved)
- > class(b)
- [1] "table"
- > b
- None Some Marked
- Female 25 12 22
- Male 17 2 6
结果是如下表格
| None | Some | Marked | |
| Female | 25 | 12 | 22 |
| Male | 17 | 2 | 6 |
我们还可以将一维列联表a和二维列联表b转化成百分比的形式
- > prop.table(a)
- None Some Marked
- 0.5000000 0.1666667 0.3333333
- > prop.table(b)
- None Some Marked
- Female 0.29761905 0.14285714 0.26190476
- Male 0.20238095 0.02380952 0.07142857
给table添加边际和
- > addmargins(a)####################################
- None Some Marked Sum
- 42 14 28 84
- > addmargins(b)####################################
- None Some Marked Sum
- Female 25 12 22 59
- Male 17 2 6 25
- Sum 42 14 28 84
- > addmargins(prop.table(a))#########################
- None Some Marked Sum
- 0.5000000 0.1666667 0.3333333 1.0000000
- > addmargins(prop.table(b))#########################
- None Some Marked Sum
- Female 0.29761905 0.14285714 0.26190476 0.70238095
- Male 0.20238095 0.02380952 0.07142857 0.29761905
- Sum 0.50000000 0.16666667 0.33333333 1.00000000
只添加某个部分边际和
- > addmargins(prop.table(b),1)
- None Some Marked
- Female 0.29761905 0.14285714 0.26190476
- Male 0.20238095 0.02380952 0.07142857
- Sum 0.50000000 0.16666667 0.33333333
- > addmargins(prop.table(b),2)
- None Some Marked Sum
- Female 0.29761905 0.14285714 0.26190476 0.70238095
- Male 0.20238095 0.02380952 0.07142857 0.29761905
[R语言统计]频数表的更多相关文章
- 通过R语言统计考研英语(二)单词出现频率
通过R语言统计考研英语(二)单词出现频率 大家对英语考试并不陌生,首先是背单词,就是所谓的高频词汇.厚厚的一本单词,真的看的头大.最近结合自己刚学的R语言,为年底的考研做准备,想统计一下最近考研英语( ...
- R语言统计学习-1简介
一. 统计学习概述 统计学习是指一组用于理解数据和建模的工具集.这些工具可分为有监督或无监督.1.监督学习:用于根据一个或多个输入预测或估计输出.常用于商业.医学.天体物理学和公共政策等领域.2.无监 ...
- R语言—统计结果输出至本地文件方法总结
1.sink()在代码开始前加一行:sink(“output.txt”),就会自动把结果全部输出到工作文件夹下的output.txt文本文档.这时在R控制台的输出窗口中是看不到输出结果的.代码结束时用 ...
- R语言统计词频 画词云
原始数据: 程序: #统计词频 library(wordcloud) # F:/master2017/ch4/weibo170.cut.txt text <- readLines("F ...
- R语言统计字符串的字符数ncahr函数
函数计算字符数量,包括在一个字符串的空格的个数. 语法 nchar()函数的基本语法是: nchar(x) 以下是所使用的参数的说明: x - 向量输入. 示例 result <- nchar( ...
- R语言-简单线性回归图-方法
目标:利用R语言统计描绘50组实验对比结果 第一步:导入.csv文件 X <- read.table("D:abc11.csv",header = TRUE, sep = & ...
- 手把手教你学习R语言
本文为带大家了解R语言以及分段式的步骤教程! 人们学习R语言时普遍存在缺乏系统学习方法的问题.学习者不知道从哪开始,如何进行,选择什么学习资源.虽然网络上有许多不错的免费学习资源,然而它们多过了头,反 ...
- 【转】R语言知识体系概览
摘要:R语言的知识体系并非语法这么简单,如果都不了R的全貌,何谈学好R语言呢.本文将展示介绍R语言的知识体系结构,并告诉读者如何才能高效地学习R语言. 最近遇到很多的程序员都想转行到数据分析,于是就开 ...
- R语言学习(一)前言
本系列文章由 @YhL_Leo 出品,转载请注明出处. 文章链接: http://blog.csdn.net/yhl_leo/article/details/49768161 R是一个有着统计分析功能 ...
随机推荐
- MySQL数据库查询优化建议
1. 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2. 应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使 ...
- RHEL7 -- NetworkManager
RHEL7中默认的网络服务是由NetworkManager提供,NetworkManager可以动态控制和配置网络. 网络工具和应用 应用或工具 描述 NetworkManager 默认的网络守护进程 ...
- PLSQL_标准游标类型的解析(概念)
2014-06-02 Created By BaoXinjian
- Linux内核(8) - 设备模型(下)
设备模型拍得再玄幻,它也只是个模型,必须得落实在具体的子系统,否则就只能抱着个最佳技术奖空遗恨.既然前面已经以USB子系统的实现分析示例了分析内核源码应该如何入手,那么这里就仍然以USB子系统为例,看 ...
- sql 2008批量删除数据表格
DECLARE @Table NVARCHAR(300) DECLARE @Count Int = 0 DECLARE tmpCur CURSOR FOR SELECT name FROM sys.o ...
- mod_fastcgi和mod_fcgid的区别
mod_fcgid是一个跟mod_fastcgi二进制兼容的Apache module. 原 来的mod_fastcgi因为实现方式的限制,所以可能会创建了很多不必要的进程,而实际上只需要更少的进程就 ...
- Spark部署配置
前提是已经安装了Hadoop ============================ SetUp Spark=============================Configuration sp ...
- 【Android】3.1 创建本章示例项目
分类:C#.Android.VS2015.百度地图应用: 创建日期:2016-02-04 注意:本节是在完成了 3.0节介绍的预备知识的基础上继续实现的. 示例1--显示地图并为后续内容做准备 1.运 ...
- 【Android】5.8 滑动条(SeekBar)
分类:C#.Android.VS2015: 创建日期:2016-02-07 一.简介 滑动条也叫拖动条(用户可拖动改变滑动条的值),比如可让用户调节音量大小.调节屏幕亮度.调节歌曲或视频当前播放的位置 ...
- 【Util】之——cookie
拿走即用 使用前引入文件:http://files.cnblogs.com/ccto/util-cookie.js 使用方法: //设置cookie CookieUtil.set("name ...