主题:R统计图

作者:luomg

关键字:统计,R,ggplot2

1、什么是统计图?

统计图:统计图是从数据到几何对象的图形属性的一个映射

砖石重量对价格的散点图

qplot(carat,price,data=diamonds)

指定数据框据说是个好习惯

做数据变换

qplot(log(carat),log(price),data=diamonds)

图形属性

颜色 大小 形状 横坐标 纵坐标是统计图的图形属性,都可以映射为一组变量

标度

每一个图形属性都对应一个标度的函数,使得数据的取值映射到图形属性的有效取值,及控制点的对应图例的外观

set.seed(1410)
dsmall<-diamonds[sample(nrow(diamonds),100),]
qplot(carat,price,data=dsmall,colour=color)
qplot(carat,price,data=dsmall,shape=cut)
qplot(carat,price,data=diamonds,alpha=I(1/10)) #alpha图形属性设定透明度

图形属性技巧

分类变量:颜色和形状

连续性变量:大小,如果数量很大还得分面

geom几何对象

point

绘制散点图,当指定了x和y参数给qplot时的默认的设置

smooth

拟合一条合适的平滑曲线,并将曲线和标准差展示在图中,技巧如果加了分组分类的东西会拟合多条,比如颜色和形状

boxplot

箱线图,用于概括一系列点的分布情况

path

路径图,显示数据之间绘制连线,这类图的传统的作用是探索时间和其他变量之间的关系,路径图的方向是任意的

line

线条图,显示数据之间绘制连线,这类图的传统的作用是探索时间和其他变量之间的关系,线条图的方向是从左到又

一维分布的几何对象的选择是有变量类型来指定的

连续型变量

histogram 直方图,freqpoly 频率多边形 , density 密度曲线 ,如果只有x则默认为直方图

离散变量

bar条形图

集合对象认识

df<-data.frame(
x=c(3,1,5),
y=c(2,4,6),
label=c("a","b","c")) p<- ggplot(df,aes(x,y))+xlab(NULL)+ylab(NULL)
p+geom_point()+labs(title="gem point")
p+geom_bar(stat="identity")+labs(title="geom_bar")
p+geom_line(stat="identity")+labs(title="geom_line") p+geom_area(stat="identity")+labs(title="geom_area") p+geom_path(stat="identity")+labs(title="geom_path") p+geom_text(aes(label=label))+labs(title="geom_text")
p+geom_tile(aes(label=label))+labs(title="geom_tile") p+geom_polygon(aes(label=label))+labs(title="geom_polygon")

span 平滑程度系数 0---1

特定数据几何对象选择

一维+连续 --》 直方图

标度

标度设置以 scales_xxx开头的函数

图形语法的映射就是实现真实数据到计算机能识别的数据的归一化处理 一一映射过程,比如颜色映射,实现颜色分类分组

主题设置

全局设置theme_set(theme_grey()|theme_bw())

局部设置:qplot....+theme_grey()

备份原来的主题可以通过:org<theme_set(theme_grey()|theme_bw())

时间转换

as.numeric(as.POSIXct(data23$LAST_UPD, format="%Y-%m-%d hh24:mi:ss"))

as.POSIXct(1440322200, origin = "1970-01-01") http://finzi.psych.upenn.edu/R/library/base/html/as.POSIXlt.html

R统计图的更多相关文章

  1. 使用limma、Glimma和edgeR,RNA-seq数据分析易如反掌

    使用limma.Glimma和edgeR,RNA-seq数据分析易如反掌 Charity Law1, Monther Alhamdoosh2, Shian Su3, Xueyi Dong3, Luyi ...

  2. [原]CentOS7安装Rancher2.1并部署kubernetes (二)---部署kubernetes

    ##################    Rancher v2.1.7  +    Kubernetes 1.13.4  ################ ##################### ...

  3. 利用python进行数据分析2_数据采集与操作

    txt_filename = './files/python_baidu.txt' # 打开文件 file_obj = open(txt_filename, 'r', encoding='utf-8' ...

  4. Django项目:CRM(客户关系管理系统)--81--71PerfectCRM实现CRM项目首页

    {#portal.html#} {## ————————46PerfectCRM实现登陆后页面才能访问————————#} {#{% extends 'king_admin/table_index.h ...

  5. R常见的几种常见统计图

    1,向日葵散点图 2,热图  (颜色越深,数值越大) 3,折线图(散点图),绘制散点图集用 paris(data.frame)

  6. R中基本统计图

    一.条形图 1.安装包install.packages("vcd"); library(vcd);count<-table(Arthritis$Improved);#tabl ...

  7. R绘图基础

    一,布局 R绘图所占的区域,被分成两大部分,一是外围边距,一是绘图区域. 外围边距可使用par()函数中的oma来进行设置.比如oma=c(4,3,2,1),就是指外围边距分别为下边距:4行,左边距3 ...

  8. R语言学习笔记:字符串处理

    想在R语言中生成一个图形文件的文件名,前缀是fitbit,后面跟上月份,再加上".jpg",先不百度,试了试其它语言的类似语法,没一个可行的: C#中:"fitbit&q ...

  9. 用R语言分析我的fitbit计步数据

    目标:把fitbit的每日运动记录导入到R语言中进行分析,画出统计图表来 已有原始数据:fitbit2014年每日的记录电子表格文件,全部数据点此下载,示例如下: 日期 消耗卡路里数 步 距离 攀爬楼 ...

随机推荐

  1. myecplise 添加svn插件

    myecplise svn插件下载地址 http://subclipse.tigris.org/servlets/ProjectDocumentList?folderID=2240 1.SVN下载地址 ...

  2. Android IOS WebRTC 音视频开发总结(十九)-- kurento

    折腾了一个多星期终于将kurento的环境搭建好(开发阶段的产品,有些BUG要自己解决),所以单独写篇文件来介绍. 下面开始介绍kurento,文章来自博客园RTC.Blacker,转载请说明出处. ...

  3. 实现Java JTable的应用案例

    代码如下 import Java.awt.Component; import java.awt.Dimension; import java.awt.FontMetrics; import javax ...

  4. PO、BO、VO、DTO、POJO、DAO的区别

    PO: 基本上就是Entity了 persistant object持久对象 最形象的理解就是一个PO就是数据库中的一条记录. 好处是可以把一条记录作为一个对象处理,可以方便的转为其它对象. ---- ...

  5. 在PHP项目中使用Standford Moss代码查重系统

    Standford Moss 系统是斯坦福大学大名鼎鼎的代码查重系统,它可以查出哪些同学提交的代码是抄袭别人的,从而将提交结果拒之门外.它对一切希望使用该系统的人都是开放的,那么在PHP的项目中如何使 ...

  6. ref和out的区别,值类型和引用类型的使用

    今天刚刚明白ref和out的区别,只限于个人理解如有不同请赐教,谢谢 首先我感觉ref和out是针对于值类型来说,以前一直认为是针对于引用类型看下面的一段代码 1.首先结果 i=0:ints[0]=0 ...

  7. zencart用chrome无法登录后台

    再本地安装完zencart后,可以使用ie和Firefox登录网站后台,但是使用chrome登录时,页面闪一下,然后又跳转到登录页面. 按如下设置可以解决该问题: 中文版:商店设置->Sessi ...

  8. MySQL的相关概念介绍

    MySQL 为关系型数据库(Relational Database Management System), 这种所谓的"关系型"可以理解为"表格"的概念, 一个 ...

  9. mysql之数据库基本概念(mysql学习笔记一)

    数据库系统   数据库管理系统(DBMS)+数据库(DATABASE)(+数据库管理员) DBS=dbms+db 定义: 大量信息进行管理的高效解决方案,按照数据结构来组织.存储和管理数据的仓库 关系 ...

  10. PHP引用文件

    require: 可能多次执行的代码用require效率要稍高 require_once: 唯一区别是 PHP 会检查该文件是否已经被包含过,如果是则不会再次包含 include: 语句包含并运行指定 ...