本文参考数据挖掘与R第二章节

  • 读入数据

    • 方法1,下载Data mining with r的配套包

      • install.packages('DMwR')

    • 方法2,下载txt数据,并且读入数据。方法见上文。

 

 

  • Summary()#的到数据的摘要,概括。(包括最大,小值,中值,均值,4分为,NA的数量)

  • summary(algae)
        season       size       speed         mxPH            mnO2      
    autumn:40   large :45   high  :84   Min.   :5.600   Min.   : 1.500 
    spring:53   medium:84   low   :33   1st Qu.:7.700   1st Qu.: 7.725 
    summer:45   small :71   medium:83   Median :8.060   Median : 9.800 
    winter:62                           Mean   :8.012   Mean   : 9.118 
                                         3rd Qu.:8.400   3rd Qu.:10.800 
                                         Max.   :9.700   Max.   :13.400 
                                         NA's   :1       NA's   :2      
           Cl               NO3              NH4                oPO4      
    Min.   :  0.222   Min.   : 0.050   Min.   :    5.00   Min.   :  1.00 
    1st Qu.: 10.981   1st Qu.: 1.296   1st Qu.:   38.33   1st Qu.: 15.70 
    Median : 32.730   Median : 2.675   Median :  103.17   Median : 40.15 
    Mean   : 43.636   Mean   : 3.282   Mean   :  501.30   Mean   : 73.59 
    3rd Qu.: 57.824   3rd Qu.: 4.446   3rd Qu.:  226.95   3rd Qu.: 99.33 
    Max.   :391.500   Max.   :45.650   Max.   :24064.00   Max.   :564.60 
    NA's   :10        NA's   :2        NA's   :2          NA's   :2      
          PO4              Chla               a1              a2       
    Min.   :  1.00   Min.   :  0.200   Min.   : 0.00   Min.   : 0.000 
    1st Qu.: 41.38   1st Qu.:  2.000   1st Qu.: 1.50   1st Qu.: 0.000 
    Median :103.29   Median :  5.475   Median : 6.95   Median : 3.000 
    Mean   :137.88   Mean   : 13.971   Mean   :16.92   Mean   : 7.458 
    3rd Qu.:213.75   3rd Qu.: 18.308   3rd Qu.:24.80   3rd Qu.:11.375 
    Max.   :771.60   Max.   :110.456   Max.   :89.80   Max.   :72.600 
    NA's   :2        NA's   :12                                       
           a3               a4               a5               a6       
    Min.   : 0.000   Min.   : 0.000   Min.   : 0.000   Min.   : 0.000 
    1st Qu.: 0.000   1st Qu.: 0.000   1st Qu.: 0.000   1st Qu.: 0.000 
    Median : 1.550   Median : 0.000   Median : 1.900   Median : 0.000 
    Mean   : 4.309   Mean   : 1.992   Mean   : 5.064   Mean   : 5.964 
    3rd Qu.: 4.925   3rd Qu.: 2.400   3rd Qu.: 7.500   3rd Qu.: 6.925 
    Max.   :42.800   Max.   :44.600   Max.   :44.400   Max.   :77.600 
                                                                       
           a7       
    Min.   : 0.000 
    1st Qu.: 0.000 
    Median : 1.000 
    Mean   : 2.495 
    3rd Qu.: 2.400 
    Max.   :31.600 

  • hist()#画出数据的直方图

    • hist(algae$mxPH, prob=T)#prob=T显示概率,缺省的显示频数

  •  

  • 更细致的显示

    • > library(car)#调入库

      > par(mfrow=c(1,2))#设置把图片分为左右两个,画左边的

      > hist(algae$mxPH, prob=T, xlab='',

      +       main='Histogram of maximum pH value',ylim=0:1)#画直方图

      > lines(density(algae$mxPH,na.rm=T))#画概率密度曲线

      > rug(jitter(algae$mxPH))#画地下那个痕迹

      > qq.plot(algae$mxPH,main='Normal QQ plot of maximum pH')

      > par(mfrow=c(1,1))

 

  • 画箱图

  • 找出异常点

    • plot(algae$NH4,xlab='')#画出某变量的图

    • clicked.lines <- identify(algae$NH4)#手动的标出异常点,标出的同时会显示出该点的行,结束的同时会把这些点保存于clicked.lines 中

    • algae[clicked.lines,] #显示异常点

 

 

  • 条件分布的图形画法

    • library(lattice)#引入lattice库

    • bwplot(size ~ a1, data=algae,ylab='River Size',xlab='Algal A1') #画出a1在每种size条件下的箱图

R语言学习笔记:数据的可视化的更多相关文章

  1. R语言学习笔记 之 可视化地研究参议员相似性

    基于相似性聚类 很多时候,我们想了解一群人中的一个成员与其他成员之间有多么相似.例如,假设我们是一家品牌营销公司,刚刚完成了一份有潜力新品牌的研究调查问卷.在这份调查问卷中,我们向一群人展示了新品牌的 ...

  2. R语言学习笔记︱Echarts与R的可视化包——地区地图

    笔者寄语:感谢CDA DSC训练营周末上完课,常老师.曾柯老师加了小课,讲了echart与R结合的函数包recharts的一些基本用法.通过对比谢益辉老师GitHub的说明文档,曾柯老师极大地简化了一 ...

  3. R语言学习笔记(六): 列表及数据框的访问

    List R语言中各组件的名称叫做标签(tags),访问列表有3种方法: j$salary 通过标签名字访问,只要不引起歧义,可以只写出前几个字母. j[['sal']] 夹在两个中括号时引号里的标签 ...

  4. R语言学习笔记:读取前n行数据

    常规读取 一般我们读取文件时都会读取全部的文件然后再进行操作,因为R是基于内存进行计算的. data <- read.table("C:\\Users\\Hider\\Desktop\ ...

  5. R语言学习笔记之: 论如何正确把EXCEL文件喂给R处理

    博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html ---- 前言: 应用背景兼吐槽 继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. ...

  6. R语言学习笔记:基础知识

    1.数据分析金字塔 2.[文件]-[改变工作目录] 3.[程序包]-[设定CRAN镜像] [程序包]-[安装程序包] 4.向量 c() 例:x=c(2,5,8,3,5,9) 例:x=c(1:100) ...

  7. R语言学习笔记(二)

    今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言来描述. > vars<-c("mpg","hp","wt") &g ...

  8. R语言学习笔记-机器学习1-3章

    在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了<机器学习-实用案例解析>这本书. 这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书 ...

  9. R语言学习笔记(一)

    1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的 ...

  10. R语言学习笔记

    向量化的函数 向量化的函数 ifelse/which/where/any/all/cumsum/cumprod/对于矩阵而言,可以使用rowSums/colSums.对于“穷举所有组合问题" ...

随机推荐

  1. Node.js Cannot find Module xxx 的问题

    不知道为什么第一天Node.js干的挺顺利的,回公司后就干的一点都不顺利,主要原因还是公司的网络的问题,使用的受限制的代理,不能直接使用NPM从远程下载模块,唉. node.js的模块加载顺序首先是从 ...

  2. SQL Server如何使用XML格式传输解析

    Sqlserver in 实现 参数化查询 XML类型解决方案 [转] :如果参数是int类型: declare @a xml set @a=' <row><id>1</ ...

  3. php计算时间差的方法

    一个简单的例子:计算借书的天数,根据每天的日期进行计算. (1) 有数据库的情况      MSSQL可以使用触发器!用专门计算日期差的函数datediff()便可.    MYSQL那就用两个日期字 ...

  4. 关于maven参数过滤

    一.maven通过设置过滤器,可以使maven在编译打包时实现参数过滤的功能(详细配置说明略) <filters> <filter>../antx.properties< ...

  5. 同时安装vs2010和VS2012后IEnumerable<ModelClientValidationRule>编译错误

    错误 类型“System.Web.Mvc.ModelClientValidationRule”同时存在于“c:\Program Files (x86)\Microsoft ASP.NET\ASP.NE ...

  6. 【NHibernate】应用层面需要掌握的知识汇总

    休息接待区 欢迎加入NHibernate中文社区!在讨论中寻找乐趣!在问题中寻找答案! 旅途站点路线 第一站:熟悉NHibernate NHibernate之旅(1):开篇有益 第二站:接触NHibe ...

  7. touches获得手指点击的坐标

    -(void)touchesEnded:(NSSet *)touches withEvent:(UIEvent *)event { UITouch *touch = [touches anyObjec ...

  8. SVN弱密码扫描(Python)

    寂寞如雪的用脑过度,所以来写个博客分享一下.#虽然上一篇博客我还没写完 SVN的弱密码,看起来很复杂,但实际上很简单啊= =虽然不像pymssql/mymssql这种,Python提供了很好用的包,但 ...

  9. 【BZOJ 2440】[中山市选2011]完全平方数

    Description 小 X 自幼就很喜欢数.但奇怪的是,他十分讨厌完全平方数.他觉得这些数看起来很令人难受.由此,他也讨厌所有是完全平方数的正整数倍的数.然而这丝毫不影响他对其他数的热爱. 这天是 ...

  10. 免费web直接打印的控件PAZU

    PAZU 是4Fang 四方为配合"四方在线"软件于2004年开发的WEB打印控件,适用于各种WEB软件项目的打印.PAZU是客户端软件,使用于IE作为客户端的所有应用,与服务器端 ...