一.R软件 1.安装R:自行百度☺ 2.R控制台(R Console)和R程序脚本: 打开R软件,就会直接打开控制台,控制台可以显示程序运行的结果.错误提示等信息,也可以直接输入想要执行的操作并立即返回运行结果,箭头“>”表示等待输入. 程序脚本通过点击右上角“文件” - “新建程序脚本”来建立.如果想要长久的保存已经提交的程序代码,那么可以在程序脚本中编写,点击保存的时候会另存为一个后缀为“.R”的数据文件,如果直接在控制台编写代码,关闭软件后,已编写的代码会消失. 3.如何运行R程序脚本:…
R语言可视化学习笔记之添加p-value和显著性标记 http://www.jianshu.com/p/b7274afff14f?from=timeline   上篇文章中提了一下如何通过ggpubr包为ggplot图添加p-value以及显著性标记,本文将详细介绍.利用数据集ToothGrowth进行演示 #先加载包 library(ggpubr) #加载数据集ToothGrowth data("ToothGrowth") head(ToothGrowth) ## len supp…
R语言入门1:安装R和RStudio 曹务强 中科院遗传学博士研究生 9 人赞同了该文章 1. Windows安装R 在Windows系统上,安装R语言比较简单,直接从R的官方网站下载,按照正常的软件安装流程点下一步即可. 2. Windows安装RStudio R语言自带的工作窗口界面非常不美观,用起来也非常不方便.于是有人发明了RStudio: RStudio是R语言的一种集成开发环境,它是免费自由软件.RStudio同时有桌面版和服务器版.RStudio基于C++开发,它的图形用户界面基于…
在上一篇中我们一起学习了R语言的数据结构第一部分:向量.数组和矩阵,这次我们开始学习R语言的数据结构第二部分:数据框.因子和列表. 一.数据框 类似于二维数组,但不同的列可以有不同的数据类型(每一列内的数据类型应当一致).创建数据框使用的关键字是data.frame,用法是: data.frame(..., row.names = NULL, check.rows = FALSE, check.names = TRUE, fix.empty.names = TRUE, stringsAsFact…
R是免费开源的软件,具有强大的数据处理和绘图等功能.下面是R开发环境的搭建过程. 一.点击网址 https://www.r-project.org/ ,进入"The R Project for Statistical Computing"界面. 二.点击加粗字体的"download R",进行"CRAN Mirrors"镜像选择页面. 三.下拉滚动条,找到 从中选择镜像网址,这里点击第二项. 四.在界面下选择"Download R fo…
1. DATE 处理 1.1 日期格式一个是as.Date(XXX) 和strptime(XXX),前者为Date格式,后者为POSIXlt格式 1.2 用法:as.Date(XXX,"%Y/%m/%d %H:%M") ,strptime(XXX, format="%m%d%Y %H:%M") 1.3格式里的Y 为yy(i.e.: 15/01/02) , 格式里的y为yyyy(i.e.:2015/01/02) 2. 一些常用属性 2.1 输出列名:colnames(…
古典概型的样本总量是一定的,且每种可能的可能性是相同的, 1.中位数:median(x) 2.百分位数:quantile(x)或者quantile(x,probe=seq(0,1,0.2)) #后面这个是设置参数,零到一的范围,每隔0.2算一次 不知道叫啥的很方便的函数:fivenum(x,na.rm=TRUE) #输出五个数最大值.最小值.下四分位数.上四分位数.中位数 3.协方差:用于看两组数据之间的关系,看看是不是有一定的关联性 他有一个相关系数r,r越接近1,则相关性越高,反之,越接近零…
https://www.jianshu.com/p/b7274afff14f?from=timeline #先加载包 library(ggpubr) #加载数据集ToothGrowth data("ToothGrowth") head(ToothGrowth) ## len supp dose ## 1 4.2 VC 0.5 ## 2 11.5 VC 0.5 ## 3 7.3 VC 0.5 ## 4 5.8 VC 0.5 ## 5 6.4 VC 0.5 ## 6 10.0 VC 0.5…
转载:https://www.jianshu.com/p/678213d605a5?from=jiantop.com Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解ggplot2的人来说就有点困难了,ggplot2的部分语法是很晦涩的.为此Alboukadel Kassambara创建了基于ggplot2的可视化包ggpubr用于绘制符合出版物要求的图形. 安装…
这里来挖掘超市购物车数据. 名词: 1.挖掘数据集:购物篮数据 2.挖掘目标:关联规则 3.关联规则:牛奶=>鸡蛋[支持度=2%,置信度=60%] 4.指出度:分析中的全部事务的2%同时购买了牛奶和鸡蛋 5.置信度:购买牛奶的篮子同时也购买了鸡蛋 6.最小支持阈值和最小置信阈值:由挖掘者或领域专家设定 7.项集:由商品组成的集合 8.k-项集:k个项组成的集合 9.频繁项集:满足最小支持度的项集,频繁k-项集一般记为Lk 10.强关联规则:满足最小支持度阈值和最小置信度阈值的规则 在R里面有一个…