R语言基础学习——D01

20190410内容纲要:

  1、R的下载与安装

  2、R包的安装与使用方法

    (1)查看已安装的包

    (2)查看是否安装过包

    (3)安装包

    (4)更新包

  3、结果的重用

  4、R处理大数据集

  5、R的数据结构

    (1)向量

    (2)矩阵

    (3)数组

    (4)数据框

    (5)列表

  6、实例演练

  7、小结

 1 R的下载与安装

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

学习它那就先下载它!话不多说看链接:

Windows镜像:  http://mirror.fcaglp.unlp.edu.ar/CRAN/

当然也有Linux和Mac版本。

安装,就不多少,直接下一步,下一步,下一步。别忘了更改安装路径就行!!!

先随便玩点什么?

>demo()
>demo(graphics)
>help.start()
>help("mean")
>?mean
>getwd()
>setwd("path")
>history()

看完这些,觉得R跟linux和Matlab有点像。据说R的前身是S语言。S语言是什么?https://baike.baidu.com/item/S%E8%AF%AD%E8%A8%80

2 R包的安装与使用方法

(1)查看已安装的包。

首先,如果照1方法安装完成之后打开软件。在R console中输入library()就能查看当前已经安装的包。

>library()
 图书馆‘F:/R/R-3.5.3/library’里有个程辑包:

 abind                                                                 Combine Multidimensional Arrays
assertthat Easy Pre and Post Assertions
base The R Base Package
BH Boost C++ Header Files
boot Bootstrap Functions (Originally by Angelo Canty for S)
car Companion to Applied Regression
carData Companion to Applied Regression Data Sets
cellranger Translate Spreadsheet Cell Ranges to Rows and Columns
class Functions for Classification
cli Helpers for Developing Command Line Interfaces
clipr Read and Write from the System Clipboard
cluster "Finding Groups in Data": Cluster Analysis Extended Rousseeuw et al.
codetools Code Analysis Tools for R
compiler The R Compiler Package
crayon Colored Terminal Output
curl A Modern and Flexible Web Client for R
data.table Extension of `data.frame`
datasets The R Datasets Package
ellipsis Tools for Working with ...
fansi ANSI Control Sequence Aware String Functions
forcats Tools for Working with Categorical Variables (Factors)
foreign Read Data Stored by 'Minitab', 'S', 'SAS', 'SPSS', 'Stata', 'Systat', 'Weka', 'dBase', ...
graphics The R Graphics Package
grDevices The R Graphics Devices and Support for Colours and Fonts
grid The Grid Graphics Package
haven Import and Export 'SPSS', 'Stata' and 'SAS' Files
hms Pretty Time of Day
KernSmooth Functions for Kernel Smoothing Supporting Wand & Jones (1995)
lattice Trellis Graphics for R
lme4 Linear Mixed-Effects Models using 'Eigen' and S4
magrittr A Forward-Pipe Operator for R
maptools Tools for Handling Spatial Objects
MASS Support Functions and Datasets for Venables and Ripley's MASS
Matrix Sparse and Dense Matrix Classes and Methods
MatrixModels Modelling with Sparse And Dense Matrices
methods Formal Methods and Classes
mgcv Mixed GAM Computation Vehicle with Automatic Smoothness Estimation
minqa Derivative-free optimization algorithms by quadratic approximation
nlme Linear and Nonlinear Mixed Effects Models
nloptr R Interface to NLopt
nnet Feed-Forward Neural Networks and Multinomial Log-Linear Models
openxlsx Read, Write and Edit XLSX Files
parallel Support for Parallel computation in R
pbkrtest Parametric Bootstrap and Kenward Roger Based Methods for Mixed Model Comparison
pillar Coloured Formatting for Columns
pkgconfig Private Configuration for 'R' Packages
prettyunits Pretty, Human Readable Formatting of Quantities
progress Terminal Progress Bars
quantreg Quantile Regression
R6 Encapsulated Classes with Reference Semantics
Rcpp Seamless R and C++ Integration
RcppEigen 'Rcpp' Integration for the 'Eigen' Templated Linear Algebra Library
readr Read Rectangular Text Data
readxl Read Excel Files
rematch Match Regular Expressions with a Nicer 'API'
rio A Swiss-Army Knife for Data I/O
rlang Functions for Base Types and Core R and 'Tidyverse' Features
rpart Recursive Partitioning and Regression Trees
sp Classes and Methods for Spatial Data
SparseM Sparse Linear Algebra
spatial Functions for Kriging and Point Pattern Analysis
splines Regression Spline Functions and Classes
stats The R Stats Package
stats4 Statistical Functions using S4 Classes
survival Survival Analysis
tcltk Tcl/Tk Interface
tibble Simple Data Frames
tools Tools for Package Development
translations The R Translations Package
utf8 Unicode Text Processing
utils The R Utils Package
zip Cross-Platform 'zip' Compression

(2)查看当前是否安装过包

>help(package="car")        #car就是具体的某个包的名称

如果已经安装过,会自动跳转本机的12569端口查看网页版的详细介绍。如果没有那就装吧~

(3)安装包

安装包的时候会提示选择镜像源,选中国的就行,剩下的就看网络给不给力了~

install.packages("car")

(4)更新包

update.packages()    #不生命的话就默认更新全部

3 结果的重用

>head(mtcars)                                      #mtcars是一个数据集
>lm(mpg~wt, data=mtcars #lm是线性拟合的命令
>Result = lm(mpg~wt, data=mtcars)
>summary(Result)
>plot(Result)
>predict(Result, mynewdata) #mynewdata是自己要预测的值

有很多东西看不懂没事,后面还会有详细说明。~~

 4 R处理大数据集

(1)R有专门用于大数据分析的包。如biglm()能以内存高效的方式实现大型数据的线性模型拟合。

(2)R与大数据平台的结合。如Rhadoop、RHive、RHipe。

R的数据集通常是由数据构成的一个矩形数组,行表示记录,列表示属性(字段)。形式可以使Excel、txt、SAS、Mysql

对数据库有兴趣的话可以看看:2019最受欢迎的数据库是?     https://mp.weixin.qq.com/s/9fhPicVCjMpfMmjbhZUoFA

5 R的数据结构

话不多说,还是通过代码比较容易理解。。

(1)向量

向量中的元素可以是数字型、字符型、也可以是布尔型。但是当数组型和字符型混一起时,有没有什么说法自己动手试试吧!!

>a <- c(1,3,5,7,2,-4)
>b <- c("one","two","three")
>c <- c(TRUE,TRUE,FALSE)
>d <- c(1,3,5,"ONE")

此外,关于切片其实跟python有点类似

>d[c(1,3,4)]
>d[3]
>d[1:3]

(2)矩阵  matrix

>?matrix
>y <- matrix(5:24, nrow=4, ncol=5)
>x <- c(2,45,68,94)
>rnames <- c("R1","R2")
>cnames <- c("C1","C2")
>newMatrix <- matrix(x, nrow=2, ncol=2, byrow=TRUE, dimnames=list(rnames,cnames))
>>newMatrix <- matrix(x, nrow=2, ncol=2,dimnames=list(rnames,cnames)) #默认按列填充
>x[3,]
>x[2,3]
>x[,4]

(3)数组  array

>?array
>dim1 <- c("A1","A2", "A3")
>dim2 <- c("B1", "B2")
>dim3 <- c("C1","C2", "C3")
>d <- array(1:24, c(3,2,4), dimnames=list(dim1,dim2,dim3))
>d[1,2,3]
 #输出结果
> d
, , C1 B1 B2
A1 1 4
A2 2 5
A3 3 6 , , C2 B1 B2
A1 7 10
A2 8 11
A3 9 12 , , C3 B1 B2
A1 13 16
A2 14 17
A3 15 18 , , C4 B1 B2
A1 19 22
A2 20 23
A3 21 24 > d[1,2,3]
[1] 16

(4)数据框  data.frame()

>patientID <- c(1,2,3,4)
>age <- c(25,34,28,52)
>diabetes <- c("Type1", "Type2", "Type3", "Type2")
>status <- c("poor", "Improved, "Excllent", "poor")
>patientData <- data.frame(patientID, age, diabetes, status)
> patientData
patientID age diabetes status
1 1 25 Type1 poor
2 2 34 Type2 Improved
3 3 28 Type3 Excllent
4 4 52 Type2 poor
>patientData[1:2]
>patientData[c("diabetes","status")]
>patientData$age  
#虽然age直接输入age也能调出,但是这是因为前面创建数据帧的时候包含age。如果没有呢?
#下面举个例子
>head(mtcars)
>mtcars$mpg
>mpg
#为什么会报错呢,这个时候是因为mpg并没有关联到R中。这个时候可以用attach这个命令进行关联,解除用detach
>attach(mtcars)
>mpg
>detach(mtcars)
>mpg
#因子
> diabetes <- factor(diabetes)
> diabetes
[1] Type1 Type2 Type3 Type2
Levels: Type1 Type2 Type3

(5)列表  list

> g <- "My first list"
> h <- c(12,23,34)
> j <- c("one","two","there")
> k <- matrix(1:10, nrow=2)
> mylist <- list(g,h,j,k
> mylist
[[1]]
[1] "My first list" [[2]]
[1] 12 23 34 [[3]]
[1] "one" "two" "there" [[4]]
[,1] [,2] [,3] [,4] [,5]
[1,] 1 3 5 7 9
[2,] 2 4 6 8 10

但是,列表的切片方式略有不同。双中括号!!!

>mylist[[2]]

6 实例演练

>age <- c(1,3,5,2,11,9,3,9,12,3)
>weight <- c(4.4, 5.3, 7.2, 5.2, 8.5, 7.3, 6.0, 10.4, 10.2, 6.1)
>mean(weight) #求均值
>sd(weight) #求方差
>cor(age, weight) #求相关性
>plot(age,weight)

7 推荐

推荐1: 数据分析从零开始实战 | 基础篇  https://mp.weixin.qq.com/s/4ESKjlF4B63IveiIlfCdDA

推荐2:给入行数据分析的8个建议    https://mp.weixin.qq.com/s/FYQ192iwstn2J2QejDvNhA

我是尾巴~

数据分析必将大有所为!!!

D01-R语言基础学习的更多相关文章

  1. 从零开始系列-R语言基础学习笔记之二 数据结构(二)

    在上一篇中我们一起学习了R语言的数据结构第一部分:向量.数组和矩阵,这次我们开始学习R语言的数据结构第二部分:数据框.因子和列表. 一.数据框 类似于二维数组,但不同的列可以有不同的数据类型(每一列内 ...

  2. 从零开始系列--R语言基础学习笔记之一 环境搭建

    R是免费开源的软件,具有强大的数据处理和绘图等功能.下面是R开发环境的搭建过程. 一.点击网址 https://www.r-project.org/ ,进入"The R Project fo ...

  3. D02-R语言基础学习

    R语言基础学习——D02 20190423内容纲要: 1.前言 2.向量操作 (1)常规操作 (2)不定长向量计算 (3)序列 (4)向量的删除与保留 3.列表详解 (1)列表的索引 (2)列表得元素 ...

  4. D03-R语言基础学习

    R语言基础学习——D03 20190423内容纲要: 1.导入数据 (1)从键盘输入 (2)从文本文件导入 (3)从excel文件导入 2.用户自定义函数   3.R访问MySQL数据库 (1)安装R ...

  5. D01——C语言基础学PYTHON

    C语言基础学习PYTHON——基础学习D01 20180705内容纲要: 1 PYTHON介绍 2 PYTHON变量定义规则 3  PYTHON文件结构 4 PYTHON语句及语法 5 字符编码 6 ...

  6. R语言基础:数组&列表&向量&矩阵&因子&数据框

    R语言基础:数组和列表 数组(array) 一维数据是向量,二维数据是矩阵,数组是向量和矩阵的直接推广,是由三维或三维以上的数据构成的. 数组函数是array(),语法是:array(dadta, d ...

  7. D03——C语言基础学习PYTHON

    C语言基础学习PYTHON——基础学习D03 20180804内容纲要: 1 函数的基本概念 2 函数的参数 3 函数的全局变量与局部变量 4 函数的返回值 5 递归函数 6 高阶函数 7 匿名函数 ...

  8. R语言可视化学习笔记之添加p-value和显著性标记

    R语言可视化学习笔记之添加p-value和显著性标记 http://www.jianshu.com/p/b7274afff14f?from=timeline   上篇文章中提了一下如何通过ggpubr ...

  9. R语言基础画图/绘图/作图

    R语言基础画图/绘图/作图 R语言基础画图 R语言免费且开源,其强大和自由的画图功能,深受广大学生和可视化工作人员喜爱,这篇文章对如何使用R语言作基本的图形,如直方图,点图,饼状图以及箱线图进行简单介 ...

随机推荐

  1. Codeforces 1110 简要题解

    文章目录 A题 B题 C题 D题 E题 F题 G题 传送门 众所周知ldxoildxoildxoi这种菜鸡选手是不会写HHH题的,因此该篇博客只有AAA题至GGG题的题解,实在抱歉. A题 传送门 题 ...

  2. 2018.11.05 bzoj3124: [Sdoi2013]直径(树形dp)

    传送门 一道sbsbsb树形dpdpdp 第一问直接求树的直径. 考虑第二问问的边肯定在同一条直径上均是连续的. 因此我们将直径记下来. 然后对于直径上的每一个点,dpdpdp出以这个点为根的子树中不 ...

  3. MySQL批量修改表前缀

    error_reporting(0); $old_pre = 'tdr_'; // 原表前缀 $new_pre = 'db_'; // 新表前缀 // 配置连接 $db = new mysqli('1 ...

  4. java常用设计模式三:原型模式

    在说原型模式之前先说一下浅拷贝和深拷贝的概念 一.浅拷贝和深拷贝 1.浅拷贝 在java中,对象创建后需要有一个引用变量来指向该对象实际的地址空间,也就是说引用变量与对象实体是两个不同的数据体.在Ob ...

  5. IE 8 浏览器 F12 调试功能无法使用

      “按下F12之后,开发人员工具在桌面上看不到,但是任务栏里有显示.将鼠标放在任务栏的开发人员工具上,出现一片透明的区域,选中之后却出不来.将鼠标移动到开发人员工具的缩略图上,右键-最大化,工具就全 ...

  6. celery 4.1下报kombu.exceptions.EncodeError: Object of type 'bytes' is not JSON serializable 处理方式

    #python代码如下 from celery import Celeryimport subprocess app = Celery('tasks', broker='redis://localho ...

  7. 工作总结(二):Web Design

    PHP框架:CakePHP 前端框架:Bootstrap Payment Data Transfer:https://developer.paypal.com/docs/classic/paypal- ...

  8. C和C++中的volatile、内存屏障和CPU缓存一致性协议MESI

    目录 1. 前言2 2. 结论2 3. volatile应用场景3 4. 内存屏障(Memory Barrier)4 5. setjmp和longjmp4 1) 结果1(非优化编译:g++ -g -o ...

  9. python基于matplotlib绘图

    import math import numpy as np import matplotlib.pyplot as plt from matplotlib.font_manager import F ...

  10. Java理论学时第六节。课后作业。

    package Fuction; class Grandparent { public Grandparent() { System.out.println("GrandParent Cre ...