R语言均值,中位数和模式

R统计分析是通过用许多内置函数来执行的。
大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。

我们正在讨论本章中的函数是平均数,中位数和模式。

平均值

它是通过取的值的总和,并除以一个数据系列的数量计算的。

函数mean()是用来计算这在R语言中

语法

用于计算平均值在 R 中的基本语法是:

mean(x, trim = 0, na.rm = FALSE,
...)

以下是所使用的参数的说明:

x 是输入向量。

trim 用于删除一些要素/空格从排序向量的两端。

na.rm 用于从输入矢量删除丢失的值。

示例

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- mean(x)

print(result.mean))

当我们上面的代码执行时,它产生以下结果:

[1] 8.22

应用修剪选项

当修剪参数被提供时,在向量中的值获得排序,然后观察所需要的数据从计算平均丢弃。

当trim =0.3,是从每一端的3个值将被从找到中计算删除的意思。

在这种情况下,排序矢量为(-21,-5,2,3,4.2,7,8,12,18,54)和从向量表除去,用于计算平均值的值从(-21,-5,2)左侧和从(12,18,54)右边。

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- 
mean(x,trim=0.3)

print(result.mean

当我们上面的代码执行时,它产生以下结果:

[1] 5.55

应用NA选项

如果有缺失值,则意味着函数返回 NA。

从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA
值。

# Create a vector.

 x <-
c(12,7,3,4.2,18,2,54,-21,8,-5,NA)



# Find mean.

result.mean <-  mean(x)

print(result.mean)



# Find mean dropping NA values.

result.mean <- 
mean(x,na.rm=TRUE)

print(result.mean)

当我们上面的代码执行时,它产生以下结果:

[1] NA

[1] 8.22

中位数

在一个数据串的中间最值被称为中值。median() 函数用于在 R
中计算此值。

语法

在 R 中用于计算中位数的基本语法是:

median(x, na.rm = FALSE)

以下是所使用的参数的说明:

x 是输入向量。

na.rm 用于从输入矢量删除丢失的值。

例子

# Create the vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find the median.

median.result <- median(x)

print(median.result)

当我们上面的代码执行时,它产生以下结果:

[1] 5.6

模式

模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数,模式可以同时拥有数字和字符数据。

R没有一个标准的内置函数来计算模式。因此,我们创建一个用户函数来计算在R数据集的模式,该函数将向量作为输入,并给出了模式的值输出。

示例

# Create the function.

getmode <- function(v) {

    uniqv
<- unique(v)

  
 uniqv[which.max(tabulate(match(v, uniqv)))]

}



# Create the vector with numbers.

v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)



# Calculate the mode using the user function.

result <- getmode(v)

print(result)



# Create the vector with characters.

charv <- c("o","it","the","it","it")



# Calculate the mode using the user function.

result <- getmode(charv)

print(result)

当我们上面的代码执行时,它产生以下结果:

[1] 2

[1] "it"

R语言均值,中位数和模式的更多相关文章

  1. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  2. R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

    R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较. 一.日期分组 1.关于时间的包都有很多 ...

  3. 使用R语言-计算均值,方差等

    R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [ ...

  4. 基于R语言的数据分析和挖掘方法总结——中位数检验

    3.1 单组样本符号秩检验(Wilcoxon signed-rank test) 3.1.1 方法简介 此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilc ...

  5. 基于R语言的数据分析和挖掘方法总结——均值检验

    2.1 单组样本均值t检验(One-sample t-test) 2.1.1 方法简介 t检验,又称学生t(student t)检验,是由英国统计学家戈斯特(William Sealy Gosset, ...

  6. R语言平均值,中位数和众数

    R语言平均值,中位数和众数 R中的统计分析通过使用许多内置函数来执行的.这些函数大部分是R基础包的一部分.这些函数将R向量与参数一起作为输入,并在执行计算后给出结果. 我们在本章中讨论的是如何求平均值 ...

  7. 如何在R语言中使用Logistic回归模型

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  8. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  9. 机器学习与R语言

    此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...

随机推荐

  1. php 网页内容抓取

    最近抓的2个网站内容的代码 列表页抓取:第一种使用phpquery插件,可以快速获取,第二种它是api,所以直接获取 load_third("phpQuery.php"); /** ...

  2. Beyond Compare注册码

    注册码: --- BEGIN LICENSE KEY --- H1bJTd2SauPv5Garuaq0Ig43uqq5NJOEw94wxdZTpU-pFB9GmyPk677gJ vC1Ro6sbAvK ...

  3. CSS3 进阶

    background-clip指定了背景可以覆盖到什么范围.background-origin指定了背景从什么位置开始.在例子中设置背景平铺应该可以看得清楚些. CSS3之前的背景,按规定是不会进入到 ...

  4. Delphi 设计模式:《HeadFirst设计模式》Delphi7代码---迭代器模式之DinerMenu[转]

    容器的主要职责有两个:存放元素和浏览元素.根据单一职责原则(SRP)要将二者分开,于是将浏览功能打包封装就有了迭代器. 用迭代器封装对动态数组的遍历:  1  2{<HeadFirst设计模式& ...

  5. DB-SQLServer:SQLServer

    ylbtech--DB-SQLServer:SQLServer SQL是英文Structured Query Language的缩写,意思为结构化查询语言.SQL语言的主要功能就是同各种数据库建立联系 ...

  6. DVWA 之high级别sql注入

                 Sqlmap 高级注入,抓包,然后保存数据到1.txt 1.判断注入点 sqlmap -r /root/1.txt -p id --second-order "ht ...

  7. DSP日志打印 LOG_printf

    LOG_printf 依托BIOS环境,需要引用下列头文件: #include <std.h> #include <log.h>     并且,要在.tcf环境中添加一个LOG ...

  8. java基础之集合(Set,Map,List)总结

    一.Collection接口 1.Collection接口两个子接口     -List接口         -ArrayList:         -Vector:         -LinkedL ...

  9. [Day6] Nginx 进阶模块

    一. 使用变量防盗链referer模块 功能:通过验证referer请求头是否合法,来拒绝非正常的网站访问我们站点的资源 思路:通过referer模块,用invaild_refereri变量根据配置判 ...

  10. [Day3] Nginx配置Https

    一. 网络安全之Http与Https Http协议是互联网行业中设计的最好架构之一.20多年间,应用Http协议传输数据的软件越来越多,企图从http协议传输中非法获取.篡改用户重要数据的非法行为也越 ...