R语言均值,中位数和模式

R统计分析是通过用许多内置函数来执行的。
大多数这些函数是R基本包的一部分。这些函数需要R向量作为输入参数并给出结果。

我们正在讨论本章中的函数是平均数,中位数和模式。

平均值

它是通过取的值的总和,并除以一个数据系列的数量计算的。

函数mean()是用来计算这在R语言中

语法

用于计算平均值在 R 中的基本语法是:

mean(x, trim = 0, na.rm = FALSE,
...)

以下是所使用的参数的说明:

x 是输入向量。

trim 用于删除一些要素/空格从排序向量的两端。

na.rm 用于从输入矢量删除丢失的值。

示例

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- mean(x)

print(result.mean))

当我们上面的代码执行时,它产生以下结果:

[1] 8.22

应用修剪选项

当修剪参数被提供时,在向量中的值获得排序,然后观察所需要的数据从计算平均丢弃。

当trim =0.3,是从每一端的3个值将被从找到中计算删除的意思。

在这种情况下,排序矢量为(-21,-5,2,3,4.2,7,8,12,18,54)和从向量表除去,用于计算平均值的值从(-21,-5,2)左侧和从(12,18,54)右边。

# Create a vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find Mean.

result.mean <- 
mean(x,trim=0.3)

print(result.mean

当我们上面的代码执行时,它产生以下结果:

[1] 5.55

应用NA选项

如果有缺失值,则意味着函数返回 NA。

从计算中使用 na.rm= TRUE 删除缺失值。这意味着删除 NA
值。

# Create a vector.

 x <-
c(12,7,3,4.2,18,2,54,-21,8,-5,NA)



# Find mean.

result.mean <-  mean(x)

print(result.mean)



# Find mean dropping NA values.

result.mean <- 
mean(x,na.rm=TRUE)

print(result.mean)

当我们上面的代码执行时,它产生以下结果:

[1] NA

[1] 8.22

中位数

在一个数据串的中间最值被称为中值。median() 函数用于在 R
中计算此值。

语法

在 R 中用于计算中位数的基本语法是:

median(x, na.rm = FALSE)

以下是所使用的参数的说明:

x 是输入向量。

na.rm 用于从输入矢量删除丢失的值。

例子

# Create the vector.

x <- c(12,7,3,4.2,18,2,54,-21,8,-5)



# Find the median.

median.result <- median(x)

print(median.result)

当我们上面的代码执行时,它产生以下结果:

[1] 5.6

模式

模式是一个具有最高发生次数的一组数据的值。不同于平均数和中位数,模式可以同时拥有数字和字符数据。

R没有一个标准的内置函数来计算模式。因此,我们创建一个用户函数来计算在R数据集的模式,该函数将向量作为输入,并给出了模式的值输出。

示例

# Create the function.

getmode <- function(v) {

    uniqv
<- unique(v)

  
 uniqv[which.max(tabulate(match(v, uniqv)))]

}



# Create the vector with numbers.

v <- c(2,1,2,3,1,2,3,4,1,5,5,3,2,3)



# Calculate the mode using the user function.

result <- getmode(v)

print(result)



# Create the vector with characters.

charv <- c("o","it","the","it","it")



# Calculate the mode using the user function.

result <- getmode(charv)

print(result)

当我们上面的代码执行时,它产生以下结果:

[1] 2

[1] "it"

R语言均值,中位数和模式的更多相关文章

  1. R语言数据管理(二):模式与类

      最常用的4种数据类型是数值型(numeric).字符型(character)(字符串).日期型(Date)或POSIXct(基于日期的).逻辑型(logical)(TRUE或FALSE). 变量中 ...

  2. R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

    R语言︱数据集分组 大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较. 一.日期分组 1.关于时间的包都有很多 ...

  3. 使用R语言-计算均值,方差等

    R语言对于数值计算很方便,最近用到了计算方差,标准差的功能,特记录. 数据准备 height <- c(6.00, 5.92, 5.58, 5.92) 1 计算均值 mean(height) [ ...

  4. 基于R语言的数据分析和挖掘方法总结——中位数检验

    3.1 单组样本符号秩检验(Wilcoxon signed-rank test) 3.1.1 方法简介 此处使用的统计分析方法为美国统计学家Frank Wilcoxon所提出的非参数方法,称为Wilc ...

  5. 基于R语言的数据分析和挖掘方法总结——均值检验

    2.1 单组样本均值t检验(One-sample t-test) 2.1.1 方法简介 t检验,又称学生t(student t)检验,是由英国统计学家戈斯特(William Sealy Gosset, ...

  6. R语言平均值,中位数和众数

    R语言平均值,中位数和众数 R中的统计分析通过使用许多内置函数来执行的.这些函数大部分是R基础包的一部分.这些函数将R向量与参数一起作为输入,并在执行计算后给出结果. 我们在本章中讨论的是如何求平均值 ...

  7. 如何在R语言中使用Logistic回归模型

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  8. R语言实战(二)数据管理

    本文对应<R语言实战>第4章:基本数据管理:第5章:高级数据管理 创建新变量 #建议采用transform()函数 mydata <- transform(mydata, sumx ...

  9. 机器学习与R语言

    此书网上有英文电子版:Machine Learning with R - Second Edition [eBook].pdf(附带源码) 评价本书:入门级的好书,介绍了多种机器学习方法,全部用R相关 ...

随机推荐

  1. 使用git命令从github上clone项目

    首先创建本地仓库(实际上就是创建一个文件夹,放项目代码),然后cd进文件夹, 初始化空的git仓库 注意:这里不初始化也是可以clone的 然后git clone url(url表示项目网址) 然后就 ...

  2. Django项目:CMDB(服务器硬件资产自动采集系统)--01--01CMDB获取服务器基本信息

    AutoClient #settings.py # ————————01CMDB获取服务器基本信息———————— import os BASEDIR = os.path.dirname(os.pat ...

  3. Html 重要单词归纳

    1.translate(x,y)平移2.scale(x,y)缩放3.fillstyle填充4.linearGradient(xstart,ystart,xend,yend)渐变5.move to 将光 ...

  4. Windows下shell神器

    想找一个可以在Windows平台玩命令行的东西,不想装虚拟机搞linux,所以找到两个神器 如何升级Babun中的Git Babun中默认已经集成Git,只是有可能不是最新的版本 如果只是更新Babu ...

  5. Consul3-使用consul作为配置中心

    在前面的文章中学习了consul在windows下的安装配置,然后consul作为spring boot的服务发现和注册中心,详细的参考: https://blog.csdn.net/j9038291 ...

  6. GUID 使用方法

    GUID(全局统一标识符)是指在一台机器上生成的数字,它保证对在同一时空中的所有机器都是唯一的.通常平台会提供生成GUID的API.生成算法很有意思,用到了以太网卡地址.纳秒级时间.芯片ID码和许多可 ...

  7. [转]js设计模式-策略模式

    在程序设计中,常常遇到类似的情况,要实现某一个功能有多种方案可以选择.比如一个压缩文件的程序,既可以选择zip算法,也可以选择gzip算法.这些算法灵活多样,而且可以随意互相替换.这种解决方案就是本文 ...

  8. Spring的IoC容器(转)BeanFactory

    Spring的IoC容器 Spring读书笔记-----Spring的Bean之Bean的基本概念 加菲猫 Just have a little faith. Spring的IoC容器 (用户持久化类 ...

  9. C++/CLI 创建WinForm程序

    本文演示下用CLR创建一个简单的winform程序,IDE:VS2015 可以参考另一篇文章:http://blog.csdn.net/wcc27857285/article/details/7813 ...

  10. OPGL+GLFW+GLEW配置详细步骤

    转载自:https://blog.csdn.net/weixin_40921421/article/details/80211813 本文设计的工具包: 链接:https://pan.baidu.co ...