数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。下面对R语言中常用的数据挖掘包做一个汇总:

连续因变量的预测:

stats包 lm函数,实现多元线性回归

stats包 glm函数,实现广义线性回归

stats包 nls函数,实现非线性最小二乘回归

rpart包 rpart函数,基于CART算法的分类回归树模型

RWeka包 M5P函数,模型树算法,集线性回归和CART算法的优点

adabag包 bagging函数,基于rpart算法的集成算法

adabag包 boosting函数,基于rpart算法的集成算法

randomForest包 randomForest函数,基于rpart算法的集成算法

e1071包 svm函数,支持向量机算法

kernlab包 ksvm函数,基于核函数的支持向量机

nnet包 nnet函数,单隐藏层的神经网络算法

neuralnet包 neuralnet函数,多隐藏层多节点的神经网络算法

RSNNS包 mlp函数,多层感知器神经网络

RSNNS包rbf函数,基于径向基函数的神经网络

离散因变量的分类:

stats包 glm函数,实现Logistic回归,选择logit连接函数

stats包 knn函数,k最近邻算法

kknn包 kknn函数,加权的k最近邻算法

rpart包 rpart函数,基于CART算法的分类回归树模型

adabag包bagging函数,基于rpart算法的集成算法

adabag包boosting函数,基于rpart算法的集成算法

randomForest包randomForest函数,基于rpart算法的集成算法

party包ctree函数,条件分类树算法

RWeka包OneR函数,一维的学习规则算法

RWeka包JPip函数,多维的学习规则算法

RWeka包J48函数,基于C4.5算法的决策树

C50包C5.0函数,基于C5.0算法的决策树

e1071包svm函数,支持向量机算法

kernlab包ksvm函数,基于核函数的支持向量机

e1071包naiveBayes函数,贝叶斯分类器算法

klaR包NaiveBayes函数,贝叶斯分类器算分

MASS包lda函数,线性判别分析

MASS包qda函数,二次判别分析

nnet包nnet函数,单隐藏层的神经网络算法

RSNNS包mlp函数,多层感知器神经网络

RSNNS包rbf函数,基于径向基函数的神经网络

聚类:

Nbclust包Nbclust函数可以确定应该聚为几类

stats包kmeans函数,k均值聚类算法

cluster包pam函数,k中心点聚类算法

stats包hclust函数,层次聚类算法

fpc包dbscan函数,密度聚类算法

fpc包kmeansruns函数,相比于kmeans函数更加稳定,而且还可以估计聚为几类

fpc包pamk函数,相比于pam函数,可以给出参考的聚类个数

mclust包Mclust函数,期望最大(EM)算法

关联规则:

arules包apriori函数,Apriori关联规则算法

R中常用数据挖掘算法包的更多相关文章

  1. 【转载】R中有关数据挖掘的包

    下面列出了可用于数据挖掘的R包和函数的集合.其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来. 1.聚类 常用的包: fpc,cluster,pvclust,m ...

  2. Spark中常用的算法

    Spark中常用的算法: 3.2.1 分类算法 分类算法属于监督式学习,使用类标签已知的样本建立一个分类函数或分类模型,应用分类模型,能把数据库中的类标签未知的数据进行归类.分类在数据挖掘中是一项重要 ...

  3. python中常用的导包的方法和常用的库

    python中常用的导包的方法               导入包和包名的方法:1.import package.module 2.from package.module import  * 例一: ...

  4. ACM 中常用的算法有哪些? 2014-08-21 21:15 40人阅读 评论(0) 收藏

    ACM 中常用的算法有哪些?作者: 张俊Michael 网络上流传的答案有很多,估计提问者也曾经去网上搜过.所以根据自己微薄的经验提点看法. 我ACM初期是训练编码能力,以水题为主(就是没有任何算法, ...

  5. 列出JDK中常用的Java包

    列出JDK中常用的Java包 1.java.lang 2.java.sql 3.java.io 4.java.math 5.java.text 6.java.net 7.java.util 8.jav ...

  6. R语言︱常用统计方法包+机器学习包(名称、简介)

    一.一些函数包大汇总 转载于:http://www.dataguru.cn/thread-116761-1-1.html 时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能 ...

  7. ACM 中常用的算法有哪些?

    在网上看到别人ACM学习的心得,转载过来,源地址不记得了,当时是百度的.内容如下: 网络上流传的答案有很多,估计提问者也曾经去网上搜过.所以根据自己微薄的经验提点看法. 我ACM初期是训练编码能力,以 ...

  8. 面试中常用排序算法实现(Java)

    当我们进行数据处理的时候,往往需要对数据进行查找操作,一个有序的数据集往往能够在高效的查找算法下快速得到结果.所以排序的效率就会显的十分重要,本篇我们将着重的介绍几个常见的排序算法,涉及如下内容: 排 ...

  9. 在win+r中常用的命令

    cmd打开命令提示符 regedit打开注册表 gpedit.msc组策略 services.msc打开服务列表 msconfig系统配置(可以设置开机自启动) compmgmt.msc 计算机管理 ...

随机推荐

  1. Linux非阻塞IO(二)网络编程中非阻塞IO与IO复用模型结合

    上文描述了最简易的非阻塞IO,采用的是轮询的方式,这节我们使用IO复用模型.   阻塞IO   过去我们使用IO复用与阻塞IO结合的时候,IO复用模型起到的作用是并发监听多个fd. 以简单的回射服务器 ...

  2. js控制div内的滚动条的位置

    通过div的scrollTop变动控制垂直滚动条位置. 通过div的scrollLeft变动控制水平滚动条位置. 示例: <body> //d1是外层div,带滚动条 <div id ...

  3. 并发编程概述 委托(delegate) 事件(event) .net core 2.0 event bus 一个简单的基于内存事件总线实现 .net core 基于NPOI 的excel导出类,支持自定义导出哪些字段 基于Ace Admin 的菜单栏实现 第五节:SignalR大杂烩(与MVC融合、全局的几个配置、跨域的应用、C/S程序充当Client和Server)

    并发编程概述   前言 说实话,在我软件开发的头两年几乎不考虑并发编程,请求与响应把业务逻辑尽快完成一个星期的任务能两天完成绝不拖三天(剩下时间各种浪),根本不会考虑性能问题(能接受范围内).但随着工 ...

  4. jQuery的$.fn使用

    jquery中文网为您提供jQuery的$.fn使用等资源,欢迎您收藏本站,我们将为您提供最新的jQuery的$.fn使用资源 $.fn是指jquery的命名空间,加上fn上的方法及属性,会对jque ...

  5. Android适配方案小结(二)

    该节主要记录从代码中获取与屏幕适配相关的各个參数: Java代码例如以下 public class ScreenUtil { /** * Note: * 仅仅有activity能够使用getWindo ...

  6. 无需Root实现Android手机屏幕流畅投影到电脑进行演示(附软件下载)

    近期要在公司的会议上演示App,须要在投影仪上显示出来给大家演示.因为投影仪不是智能投影仪,仅仅能将App先投影到自己的笔记本上.然后再将笔记本上的内容投影到投影仪上.该App是个游戏,实时交互性比較 ...

  7. pycharm下: conda installation is not found ----一个公开的bug的解决方案

    pycharm  conda installation is not  found ----一个公开的bug的解决方案 pycharm+anaconda 是当前的主流的搭建方案,但是常出现上述问题. ...

  8. 使用eclipse开发hbase程序

      一:在eclipse创建一个普通的java项目 二:新建一个文件夹,把hbase需要的jar放进去,我这里把hbase/lib/*.jar 下所有的jar都放进去了,最后发现就用到了下面三个jar ...

  9. HTML_<a>

    1.在a标签中调用js函数最适当的方法推荐使用: (1) a href="javascript:void(0);" onclick="js_method()" ...

  10. PHP 使用 GeoLiteCity 库解析 IP 为地理位置

    关于把 IP 地址转换为地理位置可以使用网络上很多的 API,好处就是不用在本地存储一个 IP 数据库,而且一般网络上的 IP 库会自动更新,不利的地方就是太依赖于网络,性能表现也可能会弱些.比如像下 ...