数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。下面对R语言中常用的数据挖掘包做一个汇总:

连续因变量的预测:

stats包 lm函数,实现多元线性回归

stats包 glm函数,实现广义线性回归

stats包 nls函数,实现非线性最小二乘回归

rpart包 rpart函数,基于CART算法的分类回归树模型

RWeka包 M5P函数,模型树算法,集线性回归和CART算法的优点

adabag包 bagging函数,基于rpart算法的集成算法

adabag包 boosting函数,基于rpart算法的集成算法

randomForest包 randomForest函数,基于rpart算法的集成算法

e1071包 svm函数,支持向量机算法

kernlab包 ksvm函数,基于核函数的支持向量机

nnet包 nnet函数,单隐藏层的神经网络算法

neuralnet包 neuralnet函数,多隐藏层多节点的神经网络算法

RSNNS包 mlp函数,多层感知器神经网络

RSNNS包rbf函数,基于径向基函数的神经网络

离散因变量的分类:

stats包 glm函数,实现Logistic回归,选择logit连接函数

stats包 knn函数,k最近邻算法

kknn包 kknn函数,加权的k最近邻算法

rpart包 rpart函数,基于CART算法的分类回归树模型

adabag包bagging函数,基于rpart算法的集成算法

adabag包boosting函数,基于rpart算法的集成算法

randomForest包randomForest函数,基于rpart算法的集成算法

party包ctree函数,条件分类树算法

RWeka包OneR函数,一维的学习规则算法

RWeka包JPip函数,多维的学习规则算法

RWeka包J48函数,基于C4.5算法的决策树

C50包C5.0函数,基于C5.0算法的决策树

e1071包svm函数,支持向量机算法

kernlab包ksvm函数,基于核函数的支持向量机

e1071包naiveBayes函数,贝叶斯分类器算法

klaR包NaiveBayes函数,贝叶斯分类器算分

MASS包lda函数,线性判别分析

MASS包qda函数,二次判别分析

nnet包nnet函数,单隐藏层的神经网络算法

RSNNS包mlp函数,多层感知器神经网络

RSNNS包rbf函数,基于径向基函数的神经网络

聚类:

Nbclust包Nbclust函数可以确定应该聚为几类

stats包kmeans函数,k均值聚类算法

cluster包pam函数,k中心点聚类算法

stats包hclust函数,层次聚类算法

fpc包dbscan函数,密度聚类算法

fpc包kmeansruns函数,相比于kmeans函数更加稳定,而且还可以估计聚为几类

fpc包pamk函数,相比于pam函数,可以给出参考的聚类个数

mclust包Mclust函数,期望最大(EM)算法

关联规则:

arules包apriori函数,Apriori关联规则算法

R中常用数据挖掘算法包的更多相关文章

  1. 【转载】R中有关数据挖掘的包

    下面列出了可用于数据挖掘的R包和函数的集合.其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来. 1.聚类 常用的包: fpc,cluster,pvclust,m ...

  2. Spark中常用的算法

    Spark中常用的算法: 3.2.1 分类算法 分类算法属于监督式学习,使用类标签已知的样本建立一个分类函数或分类模型,应用分类模型,能把数据库中的类标签未知的数据进行归类.分类在数据挖掘中是一项重要 ...

  3. python中常用的导包的方法和常用的库

    python中常用的导包的方法               导入包和包名的方法:1.import package.module 2.from package.module import  * 例一: ...

  4. ACM 中常用的算法有哪些? 2014-08-21 21:15 40人阅读 评论(0) 收藏

    ACM 中常用的算法有哪些?作者: 张俊Michael 网络上流传的答案有很多,估计提问者也曾经去网上搜过.所以根据自己微薄的经验提点看法. 我ACM初期是训练编码能力,以水题为主(就是没有任何算法, ...

  5. 列出JDK中常用的Java包

    列出JDK中常用的Java包 1.java.lang 2.java.sql 3.java.io 4.java.math 5.java.text 6.java.net 7.java.util 8.jav ...

  6. R语言︱常用统计方法包+机器学习包(名称、简介)

    一.一些函数包大汇总 转载于:http://www.dataguru.cn/thread-116761-1-1.html 时间上有点过期,下面的资料供大家参考基本的R包已经实现了传统多元统计的很多功能 ...

  7. ACM 中常用的算法有哪些?

    在网上看到别人ACM学习的心得,转载过来,源地址不记得了,当时是百度的.内容如下: 网络上流传的答案有很多,估计提问者也曾经去网上搜过.所以根据自己微薄的经验提点看法. 我ACM初期是训练编码能力,以 ...

  8. 面试中常用排序算法实现(Java)

    当我们进行数据处理的时候,往往需要对数据进行查找操作,一个有序的数据集往往能够在高效的查找算法下快速得到结果.所以排序的效率就会显的十分重要,本篇我们将着重的介绍几个常见的排序算法,涉及如下内容: 排 ...

  9. 在win+r中常用的命令

    cmd打开命令提示符 regedit打开注册表 gpedit.msc组策略 services.msc打开服务列表 msconfig系统配置(可以设置开机自启动) compmgmt.msc 计算机管理 ...

随机推荐

  1. Linux学习笔记 (二)常用linux命令

    一.命令行语法: 命令字 [选项] [参数] 注意:Linux中对命令是区分大小写的. 二.获取命令帮助: 1.help命令:help xxx,shell内部指令,用来获取linux内部命令.例如:h ...

  2. SQL SERVER 使用订阅发布同步数据库(转)

    一.数据库复制涉及  1.发布服务器:  数据的来源服务器,维护源数据,决定哪些数据将被分发,检测哪些数据发生了修改,并将这些信息提交给分发服务器.  2.分发服务器: 分发服务器负责把从发布服务器拿 ...

  3. Nginx:处理HTTP请求

    参考资料<深入理解Nginx>(陶辉) 处理HTTP请求 接着上一次的内容,本次将说明HTTP框架是如何召集负责具体功能的各HTTP模块合作处理请求的. 在http://www.cnblo ...

  4. 修改pip源为国内网站

    import os,sys,platformini="""[global]index-url = https://pypi.doubanio.com/simple/[in ...

  5. python 读写 json文件

    json的优势: 1. 数据体积方面. JSON相对于XML来讲,数据的体积小,传递的速度更快些. 2. 传输速度方面. JSON的速度要远远快于XML 3. 数据格式 数据格式比较简单, 易于读写, ...

  6. Codeforces 34C-Page Numbers(set+vector+暴力乱搞)

    C. Page Numbers time limit per test 2 seconds memory limit per test 256 megabytes input standard inp ...

  7. python 用win32修改注册表,修改打开IE浏览器的配置

    打开注册表:win+r, regedit,注册表的管理是按照文件夹的形式的. 注册表总共有五项: HKEY_CLASSES_ROOT 是HKEY_LOCAL_MACHINE\Software的子项,保 ...

  8. Oracle直接路径加载--append的深度解析

    ㈠ 直接路径加载和buffer cache              直接路径插入的数据不经过buffer cache,从PGA直接把数据格式化成Oracle块       然后由普通的Oracle ...

  9. ffmpeg截图

    ffmpeg.exe -probesize 32768 -i "rtmp://localhost/live/1 live=1" -y -t 0.001 -ss 1 -f image ...

  10. Redis源码阅读-sds字符串源码阅读

    redis使用sds代替char *字符串, 其定义如下: typedef char *sds; struct sdshdr { unsigned int len; unsigned int free ...