关联规则算法---Eclat算法
Eclat算法
与fp-growth 和apriori算法不同,Eclat算法加入了倒排的思想,具体就是将事务数据中的项作为key,每个项对应的事务ID作为value。
原输入数据为
| tid | item | 
|---|---|
| 1 | A,B | 
| 2 | B,C | 
| 3 | A,C | 
| 4 | A,B,C | 
转换后为:
| item | tids | 
|---|---|
| A | 1,3,4 | 
| B | 1,2,4 | 
| C | 2,3,4 | 
通过转换后的倒排表可以加快频繁集生成速度。 其算法思想是 由频繁k项集求交集,生成候选k+1项集 。对候选k+1项集做裁剪,生成频繁k+1项集,再求交集生成候选k+2项集。如此迭代,直到项集归一。 根据上述数据的情况,具体计算过程为
算法过程:
1.计算频繁1项集,结果为:
| item | freq | 
|---|---|
| A | 3 | 
| B | 3 | 
| C | 3 | 
2.由频繁1项集生成频繁2项集
| item | freq | 
|---|---|
| A,B | 2 | 
| A,C | 2 | 
| B,C | 2 | 
3.由频繁2项集生成频繁3项集
| item | freq | 
|---|---|
| A,B,C | 1 | 
频繁k项集生成频繁k+1项集的过程与由1项集生成2项集的过程完全一致。
这里有个隐含的条件是,两个频繁k项集生成k+1项集时,前k-1项是一致的,A,B+A,C==>A,B,C
Eclat算法实现[编辑]
eclat的核心思想就是倒排,这种数据处理方式很适合用关系型数据表示和实现。 具体可参考用关系型数据结构实现Eclat算法——Hiv
转载自:http://zh.wikipedia.org/wiki/%E5%85%B3%E8%81%94%E5%BC%8F%E8%A7%84%E5%88%99
关联规则算法---Eclat算法的更多相关文章
- 关联规则挖掘--Eclat算法
 - 基于FP-Tree的关联规则FP-Growth推荐算法Java实现
		
基于FP-Tree的关联规则FP-Growth推荐算法Java实现 package edu.test.ch8; import java.util.ArrayList; import java.util ...
 - 数据挖掘进阶之关联规则挖掘FP-Growth算法
		
数据挖掘进阶之关联规则挖掘FP-Growth算法 绪 近期在写论文方面涉及到了数据挖掘,需要通过数据挖掘方法实现软件与用户间交互模式的获取.分析与分类研究.主要涉及到关联规则与序列模式挖掘两块.关联规 ...
 - 数据挖掘:关联规则的apriori算法在weka的源码分析
		
相对于机器学习,关联规则的apriori算法更偏向于数据挖掘. 1) 测试文档中调用weka的关联规则apriori算法,如下 try { File file = new File("F:\ ...
 - 关联规则之Aprior算法
		
关联规则挖掘在电商.零售.大气物理.生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法. 啤酒与尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书<啤酒与尿布 ...
 - GMM算法k-means算法的比较
		
1.EM算法 GMM算法是EM算法族的一个具体例子. EM算法解决的问题是:要对数据进行聚类,假定数据服从杂合的几个概率分布,分布的具体参数未知,涉及到的随机变量有两组,其中一组可观测另一组不可观测. ...
 - 简单易学的机器学习算法——EM算法
		
简单易学的机器学习算法——EM算法 一.机器学习中的参数估计问题 在前面的博文中,如“简单易学的机器学习算法——Logistic回归”中,采用了极大似然函数对其模型中的参数进行估计,简单来讲即对于一系 ...
 - 最短路径算法-Dijkstra算法的应用之单词转换(词梯问题)(转)
		
一,问题描述 在英文单词表中,有一些单词非常相似,它们可以通过只变换一个字符而得到另一个单词.比如:hive-->five:wine-->line:line-->nine:nine- ...
 - 重新想象 Windows 8 Store Apps (31) - 加密解密: 哈希算法, 对称算法
		
原文:重新想象 Windows 8 Store Apps (31) - 加密解密: 哈希算法, 对称算法 [源码下载] 重新想象 Windows 8 Store Apps (31) - 加密解密: 哈 ...
 
随机推荐
- 设置标题小图标ico
			
在head里添加 <link rel="shortcut icon" href="<%=request.getContextPath()%>/FlatU ...
 - icon在页面中的使用
			
https://icomoon.io/app/#/select 1.上传.svg新图标 2.选中那个小图标,点底部导航的生成字体. 3.然后命名,下载. 4.下载下来的内容只有这两处是必须要用的. 5 ...
 - jquery 左边分类+插件
			
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
 - 小师妹问 easyUI mergeCells 行合并后表头和内容对不齐
			
公司来了一个做easyUI的妹子,恰好那妹子是和我一个学校的,有一天下班妹子在超时买东西正好巧遇,然后妹子就问了问题,随便说手机卡需要我帮忙刷机,然后就问手机买了多久, 多少钱,刚买的时候好用不,然后 ...
 - ARC属性中还能使用assign,copy,retain这些关键字吗
			
http://blog.sina.com.cn/s/blog_6531b9b80101c6cr.html 很早以前比较弱,网上不知道哪里看了篇博文,留下了ARC属性中不能使用retain关键 ...
 - hadoop中联结不同来源数据
			
装载自http://www.cnblogs.com/dandingyy/archive/2013/03/01/2938462.html 有时可能需要对来自不同源的数据进行综合分析: 如下例子: 有Cu ...
 - FZU 2091 播放器(栈应用)
			
栈基础应用 #include<iostream> #include<cstdio> #include<cstring> #include<vector> ...
 - Compress a folder using powershell
			
There are many ways to compress a folder using powershell: Method 1: Using System.IO.Compression and ...
 - Java Web 错误排查
			
排查404 1. 检查web.xml,有没有放在web-inf下面,再检查过滤器有没有配置 <filter> <filter-name>struts</filter-na ...
 - P图
			
照片名称:调出照片柔和的蓝黄色-简单方法,1.打开原图素材,按Ctrl + J把背景图层复制一层,点通道面板,选择蓝色通道,图像 > 应用图像,图层为背景,混合为正片叠底,不透明度50%,反相打 ...