python实现简单关联规则Apriori算法

 from itertools import combinations

 from copy import deepcopy

 # 导入数据，并剔除支持度计数小于min_support的1项集

 def load_data(data):

     I_dict = {}

     for i in data:

         for j in i:

             I_dict[j] = I_dict.get(j, 0) + 1

     F_dict = deepcopy(I_dict)

     for k in I_dict.keys():

         if F_dict.get(k) < min_support:

             del F_dict[k]

     return F_dict

 # 判断频繁项集是否大于min_support

 def get_support_set(p_set):

     item_supp_set = []

     for item in p_set:

         count = 0

         for ds in data_set:

             if item.issubset(ds):

                 count += 1

         if count >= min_support:

             item_supp_set.append([item, count])

     return item_supp_set

 # 找出所有频繁项集

 # 以二项集为初始集

 def get_all_items(two_set, k=3):

     all_frequent = []

     flag = True

     while flag:

         mid_set = []

         temp = []

         t_ = [ks[0] for ks in two_set]

         for kk in t_:

             for tt in kk:

                 if tt not in temp:

                     temp.append(tt)

         k_ = [set(t) for t in combinations(temp, k)]

         for ff in k_:

             count_k = 0

             for d in t_:

                 if ff.issuperset(d):

                     count_k += 1

             if count_k == k:

                 mid_set.append(ff)

         frequent_mid_set = get_support_set(mid_set)

         if mid_set:

             k += 1

             two_set = frequent_mid_set

             all_frequent.extend(frequent_mid_set)

         else:

             flag = False

     return all_frequent

 if __name__ == '__main__':

     data = [['I1', 'I2', 'I5'],

             ['I2', 'I4'],

             ['I2', 'I3'],

             ['I1', 'I2', 'I4'],

             ['I1', 'I3'],

             ['I2', 'I3'],

             ['I1', 'I3'],

             ['I1', 'I2', 'I3', 'I5'],

             ['I1', 'I2', 'I3']]

     data_set = [set(d) for d in data]

     min_support = 1

     one = [[{lk}, lv] for lk, lv in load_data(data).items()]

     two = [set(t) for t in combinations(list(load_data(data).keys()), 2)]

     two_f_set = get_support_set(two)

     all_frequent_set = one + two_f_set + get_all_items(two_f_set)

     for afs in all_frequent_set:

         print(afs)

输出结果：

python实现简单关联规则Apriori算法的更多相关文章

Python两步实现关联规则Apriori算法，参考机器学习实战，包括频繁项集的构建以及关联规则的挖掘
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
一步步教你轻松学关联规则Apriori算法
一步步教你轻松学关联规则Apriori算法 (白宁超 2018年10月22日09:51:05) 摘要:先验算法(Apriori Algorithm)是关联规则学习的经典算法之一,常常应用在商业等诸多领 ...
详细介绍关联规则Apriori算法及实现
看了很多博客,关于关联规则的介绍想做一个详细的汇总: 一.概念 ...
关联规则&Apriori算法
2017-12-02 14:27:18 一.术语 Items:项,简记I Transaction:所有项的一个非空子集,简记T Dataset:Transaction的一个集合,简记D 关联规则: 一 ...
Python 实现简单的感知机算法
感知机随机生成一些点和一条原始直线,然后用感知机算法来生成一条直线进行分类,比较差别导入包并设定画图尺寸 import numpy as np import matplotlib.pyplot a ...
python 实现简单的KNN算法
from numpy import * import operator def createDataSet(): group = array([[3,104],[2,100],[1,81],[101, ...
python实现简单分类knn算法
原理:计算当前点(无label,一般为测试集)和其他每个点(有label,一般为训练集)的距离并升序排序,选取k个最小距离的点,根据这k个点对应的类别进行投票,票数最多的类别的即为该点所对应的类别.代 ...
数据挖掘：关联规则的apriori算法在weka的源码分析
相对于机器学习,关联规则的apriori算法更偏向于数据挖掘. 1) 测试文档中调用weka的关联规则apriori算法,如下 try { File file = new File("F:\ ...
Apriori算法第一篇
摘要: Apriori算法是产生k项高频项目组的一般手段.算法概要:首先产生k项高频项目集合Lk,自身链接形成k+1项的项目结合C(k+1),然后剪枝(去掉以前去掉的不满足支持度的高频),生成K=1项 ...

随机推荐

测试阿里云1核2g轻量级服务器的吞吐量
使用jmeter对部署的dbshop发起请求,单线程5000次请求面板为宝塔界面吞吐量大概在每秒48个请求左右.可以看出阿里云1核2g服务器其实并不能进行实战,只是新手练手而已. 阿里云另一种ec ...
PHP编码的规范性
为了提高工作效率,保证开发的有效性和合理性,并最大程度提高程序代码的可读性和可重复利用性,提高沟通效率,需要一份代码编辑规范. 一.文件标记: 1.所有 ...
MVC 模型过滤
通用返回模型 /// <summary> /// WebApi返回数据的泛型类 /// </summary> /// <typeparam name="T&qu ...
ASP .NET 404 Not Found fontawesome-webfont.woff?v=4.0.3
解决Web部署 svg/woff/woff2字体 404错误最近项目中用到了fontawesome-webfont.svg等字体.部署项目后,发现没有<,+等符号,字体也不对,发现浏览器总是报找 ...
mapreduce总结
一.mapreduce简介 MapReduce是一种分布式计算模型,是hadoop的核心组件之一,是Google提出的,主要用于搜索领域,解决海量数据的计算问题. MR有两个阶段组成:Map和Redu ...
CSS知识点梳理
腾讯bugly 映射用法
package com.tencent.bugly.agent; import android.app.Activity; import android.content.Context; import ...
Springboot中SpringMvc拦截器配置与应用（实战）
一.什么是拦截器,及其作用拦截器(Interceptor): 用于在某个方法被访问之前进行拦截,然后在方法执行之前或之后加入某些操作,其实就是AOP的一种实现策略.它通过动态拦截Action调用的对 ...
vos2009如何监听客户行业是否正规
在对接被叫改写规则中将改写规则由原来0:9150 改为0:9150+自己手机号,这样客户打出话全转接到自己手机上,可以接听客户销售行业:
ODBC驱动程序丢失解决方法
今天运行SqlDbx连接数据库的时候报错,提示没有找到相应的ODBC driver,打开ODBC管理面板一看,发现里面的驱动程序都不见了.这时想起今天卸载了一个成本核算软件后成这样的,网上搜索一下只需 ...

python实现简单关联规则Apriori算法

python实现简单关联规则Apriori算法的更多相关文章

随机推荐

热门专题