序贯模型=关联规则+时间因素。

了解这个模型可以参考李明老师的《R语言与网站分析 [李明著][机械工业出版社][2014.04][446页]》，第九章，第二节的“序列模型关联分析”。

以下贴一个网络中关于序贯模型，R语言的arulesSequences包：转载于网易博客：Tony Woo

__________________________________________________________________________________________

今天下午基本上把通过arulesSequences来进行序列模式挖掘搞明白了，晚上又把arulesSequences中最重要的函数cspade查看了一下。Mark一下。

还是先简单写一个模式挖掘的例子。

1、数据准备

假设数据存放在E盘下的test.txt，而且E盘中的数据为：

1 10 2 C D A F H E

1 15 3 A B C E A F

1 20 3 A B F D C F

1 25 4 A C D F D D

2 15 3 A B F

2 20 1 E

3 10 3 B F

4 10 3 D G H

4 20 2 B F

4 25 3 A G H F

4 30 12 A H H H A F F F A G G G

数据比zaki稍微复杂一些，不过只是多添加了一些个别内容。

2、建模

>x=read_baskets(con="E:/zaki.txt",info=c("sequenceID","eventID","SIZE"))
>s1 <- cspade(x, parameter = list(support = 0.6,maxlen=3), control = list(verbose = TRUE))
>as(s1,"data.frame")

主要就这么三步，就完成了序列模式挖掘。现在需要看一下核心的函数cspade()。

3、cspade函数解释

根据文档，cspade函数结构如下：

cspade(data, parameter = NULL, control = NULL, tmpdir = tempdir())

其实，参数data没啥可说的，就导入transactions类型的数据就可以了。

parameter是设定各种参数，这个还需要认真了解一下。

parameter中，可选的参数有如下几个：

support：0-1之间的一个数值，代表得到的高频序列的最小支持度。

支持度其实是这样计算的：看上面的data中有4个序列，比如我们要计算｛A｝的支持度，则直接看｛A｝在4个序列中出现过几次，用次数再除以4就得到了支持度。至于一次订单中出现多少次A，则对序列挖掘是没啥影响的。

maxsize：一个整数值，代表在寻找高频序列的过程中，任意一个序列里面的每一个元素的最多能有几个项。

举个例子， <{D,H},{B,F},{A}> 是我们通过序列挖掘得到的一个序列s，那么序列s包含3个元素element，其中第一个元素又包含2个项item。通过设定maxsize，可以在序列挖掘中设定1对1或多对1的不同挖掘方式。

maxlen：一个整数值，代表挖掘的序列最大可以是多长，也即一个序列最多可以有几个元素。

比如，如果s1 <- cspade(x, parameter = list(support = 0.6,maxlen=2), control = list(verbose = TRUE)) ，那么最终得到的序列可能为： <{D,H},{B}><{A,F,H},{A,F}>

因此，通过maxlen参数可以去挖掘较短的序列。

mingap：一个整数值，确定两个连续的订单之间的最小时间差值，默认为none。

maxgap：一个整数值，确定两个连续的订单之间的最大时间差值，默认为none。

maxwin：一个整数值，确定一个序列中任意两个订单之间的最大时间差值，默认为none。

control其实是对内存了什么的控制，一般用不到，第四个也是用不到。因此，cspade函数主要就parameter的设定。

R语言︱关联规则+时间因素=序贯关联规则的更多相关文章

关联规则-R语言实现
关联规则code{white-space: pre;} pre:not([class]) { background-color: white; }if (window.hljs && ...
R语言关联规则
在用R语言做关联规则分析之前,我们先了解下关联规则的相关定义和解释. 关联规则的用途是从数据背后发现事物之间可能存在的关联或者联系,是无监督的机器学习方法,用于知识发现,而非预测. 关联规则挖掘过程主 ...
R语言实现关联规则与推荐算法(学习笔记)
R语言实现关联规则笔者前言:以前在网上遇到很多很好的关联规则的案例,最近看到一个更好的,于是便学习一下,写个学习笔记. 1 1 0 0 2 1 1 0 0 3 1 1 0 1 4 0 0 0 0 5 ...
[R语言]关联规则2---考虑items之间严格的时序关系
前面介绍了关联规则1---不考虑用户购买的items之间的时序关系,但在一些情况下用户购买item是有严格的次序关系了,比如在某些休闲游戏中,用户购买了道具A才能购买道具B,且道具A和B只能购买一次, ...
[R语言]关联规则1---不考虑items之间的时序关系
本文介绍的是关联规则,分为两部分:第一部分是---不考虑用户购买的items之间严格的时序关系,每个用户有一个“购物篮”,查找其中的关联规则.第二部分--- 考虑items之间的严格的时序关系来分析用 ...
python调用R语言，关联规则可视化
首先当然要配置r语言环境变量什么的 D:\R-3.5.1\bin\x64; D:\R-3.5.1\bin\x64\R.dll;D:\R-3.5.1;D:\ProgramData\Anaconda3\L ...
中部：执具 | R语言数据分析（北京邮电大学）自整理笔记
第5章工欲善其事.必先利其器代码,是延伸我们思想最好的工具. 第6章基础编程--用别人的包和函数讲述自己的故事 6.1编程环境 1.R语言的三段论大前提:计算机语言程序=算法+数据结构小前提:R ...
R语言书籍的学习路线图
现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言. 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑 ...
R 语言的优劣势是什么？
R 语言的优劣势是什么? 2015-05-27 程序员大数据小分析 R,不仅仅是一种语言本文原载于<程序员>杂志2010年第8期,因篇幅所限,有所删减,这里刊登的是全文. 工欲善其 ...

随机推荐

查看Eclipse运行工程时使用的Command Line
一.查看使用的Command Line 1.Window -> Show View -> Other... -> Debug 2.运行工程,然后在Debug视窗中找到运行的工程的主线 ...
个性化推荐调优：重写spark推荐api
最近用spark的mlib模块中的协同过滤库做个性化推荐.spark里面用的是als算法,本质上是矩阵分解svd降维,把一个M*N的用户商品评分矩阵分解为M*K的userFeature(用户特征矩阵) ...
java之拦截器Interceptor
1,拦截器的概念 java里的拦截器是动态拦截Action调用的对象,它提供了一种机制可以使开发者在一个Action执行的前后执行一段代码,也可以在一个Action执行前阻止其执行,同时也提供了 ...
玩转spring boot——简单登录认证
前言在一个web项目中,某些页面是可以匿名访问的,但有些页面则不能.spring mvc提供了HandlerInterceptor接口来应对,只需要重写preHandle方法便可以实现此功能.那么使 ...
linux中sed在指定字符前后添加内容
假设文档内容如下: [root@localhost ~]# cat /tmp/input.txt null 000011112222 test 要求:在1111之前添加AAA,方法如下: sed ...
es随想一
一.安全问题前段时间网上看到的,大量的MongoDB服务器和ElasticSearch服务器被黑客攻击,留下勒索信息. ElasticSearch的2种客户端连接方式,transport方式默认的9 ...
Java中native关键字[转]
原文链接:http://blog.163.com/yueyemaitian@126/blog/static/21475796200701491621267/ 今日在hibernate源代码中遇到了na ...
Golang常用包
fmt 实现了格式化IO函数,格式化短语派生于C io 提供了原始的io操作 bufio 这个包实现了缓冲的io,io.Reader 和 io.Write 对象 sort 对数组和用户定义集合的原始的 ...
vue 学习中版本、问题集锦
看学习视频,因为年份比较早了,其实vue早已迭代到vue2.0了,遇到一些问题: v-for遍历数组,获取索引注意:在2.0版是1~10中,$index已废除,索引 (item,index). 如下 ...
【非原创】C++类成员函数的重载、覆盖和隐藏
链接:https://www.nowcoder.com/questionTerminal/266d3a6d4f1b436aabf1eff3156fed95来源:牛客网题目:类成员函数的重载.覆盖和隐 ...

R语言︱关联规则+时间因素=序贯关联规则

1、数据准备

2、建模

3、cspade函数解释

R语言︱关联规则+时间因素=序贯关联规则的更多相关文章

随机推荐

热门专题