R_Studio(关联)对dvdtrans.csv数据进行关联规则分析

　　dvdtrans.csv数据：该原始数据仅仅包含了两个字段(ID, Item) 用户ID，商品名称(共30条)

#导入arules包

#install.packages("arules")

library (arules)

setwd('D:\\data')

Gary=read.csv(file="dvdtrans.csv",header=T)

# 将数据转换为arules关联规则方法apriori 可以处理的数据形式.交易数据

# transactions "事务"

Gary<- as(split(Gary$Item, Gary$ID),"transactions")

# 查看一下数据

#attributes(Gary)

summary(Gary)

# 使用apriori函数生成关联规则

rules <- apriori(Gary, parameter=list(support=0.3,confidence=0.5))

# 查看一下数据

inspect(rules)

Gary.R

实现过程

　　导入arules包

　　对数据进行预处理

#导入arules包

#install.packages("arules")

library (arules)

setwd('D:\\data')

Gary=read.csv(file="dvdtrans.csv",header=T)

# 将数据转换为arules关联规则方法apriori 可以处理的数据形式.交易数据

# transactions "事务"

Gary<- as(split(Gary$Item, Gary$ID),"transactions")

> # 查看一下数据

> #attributes(Gary)

> summary(Gary)

transactions as itemMatrix in sparse format with

 10 rows (elements/itemsets/transactions) and　　　　　　　　　　　　10行（元素/项集/事务）

 10 columns (items) and a density of 0.3 　　　　　　　　　　　　　　 10列（项）和0.3的密度

most frequent items:　　　　　　　　　　　　　　　　　　　　　　　　　　　最常见的项目(频率)：

    Gladiator       Patriot   Sixth Sense    Green Mile Harry Potter1       (Other)

            7             6             6             2             2             7 

element (itemset/transaction) length distribution:　　　　　　　　　　元素（项集/事务）长度分布：

sizes

2 3 4 5

3 5 1 1 

   Min. 1st Qu.  Median    Mean 3rd Qu.    Max.

   2.00    2.25    3.00    3.00    3.00    5.00 

includes extended item information - examples:

      labels

1 Braveheart

2  Gladiator

3 Green Mile

includes extended transaction information - examples:

  transactionID

1             1

2             2

3             3

　　生成关联规则

> # 使用apriori函数生成关联规则

> rules <- apriori(Gary, parameter=list(support=0.3,confidence=0.5))

Apriori

Parameter specification:

 confidence minval smax arem  aval originalSupport maxtime support minlen maxlen target   ext

        0.5    0.1    1 none FALSE            TRUE       5     0.3      1     10  rules FALSE

Algorithmic control:

 filter tree heap memopt load sort verbose

    0.1 TRUE TRUE  FALSE TRUE    2    TRUE

Absolute minimum support count: 3 

set item appearances ...[0 item(s)] done [0.00s].

set transactions ...[10 item(s), 10 transaction(s)] done [0.00s].

sorting and recoding items ... [3 item(s)] done [0.00s].

creating transaction tree ... done [0.00s].

checking subsets of size 1 2 3 done [0.00s].

writing ... [12 rule(s)] done [0.00s].

creating S4 object  ... done [0.00s].

>

> # 查看一下数据

> inspect(rules)

     lhs                        rhs           support confidence lift     count

[1]  {}                      => {Patriot}     0.6     0.6000000  1.000000 6

[2]  {}                      => {Sixth Sense} 0.6     0.6000000  1.000000 6

[3]  {}                      => {Gladiator}   0.7     0.7000000  1.000000 7

[4]  {Patriot}               => {Sixth Sense} 0.4     0.6666667  1.111111 4

[5]  {Sixth Sense}           => {Patriot}     0.4     0.6666667  1.111111 4

[6]  {Patriot}               => {Gladiator}   0.6     1.0000000  1.428571 6

[7]  {Gladiator}             => {Patriot}     0.6     0.8571429  1.428571 6

[8]  {Sixth Sense}           => {Gladiator}   0.5     0.8333333  1.190476 5

[9]  {Gladiator}             => {Sixth Sense} 0.5     0.7142857  1.190476 5

[10] {Patriot,Sixth Sense}   => {Gladiator}   0.4     1.0000000  1.428571 4

[11] {Gladiator,Patriot}     => {Sixth Sense} 0.4     0.6666667  1.111111 4

[12] {Gladiator,Sixth Sense} => {Patriot}     0.4     0.8000000  1.333333 4

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析的更多相关文章

python 读取csv 数据并画图分析
数据源 : https://pan.baidu.com/s/1eR593Uy 密码: yqjh python环境 python3 #encoding: utf-8 import csv impo ...
jmeter参数化之【CSV Data Set Config/CSV数据配置文件】
这里以登录功能为例: 1.新建.txt文件,将参数值写入到txt文件中(多个参数值如:用户名,密码之间以逗号隔开),将文件放置在想要放置的目录下 2.添加csv数据文件设置右键线程组->添加 ...
[moka同学摘录]Yii2 csv数据导出扩展
yii2-thecsv(Yii2框架csv数据导出扩展) github: https://github.com/13552277443/yii2-thecsv 1.安装运行 php composer ...
mysql导出csv/excel文件的几种方法,mysql的load导入csv数据
方法一 php教程用mysql的命令和shell select * into outfile './bestlovesky.xls' from bestlovesky where 1 order by ...
python_如何读写csv数据
案例: 通过股票网站,我们获取了中国股市数据集,它以csv数据格式存储 Data,Open,High,Low,Close,Volume,Adj Close 2016-06-28,8.63,8.47,8 ...
Logstash 6.4.3 导入 csv 数据到 ElasticSearch 6.4.3
本文实践最新版的Logstash从csv文件导入数据到ElasticSearch. 本文目录: 1.初始化ES.Kibana.Logstash 2.安装logstash文件导入.过滤器等插件 3.配置 ...
csv 数据
csv数据:逗号分隔值,其文件以纯文本的形式存储表格数据(数据和文本).csv模块是python的内置模块,需要引用后再使用 csv.reader(csv_file) #使用with结构 with o ...
Loadrunner脚本优化-参数化之关联MySQL数据库获取数据
脚本优化-参数化之关联MySQL数据库获取数据 by:授客 QQ:1033553122 测试环境: Loadrunner 11 Win7 64位实操: 1. 安装MySQL ODBC驱动程序 O ...
mysql SQLyog导入csv数据失败怎么办？
分享下mysql使用SQLyog导入csv数据失败的解决方法给mysql导入数据,选中某个表选择导入--导入使用本地csv数据即可,单有的时候不知道什么问题导入不成功!!! 给mysql导入数据,使 ...

随机推荐

python基础_面向对象进阶
@property装饰器之前我们讨论过Python中属性和方法访问权限的问题,虽然我们不建议将属性设置为私有的,但是如果直接将属性暴露给外界也是有问题的,比如我们没有办法检查赋给属性的值是否有效.我 ...
使用Python基于OpenCV的图像油画特效
算法步骤: 1.获取图像的灰度图片 2.设计一个小方框(4x4/8x8 /10x10等),统计每个小方框的像素值 3.将0-255的灰度值划分成几个等级,并把第二步处理的结果映射到所设置的各个等级中, ...
Map<k,v>接口
https://docs.oracle.com/javase/8/docs/api/java/util/Map.html public interface Map<K,V> K—key,V ...
neo4j allshortestpaths查询路径不准确问题
同样是5年开发,年薪50万和年薪15万的差距在哪里-.>>> 基本语法使用neo4j cypher查询语言的小伙伴都知道cypher提供了两个查询最短路径的特殊函数shortest ...
leecode刷题(31) -- 回文数
leecode刷题(31) -- 回文数回文数判断一个整数是否是回文数.回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数. 示例 1: 输入: 121 输出: true 示例 2: 输 ...
centos安装配置php
PHP的安装同样需要经过环境检查.编译和安装3个步骤. 1.首先用百度搜索 “PHP:Downloads”, 点击第一个网页: 选择5.5.37版本,选择 .tar.gz 格式的文件: 来到镜像列表网 ...
深入理解hive基础学习
Hive 是什么? 1.Hive 是基于 Hadoop处理结构化数据的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL 查询功能. 2.Hive 利用 HDFS 存储数据 ...
前端开发 | 尝试用Markdown写一下近几个月的总结
近期总结回顾半年前半年前,接触了前端一年多(工作半年)的我了解的东西只有下面这些.因为在公司里的工作就是切静态页,捣鼓CMS. HTML (比较简洁的编写HTML) CSS/CSS3 (PC兼容 ...
10、LNMP架构
1LNMP架构概述 1.1.什么是LNMP LNMP 是一套技术的组合,L = Linux,N = Nginx,M~ = MySQL,P~ = PHP 1.2.LNMP架构是如何工作的首先Ngin ...
linux系统使用grep命令提取文件的基名或者路径名
效果等于~]#dirname /etc/sysconfig/network-scripts/ifcfg-ens33 echo "/etc/sysconfig/network-scripts/ ...

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析

R_Studio(关联)对dvdtrans.csv数据进行关联规则分析的更多相关文章

随机推荐

热门专题