您现在的位置是:首页 > 编程 > 

数据仓库作业五:第8章 关联规则挖掘

2025-07-22 00:32:50
数据仓库作业五:第8章 关联规则挖掘 第8章 关联规则挖掘作业题1、设4-项集 X=\{a,b,c,d\},试求出由 X 导出的所有关联规则。解:首先生成项集的所有非空真子集。这包括: \{a\},\{b\},\{c\},\{d\}\{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\}\{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,

数据仓库作业五:第8章 关联规则挖掘

第8章 关联规则挖掘

作业题

1、设4-项集

X=\{a,b,c,d\}

,试求出由

X

导出的所有关联规则。

解:

首先生成项集的所有非空真子集。这包括:

\{a\},\{b\},\{c\},\{d\}
\{a,b\},\{a,c\},\{a,d\},\{b,c\},\{b,d\},\{c,d\}
\{a,b,c\},\{a,b,d\},\{a,c,d\},\{b,c,d\}

对于每个非真空子集,生成相应的关联规则。一般地,对于子集

\{A\}

,关联规则的形式是

\{X\}\Rightarrow\{X-A\}

,其中

X-A

表示项集

X

中不包含在

A

中的项。

下面是所有可能的关联规则:

\{a\}\Rightarrow\{b,c,d\},\{b\}\Rightarrow\{a,c,d\},\{c\}\Rightarrow\{a,b,d\},\{d\}\Rightarrow\{a,b,c\},
\{a,b\}\Rightarrow\{c,d\},\{a,c\}\Rightarrow\{b,d\},\{a,d\}\Rightarrow\{b,c\},\{b,c\}\Rightarrow\{a,d\},\{b,d\}\Rightarrow\{a,c\},\{c,d\}\Rightarrow\{a,b\},
\{a,b,c\}\Rightarrow\{d\},\{a,b,d\}\Rightarrow\{c\},\{a,c,d\}\Rightarrow\{b\},\{b,c,d\}\Rightarrow\{a\}

这些规则代表了项集导出的所有可能的关联规则。

2、设有交易数据库如下表1所示,令MinS=0.,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid​

顾客id

购买商品

购买日期

t 1 t_1 t1​

c 01 c_{01} c01​

{ a , b } \{a,b\} {a,b}

2015.0.01

t 2 t_2 t2​

c 02 c_{02} c02​

{ c , b , d } \{c,b,d\} {c,b,d}

2015.0.01

t t_ t​

c 01 c_{01} c01​

{ c } \{c\} {c}

2015.0.0

t 4 t_4 t4​

c 02 c_{02} c02​

{ b , d } \{b,d\} {b,d}

2015.0.0

T_{id}

顾客id购买商品购买日期

t_1
c_{01}
\{a,b\}

2015.0.01

t_2
c_{02}
\{c,b,d\}

2015.0.01

t_
c_{01}
\{c\}

2015.0.0

t_4
c_{02}
\{b,d\}

2015.0.0

解:

因为最小支持度

MinS=0.

,事务数据库有4条记录,

MinSpt=0.\times4=1.2

,所以最小支持数

MinSpt=2

如下表,候选频繁1-项集

C_1

和频繁1-项集

L_1

如下表,候选频繁2-项集

C_2

和频繁2-项集

L_2

得所有的频繁项集为

L=L_2=\{\{b,d\}\}

、对如表1所示的交易数据库,令MinC=0.6,试在习题2所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度

MinC=0.6

Confidence(\{b\}\Rightarrow\{d\})=\frac{Support(\{b,d\})}{Support(\{b\})}=\frac{2}{}\approx0.67>0.6
Confidence(\{d\}\Rightarrow\{b\})=\frac{Support(\{b,d\})}{Support(\{d\})}=\frac{2}{2}=1>0.6

所以

\{b\}\Rightarrow\{d\}

\{d\}\Rightarrow\{b\}

都是强关联规则。

4、设有交易数据库如表2所示,令MinS=0.,试用Apriori算法求出其所有的频繁项集。

T i d T_{id} Tid​

顾客id

购买商品

购买日期

t 1 t_1 t1​

c 01 c_{01} c01​

{ a , b , e } \{a,b,e\} {a,b,e}

2015.0.01

t 2 t_2 t2​

c 02 c_{02} c02​

{ b , d } \{b,d\} {b,d}

2015.0.01

t t_ t​

c 0 c_{0} c0​

{ b , c } \{b,c\} {b,c}

2015.0.01

t 4 t_4 t4​

c 01 c_{01} c01​

{ a , b , d } \{a,b,d\} {a,b,d}

2015.0.0

t 5 t_5 t5​

c 02 c_{02} c02​

{ a , c } \{a,c\} {a,c}

2015.0.0

t 6 t_6 t6​

c 0 c_{0} c0​

{ b , c } \{b,c\} {b,c}

2015.0.0

t 7 t_7 t7​

c 01 c_{01} c01​

{ a , c } \{a,c\} {a,c}

2015.0.05

t 8 t_8 t8​

c 0 c_{0} c0​

{ a , b , c , e } \{a,b,c,e\} {a,b,c,e}

2015.0.05

t 9 t_9 t9​

c 0 c_{0} c0​

{ a , b , c } \{a,b,c\} {a,b,c}

2015.0.06

T_{id}

顾客id购买商品购买日期

t_1
c_{01}
\{a,b,e\}

2015.0.01

t_2
c_{02}
\{b,d\}

2015.0.01

t_
c_{0}
\{b,c\}

2015.0.01

t_4
c_{01}
\{a,b,d\}

2015.0.0

t_5
c_{02}
\{a,c\}

2015.0.0

t_6
c_{0}
\{b,c\}

2015.0.0

t_7
c_{01}
\{a,c\}

2015.0.05

t_8
c_{0}
\{a,b,c,e\}

2015.0.05

t_9
c_{0}
\{a,b,c\}

2015.0.06

解:

因为最小支持度

MinS=0.

,事务数据库有9条记录,

MinSpt=0.\times9=2.7

,所以最小支持数

MinSpt=

如下表,候选频繁1-项集

C_1

和频繁1-项集

L_1

如下表,候选频繁2-项集

C_2

和频繁2-项集

L_2

如下表,候选频繁-项集

C_

得所有的频繁项集为

L=L_2=\{\{a,b\},\{a,c\},\{b,c\}\}

5、对如表2所示的交易数据库,令MinC=0.6,试在习题4所得频繁项集的基础上,求出所有的强关联规则。

解:

由题可知,最小置信度

MinC=0.6

Confidence(\{a\}\Rightarrow\{b\})=\frac{Support(\{a,b\})}{Support(\{a\})}=\frac{4}{6}\approx0.67>0.6
Confidence(\{b\}\Rightarrow\{a\})=\frac{Support(\{a,b\})}{Support(\{b\})}=\frac{4}{7}\approx0.57<0.6
Confidence(\{a\}\Rightarrow\{c\})=\frac{Support(\{a,c\})}{Support(\{a\})}=\frac{4}{6}\approx0.67>0.6
Confidence(\{c\}\Rightarrow\{a\})=\frac{Support(\{a,c\})}{Support(\{c\})}=\frac{4}{6}\approx0.67>0.6
Confidence(\{b\}\Rightarrow\{c\})=\frac{Support(\{b,c\})}{Support(\{b\})}=\frac{4}{7}\approx0.57<0.6
Confidence(\{c\}\Rightarrow\{b\})=\frac{Support(\{b,c\})}{Support(\{c\})}=\frac{4}{6}\approx0.67>0.6

所以

\{a\}\Rightarrow\{b\}

\{a\}\Rightarrow\{c\}

\{c\}\Rightarrow\{a\}

\{c\}\Rightarrow\{b\}

是强关联规则。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。 原始发表:2024-08-18,如有侵权请联系 cloudcommunity@tencent 删除基础事务数据仓库算法数据库

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1138055.html

相关标签:无
上传时间: 2025-07-19 04:16:34
留言与评论(共有 18 条评论)
本站网友 北京ktv
10分钟前 发表
c\} {b
本站网友 太保网
23分钟前 发表
MinSpt=0.\times4=1.2
本站网友 赵毅新
6分钟前 发表
令MinC=0.6
本站网友 东阳二手房
2分钟前 发表
d\})}{Support(\{d\})}=\frac{2}{2}=1>0.6所以 \{b\}\Rightarrow\{d\}
本站网友 八百伴
19分钟前 发表
设有交易数据库如下表1所示
本站网友 种马小说排行榜
14分钟前 发表
4
本站网友 有限的访问权限
0秒前 发表
d\}对于每个非真空子集
本站网友 美胸产品
20分钟前 发表
4
本站网友 杭州植发医院
9分钟前 发表
b
本站网友 整容致死
11分钟前 发表
4
本站网友 青海长云暗雪山
24分钟前 发表
c\}2015.0.05t_8c_{0}\{a
本站网友 剖腹产后减肥方法
5分钟前 发表
d}2015.0.01t t_ t​c 0 c_{0} c0​{ b
本站网友 金炫澈
15分钟前 发表
e}2015.0.05t 9 t_9 t9​c 0 c_{0} c0​{ a
本站网友 三维度科技
30分钟前 发表
c\}\Rightarrow\{b
本站网友 创意产业
22分钟前 发表
\{d\}\{a
本站网友 开通微信
4分钟前 发表
MinSpt=0.\times4=1.2
本站网友 博客大巴
7分钟前 发表
求出所有的强关联规则