
数据挖掘回归分析第五章学习通习题
B. 都是不让人感兴趣的;A. 其支持度小于阈值;C. 其支持度大于阈值;D. 对异常数据项敏感;A. 关联规则发现;D. 自然语言处理;
·
一.单选题
1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题( )
A. 关联规则发现;
B. 聚类;
C. 分类;
D. 自然语言处理;
答:关联规则发现;
2.置信度(confidence)是衡量哪种兴趣度度量的指标( )
A. 简洁性;
B. 确定性;
C. 实用性;
D. 新颖性;
答:B
3.下列指标中,能够度量一个规则的强度,同时衡量两个集合之间的独立性的是( )。
A. 提升度;
B. 杠杆度;
C. IS度量;
D. 确信度;
答:D
4.下列几种数据挖掘功能中被广泛的用于购物篮分析的是( )。
A. 关联分析;
B. 分类和预测;
C. 聚类分析;
D. 演变分析;
答:A
5.设X={1,2,3}是频繁项集,则可由X产生多少个关联规则( )。
A. 4;
B. 5;
C. 6;
D. 7;
答:C
二.多选题
6.下表是一个购物篮,假定支持度阈值为40%,其中哪几个是频繁闭项集( )。
A. abc;
B. ad;
C. cd;
D. de;
答:AD
7.以下关于非频繁模式说法,正确的是( )。
A. 其支持度小于阈值;
B. 都是不让人感兴趣的;
C. 其支持度大于阈值;
D. 对异常数据项敏感;
答案:AD
三.填空题
1.Aprior算法包括____和 ____两个基本步骤。
答案:(1) [ “连接” ]
(2) [ " 剪枝" ]
2.如果L2={{a,b},{a,c},{a,d},{b,c},{b,d}},则连接产生的C3=____。
答案:{{a,b,c},{a,b,d},{a,c,d},{b,c,d}}
3.同时满足____和____的规则称之为强关联规则。
答案:(1) 最小支持度阈值
(2) 最小置信度阈值
4.在挖掘闭模式算法中,直接搜索闭频繁项集,并对结果进行剪枝是最常用的方法,其中剪枝的策略包括____和____。
答案:(1) [ "项合并 " ]
(2) [ “子项集剪枝” ]
5.频繁出现在数据集中的模式称为:____。
答案:(1) 频繁模式
6.大型数据库中的关联规则挖掘包含 找出所有____和由____产生____两个过程。
答案:(1) 频繁项集
(2) 频繁项集
(3) 强关联规则
7.计算{面包(A)=>啤酒(E)}的支持度:____(保留小数点后一位)
答案:(1) [ “0.2”, “0.20” ]
四.判断题
1.关联规则挖掘过程是发现满足最小支持度的所有项集代表的规则
A. 对
B. 错
答案:B. 错
2.利用先验原理可以帮助减少频繁项集产生时需要探查的候选项个数。
答案:A. 对
3.先验原理可以表述为:如果一个项集是频繁的,那包含它的所有非空子集也是频繁的。
答案:A对
4.两个项集的全置信度越大,说明两个项集的关系越紧密,反之则关系越疏远。
答案:A对
更多推荐
所有评论(0)