
《数据挖掘与机器学习》—— 第六章 关联规则和协同过滤 作业
6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(),并将这些用户喜欢的项推荐给有相似兴趣的用户。7. (单选题)通过数据收集和展示数据背后的(),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3
第六章 关联规则和协同过滤作业及答案
快捷查找:Ctrl+F 在搜索框中输入题目
一. 单选题(共15题)
1. (单选题)当分析顾客消费行业,以便有针对性的向其推荐感兴趣的服务,属于什么问题?
A. 分类
B. 聚类
C. 关联规则
D. 主成分分析
答案: C:关联规则;
2. (单选题)可用作数据挖掘分析中的关联规则算法有( )。
A. 决策树、对数回归、关联模式
B. K均值法、SOM神经网络
C. Apriori算法、FP-Tree算法
D. RBF神经网络、K均值法、决策树
答案: C:Apriori算法、FP-Tree算法;
3. (单选题)在图集合中发现一组公共子结构,这样的任务称为( )。
A. 频繁子集挖掘
B. 频繁子图挖掘
C. 频繁数据项挖掘
D. 频繁模式挖掘
答案: B:频繁子图挖掘;
4. (单选题)
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布. 这种属于数据挖掘的哪类问题?
关联规则就是通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯,而物品见的某种联系我们称为关联。这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。
A. . 关联规则发现
B. 聚类
C. 分类
D. 自然语言处理
答案: A:. 关联规则发现;
5. (单选题)以下哪种算法是关联规则挖掘?
A. DBSCAN
B.
ID3
C. K-Means
D. Apriori
答案: D:Apriori;
6. (单选题)协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度( ),并将这些用户喜欢的项推荐给有相似兴趣的用户。
A. 相似
B.相同
C. 推荐
D. 预测
答案: D:预测;
7. (单选题)通过数据收集和展示数据背后的( ),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。
A. 数据收集
B. 数据挖掘
C. 真相
D. 关联与模式
答案: D:关联与模式;
8. (单选题)发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定最小支持度和( ),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则
A. 最小兴趣度
B. 最大置信度
C. 最大支持度
D. 最小可信度
答案: D:最小可信度;
9. (单选题)设X={1,2,3}是频繁项集,则可由X产生( )个关联规则。
A. 4
B. 5
C. 6
D. 7
答案: C:6;
10. (单选题)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于 ( ) ,推测客户将来可能的购买行为。
A. 客户的朋友
B. 客户的个人信息
C. 客户的兴趣爱好
D. 客户过去的购买行为和购买记录
答案: D:客户过去的购买行为和购买记录;
11. (单选题)关联规则的评价指标是?( )
A. 均方误差、均方根误差
B. Kappa统计、显著性检验
C. 支持度、置信度
D. 平均绝对误差、相对误差
答案: C:支持度、置信度;
12. (单选题)协同过滤算法解决的是数据挖掘中的哪类问题( )
A. 分类问题
B. 聚类问题
C. 推荐问题
D. 自然语言处理问题
答案: C:推荐问题;
13. (单选题)规则I->j,“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为( )
A. 关联规则
B. 可信度
C. 兴趣度
D. 支持度
答案: B:可信度;
14. (单选题)Apriori算法的计算复杂度不受影响?( )
A. 支持度阈值
B. 时间
C. 事务数
D. 项数(维度)
答案: B:时间;
15. (单选题)关于频繁模式,下面哪一个陈述是正确的?
A. K项集频繁则K-1项则必定不频繁
B. K项集频繁则K-1项则必定频繁
C. K项集不频繁则K-1项则必定频繁
D. 以上都不正确
答案: B:K项集频繁则K-1项则必定频繁;
二. 多选题(共2题)
16. (多选题)以下关于非频繁模式说法,正确的是( )。
A. 其支持度小于阈值
B. 都是不让人感兴趣的
C. 包含负模式和负相关模式
D. 对异常数据项敏感
答案: AD: 其支持度小于阈值; 对异常数据项敏感;
17. (多选题)利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的候选3-项集,在候选2-项集中需要剪枝的是( )
1 面包、牛奶 2 面包、尿布、啤酒、鸡蛋 3 牛奶、尿布、啤酒、可乐 4 面包、牛奶、尿布、啤酒 5 面包、牛奶、尿布、可乐
A. 啤酒、尿布
B. 啤酒、面包
C. 面包、尿布
D. 啤酒、牛奶
答案: BD:啤酒、面包 ; 啤酒、牛奶;
更多推荐
所有评论(0)