📖第五章——数据仓库与数据挖掘教程——第二版

📑 1、数据仓库的用户

数据仓库的用户分为哪两类?以及其特点?

书P 96 - 5.1.1

数据仓库的用户分为两类:信息使用者 和 探索者

信息使用者

信息使用者是使用数据仓库的大量用户。信息使用者以一种可预测的、重复性的方式使用数据仓库平台。

探索者

探索者具有一个完全不可预测的、非重复性的数据使用模式。探索者查看海量的详细数据,概括数据则会妨碍探索者的数据分析。

探索者的任务:是为了寻找公司数据内隐含的价值,并且根据过去的时间努力预测未来决策的结果。探索者是典型的数据挖掘者。

📑 2、自动决策 和 决策支持系统

自动决策 书P104 - 5.2.5

数据仓库的第五种决策支持是由时间出发,利用动态数据库自动决策,达到“希望发生什么”。

决策支持系统 书P104-5.2.6

数据仓库整合了企业的各种信息来源,能确保一致与正确详细的数据。它是一个庞大的数据资源。要将数据转换成商业智能,就需要利用数据仓库来建立决策支持系统

基于数据仓库的决策支持系统是针对实际问题,利用分析工具或者编制程序采用一种或多种组合的决策支持能力,如随机查询,综合信息,预测分析等,对数据仓库中的数据进行多维分析,从而掌握企业的经营现状找出现状的原因,并且预测未来发展趋势,弥补经验和直觉的不足,协助企业制定决策增强竞争优势。

📚 简单概括一下:决策支持系统 = 商业智能概念 + OLAP工具 + DM 工具

📑 课后习题

🔖 数据仓库两类用户有什么本质的不同?

书 P 91

数据仓库的用户有两类:信息使用者与探索者。

信息使用者是使用数据仓库的大量用户,信息使用者以一种可以预测的、重复性的方式使用数据仓库平台。

探索者完全不同于信息使用者,他们有一个完全不可预测的、非重复性的数据使用模式。

🔖 为什么要增加数据冗余能提高查询速度?

增加一些数据冗余,相当于增加了某些相同的数据,这些数据往往是我们很需要的或者是经常被使用的,由于这些数据所占总量的比例增加,所以被访问的概率增加,从而减少了查询时间,提高了查询速度。

🔖 探索者所做的工作有哪些?

探索者查看治疗和历史记录,在多数情况下,探索者考虑数据不同类型和数据具体值之间的关系。探索者要做的工作概括分析,抽取、建模和分类。

🔖 简述数据仓库查询服务内容

①创建数据阵列

②表格连接

③聚集数据

④聚类数据

⑤压缩数据

⑥净化数据

⑦合并查询

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐