E家数据挖掘计划书_按照crisp-dm规划
E家数据挖掘计划书一、商业理解(11.24)1.确定数据挖掘目标建立e家客户响应规则集;2.数据挖掘成功标准用规则集来评价新增用户,或是其他非e家客户,耦合程度大的定义为潜在e家用户,对其实行针对性营销的成功概率希望为15%以上。3.工具技术数据挖掘工具SPSS_clementine4.制定项目计划二、数据理解(11.25-11.26)1.原始数据收集输
E家数据挖掘计划书
一、商业理解(11.24)
1.确定数据挖掘目标
建立e家客户响应规则集;
2.数据挖掘成功标准
用规则集来评价新增用户,或是其他非e家客户,耦合程度大的定义为潜在e家用户,对其实行针对性营销的成功概率希望为15%以上。
3.工具技术
数据挖掘工具SPSS_clementine
4.制定项目计划
二、数据理解(11.25-11.26)
1.原始数据收集
输出:获得要列入数据挖掘项目资源的数据,客户基本信息表,客户费用基本信息表,产品基本信息表的数据,以及必要的数据加载和导入方式;
2.数据描述
输出:描述数据格式和数据质量给出结果报告,包括表的记录总数,字段数,字段的标识;
3.数据探索
对字段的初步发现和理解以及对后续阶段的影响;
4.数据质量
数据的完整性,数据正确性,有无缺省值
三、数据准备(11.27-11.28)
3.1数据选择 与数据挖掘目标的相关性,被包含进来的字段和被排除的字段和理由;
3.2数据清洗 保证数据质量 :缺失值的插入,通过建模评估缺省值
3.3构造数据 关于衍生字段的属性确定问题(可选)
3.4整合数据 对象:客户基本信息表,客户费用基本信息表,产品基本信息表的的整合
输出:数据集,该数据集含有完整的需要挖掘的字段以及记录,数据类型确定,完整性好,可以直接提供给数据挖掘工具进行分析;
四、建模(12.1-12.5)
4.1选择建模技术:C5决策树;
4.2生成测试设计 :设置数据抽样,将其分为训练数据和检验数据,检验数据用于后期的模型评估;
4.3建立模型
输出:
参数设置,对应字段需要调整的参数和设置值,选择这些参数的基本原则;
模型:生成的实际模型;
模型描述:对模型中生成的规则集进行描述和总结;
模型评估:用检验数据来进行检验,评估模型的准确率;
五、评价
评价:模型适合商业目标的程度
注:改计划书以CRISP-DM数据挖掘标准流程为指导。
更多推荐
所有评论(0)