数据分析师成长路径-第二阶段
数据分析师第二阶段
·
第 二 阶 段 建 模 分 析 师 |
第1部分 实用型大数据挖掘算法 | |
第一章 玩转大数据:深入浅出大数据挖掘技术(Apriori算法、Tanagra工具、决策树)priori 算法、 Tanagra 工具、决策树) | 1.1 数据挖掘概述与数据 | |
1.2 可视化与多维数据分析 | ||
1.3 分类器与决策树 | ||
1.4 其他分类器 | ||
1.5 分类器应用 | ||
1.6 关联分析 | ||
1.7 购物车数据分析 | ||
1.8 聚类算法 | ||
1.9 层次聚类实现 | ||
第2部分 SPSS Modeler数据挖掘项目实战 | ||
1.1 DM项目生命周期与建设过 | ||
1.2 CRISP-DM详解 | ||
1.3 DM项目实际建设与管理过程 | ||
1.4 DM项目团队组成与能力素养 | ||
第二章 感性认识SPSS Modeler | 2.1 SPSS MODELER软件介绍 | |
2.8 SPSS MODELER节点 | ||
2.9 MODELER数据流解读 | ||
第三章 必备的统计学基础 | 3.1 简单的统计学概念 | |
3.9 常用的统计分布 | ||
3.10 统计学其它补充 | ||
第四章 数据准备与预处理 | 4.1 数据质量与样本管理 | |
4.2 MODELER变量管理 | ||
4.7 数据质量与样本管理 | ||
4.8 数据变量管理 | ||
4.18 MODELER分析管理 | ||
第五章 常用模型的数学思想与思考 | 5.1 数据挖掘知识类型 | |
5.4 建模过程管理 | ||
5.5 (上)回归分析思想与建模解释 | ||
5.15 (下)回归分析建模解释(续) | ||
5.16 决策树思想与建模解释 | ||
5.21 回归与决策树增补 | ||
5.22 神经网络思想与建模解释 | ||
5.33 聚类思想与建模解释 | ||
5.34 关联分析思想与节点解释 | ||
第3部分 Python 新手开发 | ||
第一章 Python入门导入 | 1.1、Python背景以及特点 | |
1.2、语法要素及面向对象特性 | ||
1.3、Python开发环境搭建,常用Python IDE | ||
第二章 顺序程序设计 | 2.1、用计算机解决问题的方法 | |
2.2、程序设计方法 | ||
2.3、程序设计的一般过程 | ||
2.4、顺序程序设计问题 | ||
2.5、顺序程序设计基础知识1 | ||
2.6、代码块的缩进 | ||
2.7、顺序程序设计基础知识的应用 | ||
第三章 使用序列 | 3.1、问题1 数据排序问题(不使用列表) | |
3.2、问题2 数据排序问题(使用列表) | ||
3.3、问题3 查字典问题(使用字典) | ||
3.4、序列基础知识 | ||
3.5、列表 | ||
3.6、元组 | ||
3.7、字典 | ||
3.8、序列基础知识的应用 | ||
第四章 选择结构程序设计 | 4.1、选择结构基本问题 | |
4.2、选择结构基础知识及应用 | ||
4.3、选择结构 | ||
第五章 循环结构程序设计 | 5.1、循环结构程序设计问题 | |
5.2、循环结构概述 | ||
5.3、while语句解决不确定循环次数的问题 | ||
5.4、while语句解决确定循环次数的问题 | ||
5.5、while语句用于无限循环 | ||
5.6、while语句应用举例 | ||
5.7、for语句用于序列类型1 | ||
5.8、for语句用于计数循环 | ||
5.9、break语句 | ||
5.10、continue语句 | ||
第六章 字符串 | 6.1、字符串问题 | |
6.2、字符串基础知识 | ||
第七章 函数的设计和使用 | 7.1、问题的引入 | |
7.2、黑箱模型 | ||
7.3、函数基础知识 | ||
7.4、变量的作用域 | ||
7.5、参数的类型 | ||
7.6、函数基础知识的应用 | ||
第八章 文件的使用 | 8.1 与文件有关的问题 | |
8.2 文件基础知识 | ||
8.6 文件基础知识的应用 | ||
8.7 常用文件操作函数 | ||
8.8 文件的复制 | ||
8.9 文件的比较 | ||
第九章 面向对象程序设计 | 9.1、面向对象程序设计问题 | |
9.2、类和对象 | ||
9.3、实例属性和类属性 | ||
9.4、类的方法 | ||
9.5、运算符的重载 | ||
9.6、继承 | ||
第4部分 实战基于Python的网络爬虫技术 | ||
第一章 Python语言开发要点详解 | 1.1、模块的概念.主模块和非主模块的区别.pycharm中定义代码模版 | |
1.2、安装pip 多个虚拟python环境 | ||
1.3、语法.变量.内置类型.运算符 | ||
1.4、if.for.while.else | ||
1.5、数据结构.列表.元组.字典.集合 | ||
1.6、函数.类.异常 | ||
第二章 Python数据类型 | 2.1、列表和列表解析 | |
2.2、filter和map | ||
2.3、生成器表达式 | ||
2.4、元组 | ||
2.5、字符串 | ||
2.6、字符串之中文处理 | ||
2.7、字典 | ||
2.8、集合 | ||
第三章 函数和函数式编程 | 3.1、函数参数和变长参数列表 | |
3.2、函数返回值.变量作用域.和函数__doc__属性 | ||
3.3、函数的嵌套定义和闭包和装饰器介绍 | ||
3.4、装饰器例子(日志装饰器和身份认证装饰器) | ||
3.5、迭代器和生成器1 | ||
3.6、生成器例子 | ||
第四章 面向对象编程 | 4.1、认识经典类和新式类 | |
4.2、公有属性和私有属性属性 | ||
4.3、访问属性.属性装饰器.描述符 | ||
4.4、描述符 | ||
4.5、方法.实例方法.静态方法.类方法 | ||
4.6、特殊方法.运算符重载 | ||
4.7、继承.多重继承.super | ||
第五章 网页爬虫(单线程,保存到文本文件) | 5.1、爬虫介绍 | |
5.2、工具包介绍 | ||
5.3、request使用演示 | ||
5.4、xpath介绍 | ||
5.5、xpath使用演示 | ||
5.6、新闻爬虫 | ||
5.7、分页栏爬虫 | ||
5.8、豆瓣爬虫 | ||
第六章 mysql数据库回顾 | 6.1、概述.sql数据库和nosql数据库的区别 | |
6.2、环境准备.驱动包介绍 | ||
6.3、mysqlconnector的使用 | ||
6.4、mysqldb使用 | ||
6.5、sqlalchemy介绍.ORM的优点介绍 | ||
6.6、sqlalchemy开发流程 | ||
第七章 mongodb数据库回顾 | 7.1、mongodb介绍 | |
7.2、安装.命令行.mongovue演示 | ||
7.3、python中插入记录 | ||
7.4、python中查询记录 | ||
7.5、python中更新记录 | ||
7.6、python中删除记录 | ||
7.7、聚合操作 | ||
第八章 多线程和多进程 | 8.1、概述 | |
8.2、多线程编程 | ||
8.3、多进程编程 | ||
第九章 scrapy实战 | 9.1、scrapy介绍和安装 | |
9.2、scrapy项目框架 | ||
9.3、scrapy框架和案例需求分析 | ||
第十章 django实战 | 10.1、django架构介绍 | |
10.2、阶段1.安装.创建项目.创建应用.初始配置 | ||
10.3、阶段1.配置URL映射.视图函数 | ||
10.4、阶段2.定义ORM并注册到后台管理模块 | ||
10.5、阶段3.模版的继承.表单的使用.数据的展示 | ||
10.6、阶段4.多应用URL配置.数据的DML操作 | ||
10.7、部署知识介绍 | ||
第5部分 R语言数据挖掘和分析 | ||
第一章 R语法详解 | 1.1、数据结构概述 | |
1.2、向量 | ||
1.3、因子 | ||
1.4、矩阵 | ||
1.5、数据框 | ||
1.6、列表和函数 | ||
1.7、向量化计算和apply | ||
第二章 建立数据分析的统计思维和可视化探索 | 2.1、数据整理概述 | |
2.2、数据导入导出和缺失值处理 | ||
2.3、缺失值处理2(发现缺失值) | ||
2.4、缺失值处理3(处理缺失值) | ||
2.5、数据转换 | ||
2.7、数据规约和随机 | ||
第三章 建立数据分析的统计思维和可视化探索 | 3.1、数据分布 | |
3.2、集中趋势 | ||
3.3、离散趋势和相关 | ||
3.4、R中的描述统计 | ||
3.5、分组统计 | ||
3.6、单变量可视化 | ||
3.7、双变量可视化 | ||
3.8、分组统计可视化 | ||
第四章 用回归预测未来 | 4.1、线性回归的思想 | |
4.2、回归结果的检查 | ||
4.3、决定系数 预测 和多元线性回归 | ||
4.4、一元线性回归演示 | ||
4.6、残差分析演示 | ||
4.7、多元线性回归演示 | ||
第五章 聚类方法 | 5.1、概述和距离 | |
5.2、数据变换 | ||
5.3、层次聚类法 | ||
5.4、kmeans聚类 | ||
第六章 数据降维——主成分分析和因子分析 | 6.1、概述 | |
6.2、相关性会导致无法求解或者不稳定 | ||
6.3、逐步回归 | ||
6.4、主成分分析 | ||
6.5、因子分析 | ||
第七章 关联规则 | 7.1、关联规则介绍 | |
7.2、关联规则演示 | ||
第八章 决策树 | 8.1、决策树介绍 | |
8.2、几种分类算法介绍 | ||
8.3、评价模型准确性 | ||
8.4、C4.5 和混淆矩阵 ROC图 | ||
8.5、CART演示 | ||
第6部分 实战机器学习(基于Python) | ||
第一章 k最近邻算法 | 1.1、机器学习课程介绍 | |
1.2、K最近邻算法的思想 | ||
1.3、机器学习中常用的距离指标解析 | ||
1.4、实战k最近邻算法 | ||
第二章 朴素贝叶斯分类算法 | 2.1、概率论的基本知识(基本概念、加法公式、乘法公式) | |
2.2、通过例子深入掌握概率的基本公式 | ||
2.3、全概率公式和贝叶斯定理 | ||
2.4、实战贝叶斯分类算法,智能手环推荐 | ||
第三章 聚类算法 | 3.1、聚类算法概述 | |
3.2、Kmeans聚类 | ||
3.3、Kmeans实战,图片按照色彩聚类 | ||
第四章 决策树算法 | 4.1、决策树介绍 | |
4.2、决策树的构造过程和各种算法 | ||
4.3、决策树中关键指标详解 | ||
4.4、实战决策树 | ||
第五章 线性回归和梯度下降算法 | 5.1、线性回归的相关概念(相关、独立和协方差) | |
5.2、线性回归和最小二乘法 | ||
5.3、梯度下降算法 | ||
5.4、梯度的推导过程 | ||
5.5、岭回归、lasso回归和弹性网 | ||
第六章 逻辑回归和极大似然估计 | 6.1、广义线性回归和逻辑回归 | |
6.2、极大似然估计的思想 | ||
6.3、逻辑回归中的梯度推导 | ||
6.4、逻辑回归代码实战 | ||
第七章 支持向量机 | 7.1、支持向量机原理介绍 | |
7.2、线性可分的支持向量机 | ||
7.3、近似线性可分、非线性可分、核函数 | ||
7.4、坐标上升法、SMO算法、实战支持向量机 | ||
第八章 EM算法和GMM | 8.1、EM算法思想 | |
8.2、EM算法的推导 | ||
8.3、实战EM算法,GMM | ||
第九章 随机森林和Adaboost | 9.1、随机森林 | |
9.2、Adaboost思想精髓 | ||
9.3、Adaboost算法流程介绍 | ||
9.4、实战Adaboost算法 | ||
第十章 机器学习思想精华和实战经验分享 | 10.1、机器学习解决问题思想框架 | |
10.2、理解方差和偏差、损失函数和过拟合 | ||
10.3、L1、L2正则化和常见的5种损失函数 | ||
10.4、如何选择模型和选择参数,交叉验证和ROC曲线 | ||
10.5、自适应学习率和二分法精确搜索 | ||
10.6、自适应学习率和基于阿米霍准则的模糊搜索 | ||
第 7部分 机器学习 | ||
第一章 机器学习的任务和方法 | 1.1、机器学习的任务和方法 | |
第二章 Python语言基础 | 2.1、Python基础2-数据库访问 | |
2.2、Python基础2-文件访问 | ||
2.3、Python基础2-第三方库 | ||
2.4、Python基础2-网络编程 | ||
2.5、Python语言基础 | ||
第三章 分类算法介绍 | 3.1、分类算法 | |
第四章 k-临近算法 | 4.1、k-临近算法 | |
第五章 决策树 | 5.1、决策树 | |
第六章 基于概率论的分类方法:朴素贝叶斯 | 6.1、基于概率论的分类方法:朴素贝叶斯 | |
第七章 Logistic回归 | 7.1、Logistic回归 | |
第八章 支持向量机 | 8.1、支持向量机 | |
第九章 利用AdaBoost元算法提高分类性能 | 9.1、利用AdaBoost元算法提高分类性能 | |
第十章 利用回归预测数值型数据 | 10.1、利用回归预测数值型数据 | |
第十一章 树回归 | 11.1、树回归 | |
第十二章 无监督学习 | 12.1、无监督学习 | |
第十三章 利用K-均值聚类算法对未标注数据分组 | 13.1、利用K-均值聚类算法对未标注数据分组 | |
第十四章 使用Apriori算法进行关联分析 | 14.1、使用Apriori算法进行关联分析 | |
第十五章 使用FP-growth算法来高效发现频分项集 | 15.1、使用FP-growth算法来高效发现频分项集 | |
第十六章 利用PCA来简化数据 | 16.1、利用PCA来简化数据 | |
第十七章 利用SVD简化数据 | 17.1、利用SVD简化数据 | |
第十八章 大数据与MapReduce | 18.1、大数据与MapReduce |
更多推荐
所有评论(0)