EXCEL数据分析的基本知识
本节重点内容:Excel 函数Excel 透视表Excel 可视化Power BI 仪表盘Excel 是数据分析师的好帮手, 可用来制作数据看板 / 连接数据库 / 统计分析- 简单的机器学习模型;可以说,在大数据时代,Excel 依然是数据分析师的重要工作之一。数据分析师为甚么要学习Excel?Excel 是被广泛使用的数据分析工具之一,比较便于跨部门间的沟通容易上手,不...
文章目录

本章节重点内容:
- Excel 函数
- Excel 透视表
- Excel 可视化
- Power BI 仪表盘
Excel 是数据分析师的好帮手, 可用来制作数据看板 / 连接数据库 / 统计分析- 简单的机器学习模型;可以说,在大数据时代,Excel 依然是数据分析师的重要工作之一。
数据分析师为甚么要学习Excel?
- Excel 是被广泛使用的数据分析工具之一,比较便于跨部门间的沟通
- 容易上手,不需要学习编程即可操作
- 功能强大,覆盖数据分析的全流程
Excel可以覆盖数据分析流程全部的六个环节:
- 数据获取
- 数据清理
- 数据转化
- 数据探索
- 统计分析与建模
- 分析呈现
数据探索:全面理解数据传达的信息,探索发现进一步深入分析切入点,常见手段有作图可视化,统计量计算等。
Excel 与R 比较:两者都可以覆盖数据分析流程全部六个环节,但通常 EXCEL用于部分步骤或者简单的工作,适合数据小而干净,分析方法不复杂等比较简单的分析,而编程语言R / Python 则是作为实际工作上的主要工具,适应于数据/分析流程更复杂,分析需求更多更深的分析;在处理数据量大小方面:Excel适合于处理1万行以下的数据,R用于处理< 4GB的数据,其他则需要使用大数据工具;
适用于Excel 完成的工作场景:
- 简单调取:Excel 函数(例如使用Excel快速查找某一特征值)
- 直观分布:可视化(例如使用饼图显示各部分比例情况)
- 动态呈现:数据透视表 —— 生成统计性总结和归纳的表格:
小试牛刀:
- test1:快速查找出市场为中国、销售渠道为在线聊天、产品类型为CRM&ERP组合这个业务单元所对应的销售目标状况;—— 多条件筛选
- test2:提取ID一列中的地理信息;—— LEFT
- test3:计算最大的销售额目标值;—— MAX
- test4:计算公司2019年1-6月份总销售目标(只考虑大于 ¥10,000的销售额目标预测单元(行))—— SUMIF(区域,">100000")
- test5:用STDEV函数计算表格中所对应的销售量数据标准差;
- test6:用IF和AND函数的组合判断表中所有地区的销售量是不是处在10000到20000之间,如果是返回TRUE,如果不是返回FALSE;
1.Excel 函数操作的基本知识:
- 简单函数示例 —— = 1+ 1;(选定一个单元格,在函数框输入函数(以等号开始),计算单元格的值 )
- 选取其他单元格作为函数变量
- 通过拖拉复制其他函数到其他单元格‘;
- " $ " 表示单元格的绝对位置(F4);
- " : "表示多个单元格作为函数变量输入;
2.数据处理类函数
数据分析流程的6个步骤:数据获取- 数据清理 -数据转换 - 数据探索 - 统计分析和建模 - 数据呈现,其中,数据清理 和 数据转换这两个阶段 常用的函数,在这里统称为 “数据处理类”函数。
常用数据处理类函数 —— 常用函数
函数名称 | 功能 |
---|---|
LEFT/RIGHT | 从文本左/右侧提取一个或多个字符 |
CONCATENATE | 将两个或多个字符串组成一个 |
LEN | 返回文本字符串的长度 |
TRIM | 从文本中删除了除“单词之间的单个空格”以外的所有空格 |
REPLACE | 将文本字符串的一部分替换为其他文本 |
如何查询所需的Excel函数:
方法一: Excel函数(按类别给出)
方法二: 通过搜索引擎寻找和学习你所需要的Excel 函数
3.数据分析类函数:
在数据探索与统计分析与建模这两个阶段也经常使用Excel函数,在这称之为“数据分析类函数”
SUBTOTAL 函数(筛选)/ IF / SUMIF
Excel函数:按字母顺序
VLOOKUP使用步骤:
- 制作查询表格
- 选取VLOOKUP函数
- 选取函数参数
- 将函数复制到查询表格中的所有对应位置上
注意点: 在大表格中,查询值应该在查询依据值右边,否则无法进行查询。
4.数据透视表:
什么是数据透视表(Pivot Table)?
对表格信息进行总结和归纳的一站式工具;数据透视表可以基于一个有更大信息量的表格,生成统计性总结和归纳的表格。所谓的“统计性总结”可以包括求和、平均值、或其他统计量。
场景和需求:
- 一站式呈现“**销售量目标”在各个区域及市场的分布情况
- 可以灵活查询各个具体销售渠道及产品类型的销售量目标
常用制作步骤: - 1.选择透视表
- 2.选择透视表字段
- 3.选择表格数据的计算类型
- 4.选择表格数据的“值显示方式”
- 5.对生成的表格进行“加工”方便理解
注意: 第四步、第五步依据业务需要进行操作;
5.Excel数据可视化
什么是数据可视化:借助图形手段,清晰有效地传达与沟通数据背后的信息。
为什么要进行可视化?
- 帮助更全面,多角度理解数据
- 向不了解数据的人解释分析结果
- 更容易发现数据的规律和趋势,从而开展进一步研究
Excel 、Power BI 和 R-ggplot2在可视化上的差别
利用Excel作图:
分别介绍六种常用的图形,比如柱形图、折线图、饼图、散点图和直方图。并且学习者五种图形各自不同的使用场景。
1)柱形图
小任务:
- 1.销售量目标在各个区域的分布
- 2.销售量目标在各个月的变化
效果图如下:
2)折线图
适应场景:适应于查找走势
推荐输入数据:带有行名称和列名称的“数值矩阵”(与柱形图相似)
小任务:
- 1.销售量目标在各个区域的分布
- 2.销售量目标在各个月的变化
3)饼图
适应场景:显示比例情况
推荐输入数据: 数据表中的两列,一列为“分类标签”,一列是数值。
小任务:销售量目标在各个市场的分布。
4)散点图
适应场景:显示比例情况
推荐输入数据: 数据表中的两个数值列
小任务:在不同市场销售额与销售量目标之间的关系
5)直方图
适应场景:衡量数据在数据集中出现的频率
推荐输入数据:一个数值列
小任务:销售额在不同市场的分布情况
部分图像特点对比
6)坐标轴转换
水平分类轴标签:这个部分对应的是横坐标的每一个值。例如:201901到201906这几个值。
图例项(系列):这个部分对应的是,在每一个横坐标的值上边,有几个需要看的类别,比如在每一个月份上,我们都要看北美、拉美、欧洲&中东,亚洲几个类别的值。
Y值对应的的是,每一个类别之上的数值大小。
变化前:
变换后:
6.Power Bi作图基础
数据报告 VS 数据仪表盘
报告:是包含文本、表格形式数据,和少量图形的静态文档 —— 特点:定期传递给不同利益的相关者;非实时,重点在文字叙述;
仪表盘:是可以对其个性化以显示特定的指标、数据和KPI的可视化工具;—— 特点:通常实时更新,利益相关者实时查看;重点在可视化呈现完整信息。
Power BI特点:
- 制作互动性图形 - 包含大量信息、趣味性强
- 上手容易 —— 相对于其他编程实现互动性作图方式
- 便于团队协作 —— 发布到云端与团队实时共享
- 自动化更新 —— 连接到实时数据后自动更新仪表盘
业务:需要呈现的数据 —— 500条不同业务 & 时间单元的绩效目标值
作品:
7.推荐学习资源
书籍推荐:
Excel / Power BI系列 下篇更新:① 制作仪表盘开发流程 ② index + match 函数
更多推荐
所有评论(0)