Tableau使用笔记
Tableau使用笔记tableau作为一个可以实现数据可视化的工具,还是很值得学习的。在学习过程中记录一下学习要点:记录数:传入tableau的数据,每一行就代表了一个数据TableauPublic下载链接:https://downloads.tableau.com/public/TableauPublicDesktop-64bit-2020-3-0.exeTableau操作步骤连接数据xls或
Tableau使用笔记
tableau作为一个可以实现数据可视化的工具,还是很值得学习的。在学习过程中记录一下学习要点:
记录数:传入tableau的数据,每一行就代表了一个数据
TableauPublic下载链接:https://downloads.tableau.com/public/TableauPublicDesktop-64bit-2020-3-0.exe
Tableau操作步骤
连接数据
-
xls或者xlsx格式的excel数据点击左侧的Microsoft Excel连接
-
csv格式的数据点击文本文件连接
-
csv格式的文件本身是一种叫做“逗号分隔符”的文本数据,用记事本也能打开
-
csv格式是只记录数据,不记录列宽函数等excel表格数据的,因此格式更加标准,存储的数据量也更大
-
如果不需要对数据进行excel操作,一般分析师都会选择使用csv的标准数据格式,以此避免各种版本和报错问题
-
-
选中我们下载的数据,点击打开即可
-
一般Tableau会默认加载表格中的第一栏数据,没有加载的话也不要慌,将需要加载的数据从左侧的“文件”拖拽到“将表拖到此处”即可
-
点击立即更新就可以查看数据了,修改右上方的行数,还可以修改查看数据的行数
-
在未加载数据前,同样可以查看数据。将鼠标悬停在“文件”下的表格上,点击右侧出现的表格按钮,就可以预览数据了。也是可以修改查看的数据行数的。
观察数据
-
有多少行?
-
行数往往代表数据的大小量级,分析时往往要对数据量级有一个基础的认知,避免对不完整的数据进行分析
-
Tableau通过修改查看数据的行数即可实现
-
-
字段的含义是什么?
-
既然要进行分析,肯定要先弄清楚每个字段的含义啦~
-
在Tableau中点击“排序字段”左侧的字段预览按钮,就可以更加直观地查看字段名称了
-
为了方便理解,我们可以对字段进行重命名,并隐藏不需要的字段
-
字段含义可以返回数据查看模式结合数据理解,但是业务场景中更多的是要与同事确认数据的含义和统计口径
-
敲黑板!统计口径
-
统计数据所采用的标准
-
客观上统一所有人对数据认知
-
口径的确认一定要严谨
-
无法决定时以分析能力最强的人为准
-
-
搞清楚字段含义后,我们可以隐藏一些不需要用到的字段。点击右上角的显示隐藏字段即可重新显示。
-
-
数据有哪些异常?
- 空值、异常值等,可以通过排序简单查看异常原因
TableauPublic的保存与重新加载
因为破解版Tableau有时候会出现各种不同的bug,目前我使用的是破解2019.4,也可以用免费的TableauPublic
- 转到工作表后,我们随便做一个图
- 点击保存后会提示登陆TableauPublic,毕竟是免费的服务,有的时候会非常慢,需要大家耐心等待。
- 没有注册的小伙伴课点击注册一个账号
- 注册之后就可以登陆了
- 点击保存,命名后的文件会被自动保存到云端
- 保存成功后,会自动跳转到云端的Tableau链接,这个链接可以复制下来放到简历里,用来展示你的Tableau作品
- 下次进入TableauPublic可以直接打开之前做过的工作簿
- 默认的打卡里面没有,也可以选择从TableauPublic中打开
制作工作表:制作一个动态仪表盘
-
制作工作表
-
创建工作表
-
点击下方第一个加号就可以新建工作表
-
也可以点击上方的x号清除之前的操作
-
-
动态地图
-
Tableau会自动关联地理信息数据到对应的经纬度,没有自动关联的话,需要我们手动选择下地理角色
-
双击以小地球代表的地理角色数据,Tableau会自动讲数据加载到地图上
-
右下角可以对数据的异常匹配做处理
-
拖拽字段到大小和颜色上,就能控制数据在地图上的可视化显示了
-
点击大小可以调整圆形大小
-
点击颜色可以编辑颜色
-
-
将日期等时间字段拖拽到页面,选择好播放单位,点击播放即可实现动图
-
在播放卡里我们可以调整播放速度并定位到具体某一帧的数据
-
做美国地图的时候,我们需要重新调整一下地理角色的匹配国家,并只筛选查看美国的数据
-
地图快捷键F平移、滚轮缩放、A选区
-
做完了别忘记命名图表哦~
-
-
动态折线图
-
拖拽日期到列选择单位为天,累计死亡等到行
-
发现最后一天的数据异常,需要添加日期筛选器去除掉最后一天。这个问题在其他工作表也会存在,所以要将筛选权限提高到所有使用此数据的工作表
-
同样讲日期字段拖拽到页面,选择好播放单位,点击播放即可实现动图(梅开二度)
-
勾选显示历史记录,就可以对轨迹进行调整。将标记类型选择为圆,还可以将轨迹调整为连续折线。
-
圆的轨迹是线,有具体的可视化含义
-
线的轨迹是线的叠加,没有具体的可视化含义
-
-
别忘了,我们最后是要做美国的死亡增长曲线,依旧需要筛选国家。当然你也可以在所有工作表做好后,将地图中的国家筛选应用到需要的工作表上。
-
-
动态数字提示
-
将需要提示的数字拖拽到工作区,然后添加播放器即可(三阳开泰)
-
同样别忘了筛选国家哦~
-
-
动态条形图
-
错误尝试
-
拖拽国家到行,累计死亡到列,添加播放器
-
会发现动态图实现了,但是只有条形长短在变,排名并没有变
-
-
正确操作
-
我们需要添加一个排名函数,创建计算字段,输入rank,选择Tableau自动提供的rank_unique函数
-
右侧我们可以看到函数的说明
-
第一个变量是函数排名所依据的数值,第二个变量是选择升序还是降序排名,默认降序
-
我们将累计死亡拖拽到函数中,发现Tableau会自动报错。由于这个排名是需要按照国家计算的,之前的数据结构中美国和加拿大是按县存储的数据,因此我们需要对累计死亡求和。添加一个sum函数就可以啦注意使用英文输入法输入函数哦
-
看到计算有效就可以了~
-
讲排名拖拽到行,设置为离散,编辑表计算,计算依据选择为特定维度-国家
-
最后,讲国家拖拽到详细信息即可
-
如果想要看柱状图,点击转置即可
-
想要看国家名字,可以把国家拖拽至标签
-
-
一些调整
-
其实在做给大家看的美国动态仪表盘时,我们并不需要知道所有国家的排行变化,只需要根据大家的心理预期关注中美即可。这个时候我们可以只留下中美之间的国家。暂时取消播放,只保留最后一天中美之间的国家即可。
-
在标签可以选择让国家名称水平展示,这里有的时候有bug,多点几次就可以了
-
勾选允许标签覆盖就可以禁止Tableau自动优化标签的遮挡显示了
-
最后别忘了将播放器添加回去哦~
-
-
-
制作仪表盘
-
点击第二个加号就可以创建仪表盘了
-
Tableau的仪表盘其实就是对工作表的拖拽组合
-
可以选择平铺和浮动两种组合方式
-
左侧可以调整仪表盘的大小,标准显示器格式:1366x768
-
拖拽工作表后,可以删除一些不需要的可视化图例
-
图表的布局可以选择标准或者填充
-
播放试试,我们的仪表盘的功能是不是就实现了~
-
-
调整亿点点细节
-
背景
-
地图
-
地图黑色才高级,右键地图工作表,设置格式-底图层,选择为深色
-
隐藏标题
-
设置格式-网格线-取消行列的分隔符
-
-
柱状图/条形图
-
设置格式-填充-更多颜色-取地图的底色
-
设置格式-线-行-网格线-无
-
设置格式-线-轴标尺/轴刻度-无
-
-
折线图
-
设置格式-填充-无
-
设置格式-线-行-网格线-无
-
设置格式-线-零值线/轴标尺/轴刻度-无
-
右键数轴-显示标题-无
-
-
数字提示
- 设置格式-填充-无
-
播放器
- 可以放在仪表盘的外部
-
-
颜色
-
到各个工作表编辑颜色即可
-
顺便可以去除条形图的图形边界
-
我一般会调一下透明度
-
-
字体和大小
-
设置格式-设置字体格式即可调整
-
一般我会选择用微软雅黑字体,这样数字会更加明显
-
数轴的字体的颜色也要记得修改
-
-
布局
-
根据美观调整工作表位置和大小
-
最后修改一些细节
-
比如我们这里发现美国2月28号才开始出现死亡病例,结合展示的主题,我们可以从2月28日这个原点开始展示数据,这样更加直观
-
美国地图后面的各州名称有些不够简洁,我们可以去除各州的名称和边界
-
-
-
点击播放,让你的仪表盘动起来吧!!!Ohhhhhhhhhhhh
-
数据来源:https://data.world/covid-19-data-resource-hub/covid-19-case-counts/workspace/file?filename=COVID-19+Activity.csv
-
条形图 直方图
- 维度基本上都是字符串,度量一般都是数据的具体值。
- 条形图搭建很简单:拖拽对应的数据段到行和列即可,点击交换行列和升降序排序
- 要实现图上显示数据,把对应数据拖到标签上即可
- 如果求平均值,对应字段右键–度量–平均值即可实现
- 堆积图实现:把想要堆积的字段,拖拽到颜色上;堆积图可以实现看到一个数据的里面具体的构成情况
- 直方图:用于呈现数据的分布情况的:正态分布…
- 做直方图之间需要创建数据桶:想要编辑的字段–右键–创建–数据桶(大小就是每个区间的值),对应的数据桶只能放在列上,然后对下面的列值进行重命名,命名成区间段。
- 如果有数据横着或者显示不全的,换成整个视图就可以了。
##数据前处理 折线图 饼图
- 如果要对数据进行拆分的话(前提是数据满足一定格式的),右键–拆分 就会拆成几个部分的数据。
- 对不想使用的数据 可以右键–删除 或者 右键–隐藏
- 连接最好都是采用数据提取的方式,碰到英文的字段不了解的,需要查找相关资料
- 对需要进行字段类型转换的,可以进行强制转换
- 如果对某个点需要注释:右键–添加注释
- 折线图:一般都是时间作为列(注意时间字段是日期还是字符串!只有日期才能作为折线图) 另一组数据作为行
- 如果出现的结果是表格,考虑是不是数据没有放在度量里面
- 双轴:把两个表合在一个表里面进行分析 右键–双轴
- 制作饼图:1.智能显示 2.标记时选定饼图
- 饼图显示百分比:记录数–右键–快速表计算–总额百分比
- 环形图:tableau不具备,但是可以通过制作两个饼图同心,中间的小饼图设置为白色
- 环形图:设置为饼图(不要用智能设置,会有坑,否则内环与外环无法分开),把数据都拖到行,全部 右键–度量–最小值,然后 右键–双轴
基本表 树形图 气泡图 词云
- 基本表就是一种表格型的可视化表示方式:做表格:把数据拖拉到文本中
- 凸显表就是对于数据进行凸显,智能设置可以直接切换
- 二值凸显表:颜色–编辑颜色–渐变颜色2阶–中心设置
- 树形图:先做成柱状图,然后智能设置换成树形图
- 可以将多出来的数据用颜色进行区分,换成度量之后,拖到颜色中
- 将对应的数据字拖到文本中,对应编辑文本
- 气泡图:先做成柱状图,然后智能设置换成气泡图
- 动态气泡图:需要引进时间,时间换成日期数据类型,然后拖到页面,制作动图时,需要根据情况选择右边的操作栏中,是否出现轨迹,颜色设置;注意横纵轴。
- 词云制作:先做一个气泡图,然后把形状从圆换成文本就可以了
标靶图 甘特图 瀑布图
- 标靶图就是在基本条形图的基础之上,增加一些参考线和参考区间,用于比较计划值和实际值
- 制作标靶图 一般都是横向 右键–添加参考线–线、分布
- 实现对比的话,需要把其中对比的一个字段添加到详细信息里
- 参考线和参考分布同理,参考区间不常用
- 甘特图:以图示的方式通过活动列表和时间表示出特定项目的顺序和持续时间,用于项目管理
- 甘特图:日期放在列,日期用下面的天(点完之后是绿色的日期),行是对应的数据列,如果需要自己计算的字段:维度–右键–创建计算字段–拖拽即可
- 瀑布图:选择甘特条形图,类别放在列,利润–快速表计算–汇总,创建新字段:利润的相反数,拖到大小里,之后再加标签什么的
- 瀑布图可以显示总共产品的累计变化的情况。
数据集合并 符号地图 智能显示 插入自定义形状 仪表盘
-
数据集合并:join
-
常用地理角色:城市、国家地区、省市自治区
-
符号地图:在地图基础上,每个地区有一个小形状进行表示
-
创建地图:直接双击字段 或者拖拽到中间
-
智能显示:根据提示选择不同的符合要求的字段
-
插入自定义形状:最好使用.png的格式的图片
-
安装tableau的目录–defaults–shapes–新建文件夹–给定英文名称–放入图片–关闭tableau重开才能显示
填充地图 多维地图 混合地图
- 省市自治区和地区是不同的
- 填充地图:对应字段拖到颜色里,每个区域就会被填充成不同颜色的字段
- 地图格式设置:地图–地图层–样式–冲蚀(实际上就是透明度)–国家地区名称
- 多维地图:在填充地图的基础上,把其他字段加到行或者列上就可以显示多维地图的效果
- 混合地图:把地图和其他的图进行结合
- 按住ctrl + 移动纬度 就可以让一个地图变成两个
多边形地图 背景图地图
- 多边形地图是作为对填充地图的一种补充,对地图区域实现自定义的填充地图
- 多边形地图必须具有的四个字段:纬度,经度,区域名称,点的顺序号
- 多边形地图:双击纬度,经度,分析–取消聚合度量–点的顺序号拖到路径–区域名称拖到颜色
- 自定义地理编码:只能用于制作符号地图,不能用于填充地图
- 自定义地理编码只能是csv文件,里面包括了新的地理角色和纬度,经度
- 自定义地理编码:在现有的城市不够,进行扩充时使用。使用格式是csv,并且里面的格式需要对应上(字母啥的都要注意大小写)。可以直接使用模板套用修改地理信息,另外经纬度不能重复。
- 添加过程:地图–地理编码–导入自定义地理编码
- 导入地图背景图:地图–背景地图–管理地图
- 导入背景图像:地图–背景图像,然后导入与图像相匹配的数据
数据分层 数据组 数据集
- 点击行、列数据左侧的加减号就可以实现数据分层
- 建立层级:维度–右键–分层结构–添加分层结构
- 层级结构可以实现上卷和下钻
- 层级结构是不可以实现嵌套的
- 多个数据可以通过分组实现合并:维度–右键–分组 或者 点击条形图对应的图像–右键–组
- 数据集:满足一定条件的数据子集,是维度的部分成员。集是根据度量对维度进行分类(度量(值),维度(具体的字段))。
- 合并集一定要是同一个维度量
计算字段基础 粒度聚合与比率 详细级别表达式 表计算(快速、自定义)
-
计算字段:根据数据源字段(维度,度量,参数等等),使用函数或者运算符来定义的字段。
-
计算字段类型有三种:基本计算类型字段,详细信息级别的表达式,表计算
-
左侧空白处–右键–创建计算字段–直接拖拉度量名进去计算即可
-
可通过各种表达式或者表达式运算符来创建计算字段:if else then end…
-
粒度:利用散点图,表示的是,数据的颗粒浓度
-
散点图需要:分析–取消聚合度量
-
聚合度量:可以理解为group by,如果没有选择的话,任何一条数据都会以单个点的形式进行显示,如果选择了之后的话,如果多个点十分接近,就会以一个点的方式进行显示。
-
聚合:维度聚合和维度聚合
-
度量聚合,就是拖到行列上,右键–度量,出现的各种统计方式
-
计算比率时,有些需要注意顺序,否则会出现异常值,比如计算利润率:sum(利润)/ sum(销售额)
-
详细级别表达式:相当于一个复杂点的字段(10-12)
-
include关键字相当于sql中group by分组的作用,在其他维度基础之上,使用指定维度计算
-
fixed使用指定的维度计算值,不参考视图中其他任何维度
-
exclude忽略指定的维度
-
快速表计算:在已有的度量值的基础之上–右键–创建计算字段
(汇总)前后累加
(差异)前后相减
(百分比差异)当前与第一个相减 / 第一个值
(合计百分比)最常见的计算百分比的计算方式
(排序)默认从大到小
…
-
自定义表计算:不太会…
人口金字塔 漏斗图 箱线图
- 人口金字塔本质上是成对条形图,也是一种特殊的旋风图
- 人口金字塔用于在同一行上对称的显示和比较统计指标
- 人口金字塔:首先创建一个数据桶,然后创建两个不同的字段:分别记录男女性的人数,颜色拖到全部中。
- 漏斗图:用于业务流程的比较,流程分析的表现形式,用于一层层的过滤分析
- 漏斗图制作:
- 先创建一个条形图 降序排好
- 按住ctrl往旁边拖 让列变成两个
- 让第二张图变成线图
- 右键–双轴
- 第一张图改为条形图,最下方–右键–同步轴
- 创建另外一半的漏斗图
- 然后一半倒序,设置格式–选择边界–行、列分隔符都设置为无即可
- 箱线图:常用与现实数据位置,分散程度,异常值,又叫盒须图
- 箱线图:可以通过智能设置里直接选择盒须图
- 中位数:数据按降序排列,位于中间的数,叫中位数,是数据值,不是排列的序号
- 四分位数:数据降序排列,25%的数据值是第一四分位数,75%的数据值是第三四分位数
- IQR:四分位全距,也就是第三四分位数与第一四分位数的差值
- 上限:第三四分位数加上1.5*IQR
- 下限:1.5*IQR减去第一四分位数
- 异常值:不在上下限范围内的数据
范围-线图 倾斜图
-
范围线图:将整体数据的部分统计值(均值,最值等)展示在图形中,比折线图更能反映出信息。
-
创建范围线图:实现多个值在一张图中进行比较
-
制作范围线图
- 创建一个折线图
- 创建计算字段,表示出最大值,最小值,平均值(fixed 日期 :avg、max、min字段)
- 把计算字段拖到详细信息中
- 选择对应的轴–右键–添加参考线
- 线–对应平均值,区间–对应最值
-
倾斜图:用于展示单个指标在不同时期内的变化(大小,排名,升降。。。)
-
制作倾斜图,需要自定义多个计算字段和使用函数公式(lookup index last first…)
(还是要自己摸索,不太会做倾斜图。。。。)
last - first 后一个的值-前一个的值
-
倾斜图中注意的点:
-
变化量使用lookup进行计算
LOOKUP(SUM([累计值]),LAST())-LOOKUP(SUM([累计值]),FIRST())
-
排名的顺序,需要重新计算
-
标签使用时需要重新排版,线首和线尾都要显示
-
使用绝对值,显示变化量大小,用颜色显示增加,减少或者持平
-
网络图 弧线图
- 网络图:把点与点之间的关系用线段进行连接,组成一个网络,用于查询点与点之间的关系与联系
- 按照经纬度 或者 行列排列数据 第一个选择线,点和点之间的关系对应的字段,放到路径中,按住ctrl+行,生成另一个图,选择形状,把信息拖到标签中,如果没有全部显示,就点击标签–允许标签覆盖其他标记–双轴,另外记得 还要取消聚合度量
- 每个网络图,都是有点和线,都是用双轴图合成实现的,有两种表达形式:1.A B两个点(把线路直接拖到路径里) 2. <->标记一条线的(线路直接拖到标记中就行了)
- 弧线图:用弧度表示不同数据的量的大小
- 制作弧线图需要自己重新制作一个excel表:包括:角度(弧线的角度,反应弧线的长短),名称(每个弧线表示的含义),分类(弧线的类别,环数,数字表示),具体比较的字段的标签
- 角度实现:用总和百分比,保留整数,最后是几,表里的角度就是几,从0开始,比如4,就是0-3
- 创建计算字段:x y坐标,按公式计算(太难了,放弃。。。)
雷达图 凹凸图
- 雷达图:实现多个维度的比较分析使用
- 凹凸图:在不同排名中,连接相同的事务,从而显示排名间的变化关系
回归分析和时间序列分析
-
回归分析:将可能之间存在关系的变量拟合成曲线或者直线的,总结数据的规律与特征并进行预测
-
回归分析:首先创建散点图(取消聚合度量),图中右键–趋势线
-
回归存在五个:线性,对数,指数,幂回归,多项式
-
时间序列:tableau自动拟合,预测模型,分析数据变化规律
-
时间序列分析:制作折线图,右键–预测–显示预测,预测选项可以调整参数,描述预测可以查看预测信息。
更多推荐
所有评论(0)