数据可视化分析:tableau原理与实践(第二章)读书笔记
第2章 数据可视化:理念与基础
2.1 从Excel到Tableau:不同的视角与层次思维
IT分析师关心如何用简洁的架构完整地描述业务,待数据的视角是静态的。业务人员更关心问题和答案,问题通常是一连串问题的组合,寻找答案更像“剥洋葱”。
2.2 数据分析的层次模型
数据分析的关键是层次,而理解层次的推荐方式是假想有一座“数据冰山”。每当要进行分析时,可以先把数据表中的所有字段想象为冰山底层的颗粒,明细数据是分析的“原料”,而把问题所在的层次比作“海平面”。
2.1.3 层次、聚合度和颗粒度
● 层次的对象是业务问题,数据无高低层次,而问题有高低层次。
● 问题的答案是数据聚合,聚合就是将明细汇总的过程;聚合度越高,对应的问题层次就越高。
● 详细级别(Level Of Detail)即问题对应的维度,简称层次(Level)。
● 聚合度和颗粒度描述问题“详细级别”的高低,二者正好相反。
2.2 数据基础概念:字段、图形与拖曳逻辑
2.2.1 字段的两种分类:维度和度量
维度描述“问题是什么”,度量描述“答案有多少”。
2.2.2 字段的两种特征:连续和离散
连续字段,指字段内的数据有先后顺序。主要有两类连续字段:日期和数字。离散字段,指各个数据之间相互独立,没有先后顺序也不相互依赖。
Tableau中使用颜色来表示不同的字段:绿色代表连续(想象一下红绿灯,绿色代表通行,通行即连续),蓝色代表离散。
连续字段和离散字段不仅影响视图的显示方式,也会影响颜色的使用。
2.2.3 从字段到图形:Tableau Desktop的设计逻辑(重点理解)
维度决定层次,度量默认聚合;
离散生成标题,连续生成坐标轴。
2.3 Tableau Desktop初级可视化:过程与方法
2.3.1 数据连接
数据连接面板中功能可以分为两类:数据连接类与数据整理类,其中数据整理包括并集、数据解释器和重命名、拆分、组等功能。
2.3.2 数据可视化:基本方法与基本图形
每个可视化图表包含两个部分:决定在哪个层次上生成图表的维度,和在这个层次上展示什么内容的度量。
1、生成可视化图表的快捷方式
● 双击左侧的字段,Tableau Desktop自动把字段加入视图区域对应的位置,加入多个字段后,可以点击“智能显示”调整图表的类型。
● 按下Ctrl键的同时单击鼠标可以选择多个字段,然后点击“智能显示”中的相应图表,一次性把字段加入视图。
牢记:
维度决定层次,度量默认聚合;行列搭建主干,标记调整图形,离散生成标题,连续生成坐标轴。
2、 快速创建可视化图表并修饰
借助于“标记”功能对可视化所做的修饰,以及多种字段处理技术统称为“可视化增强分析”。
几个实用的学习建议:
(1)如果你想生成图表,则先双击度量,再双击维度;而在复杂的分析场景中,通常先用数据交叉表(类似于Excel的数据透视表)验证逻辑,此时先双击维度再双击度量。
(2)“行”和“列”中的字段是可视化图表的主干,“标记”是枝叶果实,因此把最关键的字段放在“行/列”中,之后把其他字段加入“标记”,并调整标记类型。
(3)先思考,再行动,相信你的直觉。想用颜色、大小、文本等显示某个数据,就把它拖到对应的“标记”中。
可视化图表:
2.3.3 数据洞察:组合与互动
工作表、仪表板和故事构成了Tableau Desktop展示数据及其逻辑关系的主要形式,三者的区别可以概括为如下几点。
● 工作表(Workbook):展示单一问题的数据关系(从数据到信息)。
● 仪表板(Dashboard):展示多个工作表之间,即多个层次间的数据关系(信息中包含的数据逻辑)。
● 故事(Story):展示多个工作表或仪表板之间的先后或者并排关系,通往特定的数据见解(知识)。
2.3.4 分享数据见解
ableau已经发展成为端到端的大数据可视化分析平台。在Tableau Desktop中创建的可视化分析模型,以及在Tableau Prep Builder中创建的数据整理模型,都可以通过“服务器”菜单的发布功能,发布到企业的Tableau Server平台或者Tableau Online中。然后将数据分享给更多的“数据消费者”——各级领导、业务主管、职能部门,甚至一线的员工。
共有 0 条评论