作为抽象出来的概念,那么我们就需要具象地去理解这两种类型的数据。这里我仅做简单的介绍,有机会我会给大家详尽地讲述维度和度量的以及相关的进阶知识。
首先我们要引入一个在大数据分析中极为重要的概念 “聚合”,它是我们理解维度和度量的桥梁。对于数据分析师来说,往往关心的并不是最底层的明细数据。数据分析师更注重分析数据的角度,关心的是数据的总体特征。那么数据源里的数据如何从一行一行的,颗粒度最低的明细数据,变成数据分析师需要的更高层次(Level)的数据呢?这就需要对数据进行聚合。
所谓聚合,简单讲就是数据源里的多行数据按照一定的标准计算成一个数据,不管数据源里有1行还是多行,我们视图里的数据都是聚合后的结果,一行数据也是要聚合的,当然一行数据聚合的结果是一样的。
理解了聚合的概念,我们就可以理解维度和度量了。实际上,维度为数据聚合提供依据,而度量是依据维度聚合得到的结果。
比如下图这个简单的数据集。
因此我们可以说维度是聚合的依据,度量值是聚合的结果。度量值必然依赖于维度,不存在脱离于维度计算的度量值。
维度是大数据分析的中最重要的概念,是一切分析的基础,也是Tableau中构造视图数据的依据。几乎所有Tableau中的重要概念,比如详细级别表达式(LOD)、表计算、分区等都跟维度有关,可以说对维度的理解程度,决定了使用Tableau的高度,理解了维度就掌握了打开Tableau大门的钥匙。