透视的意义
大家如果用过透视表可能听过透视这个概念,但为什么要进行透视呢?
医生通过X光机对病人进行透视,可以无创口的根据需要看到身体不同部位内部的构造,进而推断出病人的病因,我们体检的时候所做的胸透就是这个原理。
这么一说大家应该对透视就有了些更为感性的认识了,如果把透视对象换成表格数据,那么对表格进行透视的意义就是在不破换数据源的前提下根据需求对数据内部结构进行不同维度的分析,以得到数据内部结构构成的信息,以供我们更好更深入的了解数据的所带给我们的信息和规律。
Excel中透视数据的方法
为了达到透视的效果,以Excel对数据操作方法的定义,透视表把透视工作拆分为透视与逆透视。
把眼光移到工作场景中,我们有一个表格,总共有4列,从左到右依次是 序号、部门、科目名称、金额,这个表格是记录每个部门的收入和成本情况的表格,科目名称记录有收入和成本两类数据,金额列是每个科目的具体数额。
假设总共有10部门,那么就会分别存在10个收入和10个成本金额,换言之我们整个表格去除表头和标题行之后会有20行。简言之这时表格的形状成纵向柱状。
这个时候我们的表格就是常说的一维表,每行数据代表着一个信息。一维表也是结构化程度最高的表格形式,符合数据库对数据存储的基本要求,最适合计算机读取和分析。
但是,一维表却并不适合人类的,想象一下,如果我们的科目不仅2个,而是20个,那我们的行数则会变成10*20=200行。
所以,为了变成适合人类视角观察数据带来的信息,我们就需要对数据进行“透视”,简单的说了透视就是将本来是纵向呈现数据行转为列,然后对相同科目进行求和的过程,这么说还是有些抽象,具体步骤如下:
1,对成本科目列进行去重复项,因为我们成本科目列其实就是在不断的重复“收入”和“成本”两个类型的数据,所以可以预见的到去重后我们将得到“收入”和“成本”2个文本字符。
2,删除成本科目列,并为“收入”和“成本”两个文本各自新建一列,再将这两个文本作为其列标题。
3,最后将原来保存在“成本科目”一列的收入和成本数据分别填入新增的收入和成本列。
4,可以借助透视表轻松完成本项工作,大家如果看过
我们来做个对比
从行数上看
透视前我们总共有20行数据,收入与成本各10行。
透视后,我们的数据行数是10行,但收入和成本不在同一列,而且分别存放于2列。
从列数上看
透视前 从左到右依次是 序号、部门、科目名称、金额,总共4列。
透视后 从左到右依次是 序号、部门、收入、成本、金额,总共5列。
从形态上看
透视前的表格形状是纵向柱状,也可称为窄表(瘦表),而透视后表格形状是趋于横向条形,也可称为宽表(胖表)。
从人的视角上看
透视前,我们需要看20行才能了解数据全貌,并且观察数据的时候总是在成本和收入之间切换,不符合人脑的阅读习惯,会容易疲劳,也更容易犯错,同时,也不能利用简单的求和得到所以数据的合计。
透视后,数据行数减少为一半,并且成本和收入各自为一列,这样我们可以在更短的时间内获取数据的全貌,也没有透视前的那些缺点。
最后,逆透视则可以想象为透视的反操作,把胖表变为瘦表的过程,大家可以自己想象一下具体操作的过程,这里不在赘述。只是需要提醒一句,逆透视的时候,我们是需要把多列转为一列,这时需要给新列取个合适的名称以达到可以收纳这些数据的要求的效果,例如成本和收入我们可以用科目名称来命名,这会受限于大家自己专业和归纳问题是否扎实而表现出不同的难易程度。
总结一下
透视的意义是为了深入了解数据在不同状态下的所带来的不同信息。
一维表(瘦表)适合作为数据保存的格式,也是格式化程度最高的格式,我们工作中尽可能形成这样保存数据的习惯。
二维表(胖表)适合人类的视角查看数据,可以通过Excel的透视表对一维表的指定列进行“透视”操作,其操作不会影响数据源的格式。
逆透视也是透视的反向操作,如果我们的数据源是二维表“胖表”的形态,则可以利用逆透视转化为一维表“瘦表”形态,以更符合数据储存的要求。
- 相关评论
- 我要评论
-