昨天的文章中,我给大家分享了数据统计分析的3个基本套路:
1、 需求分析
2、 数据整理
3、 统计分析
今天的文章,我来给大家具体讲解一下第2步的数据整理,如何把阅读型表格变成方便统计的数据型表格。
这里有几个技巧,大家可以学习一下:
1、表格规范化
2、智能表格
方法1:表格规范化
要想用好数据表,需要掌握数据表的两个规范化:标题规范化和数据规范化。
1、标题规范化
标题规范化主要有以下几点要求:
标题中不能有合并单元格;
标题内容不能有重复;
标题内容不能是空白;
标题最好只有一行;
标题中尽量不要有换行。
下图所示的表格中,就有上述几点问题,我们需要对它的标题进行整理。
我们要把合并单元格取消,对部分标题内容重命名来取消重复,对空白标题命名,标题只保留一行,取消标题中的换行,整理后可以得到下表。
2、数据规范化
然后,我们还需要对表格中的数据进行规范化处理,数据规范化包括几下几点:
不同数据内容,要记录在不同单元格;
避免整行空白单元格;
不能有合并单元格;
数据当中不要包含单位。
(1)观察表中数据,我们可以发现,【姓名/年龄】这一列是两列数据包含在一起,不方便我们对数据进行处理,所以需要进行分列处理。
首先在右侧插入一列空白列,选中【姓名/年龄】这一列数据区域,然后点击选项卡中的【分列】按钮,勾选【分隔符号】,然后在分隔符号中输入“/”,点击完成即可。
分列后,我们才能更方便地对数据进行分析和计算。
(2)我们可以看到每隔几行,就会出现一个小计,这一行的数据对我们来说并没有太大意义,我们直接删除即可。
(3)表格中的部门这一列,有很多的合并单元格,我们需要对这些合并单元格进行处理。
首先取消合并单元格,可以看到只有合并单元格的第一行有数据。
然后,按住【Ctrl + G】打开定位对话框,点击定位条件,选择空值,并点击确定,选中所有空值。
输入“=”,然后点击向上箭头,同时按住Ctrl + Enter键,就可以填充所有空白单元格了。
(4)因为年龄字段中有“岁”,这些单元格格式就变成了文本,不能直接计算,我们需要把“岁”去掉。
选择【开始】选项卡中的【查找和替换】,点击【替换】,打开对话框,查找内容输入“岁”,替换为的内容为空格,不填,点击全部替换。
这样就可以把单位去掉。
我们上面讲述的数据标准化的方法,操作步骤比较繁琐,但是我们可以直接使用智能表格的方法。
点击【插入】选项卡中的【表格】按钮,勾选【表包含标题】,点击确定按钮。
这样就可以直接创建智能表格,我们可以看到智能表格已经帮我们直接生成了标题,我们还需要按照上文的方法再做一些处理即可。
总结: