信息社会,数据量越来越大,怎样从大量的数据中筛选出想要的数据越来越总要,怎样把信息转化成知识,对一个业务发展至关重要。
随着大数据时代的来临,最近几年流行了数据产品经理这个职位,数据产品经理, 广义上讲就是推动业务建立一套数据采集、分析、使用的规则,基于数据的联通, 推动“一切数据标准化”,进一步促进业务发展。下面就来讲一下数据产品经理必备技能之一,也就是把业务数据标准化的基础—业务指标字典。
指标字典的目标
1)规范维度和量度命名,命名规则要尽量做到明确、通用、易懂;
2)对确认维度或量度,统一计算口径,避免歧义;
3)涵盖尽可能多的关注的核心维度和量度,以此为基础推动数据建设,确保指标字典里覆盖的维度都可区分,指标都可统计;
4)基于指标字典,将核心维度和量度注入元数据中心,接入指标提取工具,后续实现不需要写sql即可完成自助查询及分析需求,可见,指标字典的建立,是搭建数据平台的基础。
指标字典基本概念
1.指标
定义:衡量目标的方法。
构成要素:维度+汇总方式+量度
维度-回答从哪些角度去衡量的问题?
汇总方式-回答用哪些方法去衡量的问题?
量度-回答目标是什么的问题?
2.量度
定义:量度是对一物理量的测定,通常以数字单位累表示。比如:金额、份额、次数、率。
让我们做一个相关思考:
提问:数据是什么?
脑洞时刻
请看问题:你有没有“1”?
第一反应:“1”什么?“1”是指:你有没有1块钱?你有没有1次爱上过我?还是你有没有1张火车票?
回答:数据=数字+计量单位
3.维度
定义:维度是看待事物的视角与方向。
让我们做一个相关思考:
提问:怎么去衡量一个人?
脑洞时刻
请看问题:你认为哥哥我是个什么样的人?
脱口而出: 从性别的角度看,男人;从颜值的角度看,帅到地球爆炸的人;从高考成绩的角度看,考了800分的人;从高考中数学成绩的角度看,考了150分的人。
回答:从不同的角度去衡量一个人。不同的角度,衡量一个人的方法是不一样的。
指标定义的规范
指标的口径
一个指标一经录入,它的命名和所有下钻维度的口径都已确定(默认口径),这叫做指标的一义性。如“团购交易额”这个注册指标默认的时间口径是支付时间,默认城市口径是下单,等等。如果需要按下单时间口径看订单金额,我们定义了一个新的指标“团购下单交易额”。一个在某些维度上口径不确定的”指标“是不能被使用的,在业务场景中是毫无意义的。
指标的分类
基础指标
例如:“团购交易额”,作为一个基于单纯实体的属性的简单计算,它没有更上游的指标了,或者说它的父指标是它自身。我们称这样的指标为基础指标。
普通指标
所谓普通指标,即在单一父指标的基础上通过一些维度上面的取值限定可以定义的指标。
例如,团购PC首次购买用户数 [限制条件:团购订单.下单平台(二)=PC]
计算指标
可以在若干个注册指标之上通过四则运算、排序、累计或汇总定义出的指标我们称做计算指标。
指标字典建立的方法
量度维度都考虑好了,在构建一个指标字典时应该考虑哪些要素呢?如下表格为你提供一个参考:
再来看一个指标字典量度示例:
通过以上步骤和方法,相信你应该可以根据业务,建议一个指标字典了。
总结
指标字典建立以后,要经过各个业务线PM们的评审,纠正描述不明确或者有分歧的指标,达成一致后,由数据产品经理推广供大家参考使用。一个好的指标字典分析框架,就像剥洋葱一样,先从单维度、粗维度分析,再细拆维度,自外而内的看问题,透过现象发现事物本质。