快好知 kuaihz

5个要点,让你拥有数据分析思维

本文分析了如何拥有数据分析思维的5个要点:说事实,而不是观点、用客观标准代替主观判断、不预设立场、演绎而不是归纳、找出背后的逻辑。

引言

数据分析师究竟要掌握哪些技能?

大部分的数据分析教学都会教你excel,Python,sql,机器学习,还有一些分析方法比如对比分析、漏斗分析、留存分析等等技能。

但是,很多人掌握了这么多工具和技能,依然做不好数据分析。面对具体的业务问题,我们还是容易两眼一抹黑。

就像我们大部分人学习英语,都会学习单词、语法、音标等等,但是一开口就跪了。而英语母语的人就算不懂语法是什么,却能如同抬手睁眼一样自然地用英语表达。

这其中的区别,便是因为英语母语的人拥有“英语思维”。

想要做好数据分析也一样,单单会工具和技能是不够的,还必须拥有数据分析思维。数据思维决定了你如何思考问题,如何搭配这些分析方法,如何得出结论,如何确定问题。

那么究竟什么是分析思维呢?我认为有以下几个方面。

1. 说事实,而不是观点

数据分析师第一个要训练的思维方式便是:只说事实,不说观点。

事实和观点这两个名词看起来区别很大。但实际上在生活中我们经常会将两者混淆。

比如说你的同事告诉你:最近的转化率大幅下降。

这句话到底是事实还是观点呢?

很显然这句话是观点。究竟下降多少算大幅下降?也许你认为的大幅下降在我看来变化并不大。

那么如果他说:转化率下降了。这句话是事实还是观点呢?

这句话看起来已经非常像事实了,但是实际上它依然属于观点。

有这样一种情况,转化率在短期内它看起来是下降的,但是你站在宏观的层面上,以月为单位甚至以年为单位,它是它是上涨的,那么你究竟说他是上涨还是下跌呢?

那么什么是事实?

周一到周三的转化率持续下降,周三相比周一已经下跌了5%。这句话就是事实,这句话不同的人都能理解,不会出现歧义。

只有分清楚观点和事实才有继续分析的可能性。

因为观点的沟通会出现误差,而事实则不会。如果我们用观点进行沟通,自然会出现大量的误解。

如果连背景都没有理解清楚,后续的分析也就无从谈起。

2. 用客观标准代替主观判断

但是单纯只有数据,对业务问题的分析没有什么帮助。毕竟我们得知道这个数据到底带来了哪些业务信息。所以最后事实还是要归纳成“观点”。

不过如果我们用主观判断数据的好坏,那么还是回到了原来的老路上去。

那么周三相比周一转化率下跌了5%,这个数据到底表现如何呢?

想要解读出观点,我们需要先找到一个标准。

标准怎么找?

可以是老板定的标准,看数据是否符合老板心中的标准。虽然这也是拍脑袋,不过老板毕竟是老板,他们心中有些战略构想是建立在某些条件满足的基础上的。所以没什么说的,如果老板不满意,那这数据肯定是有问题的。

可以看行业和竞品的平均标准,看数据下降是否是行业的普遍现象。

看企业过去的平均水平,可以在历史数据中找到类似场景下的数据情况,和自己的过去对比。

然后我们通过数据和这些标准进行对比,得出一个观点。比如我们可以分析每周的情况,看历史上是否存在这一的趋势,平均下跌是多少?如果历史上每周三都会下跌,平均下跌7%,那么我们就可以认为目前数据比较正常,没有问题。

这样得出的结论全都是客观的,如果你不找标准,而用主观判断数据的好坏,那么不同部门的人会沟(shuai)通(guo)很久。

3. 不预设立场

人们总是习惯于通过自己的现存经验和知识去判断未知事物。

这本身是进化带来的优势,它能让人在信息不完备的情况下迅速做出决断并付诸实施。

这种预设立场的思维在原始人的时代很有价值,其优势在于:

第一,不浪费宝贵的能量,大脑是能量消耗大户;

第二,快速决断,避免因为低效决断而错失机会,这一点在避免伤害时尤为重要。

数据分析的场景下,我们需要尽可能地找出真实原因。此时这种预设立场的决断方式会造成许多错误,因为现有经验和知识在应对未知事物时是不足的,是有偏差的。

而且不同岗位的人还会存在“屁股决定脑袋”的现象。

如果出现了业务问题,关联的业务方往往预设一个立场:这事没有看起来那么糟,或者这事和我没关系。

比如转化率下降了,业务方的反应往往是这个数据下降肯定跟自己无关。

自己的运营活动明明做的很成功,转化率下降一定是行业因素、用户质量等等其他因素导致的。于是为了证明这个观点,他们顺着这个预设的前提,找到一些相关的证据来解释转化率下降的现实。

实际上,想要证明一个观点,只要你肯去找,不管观点多么荒谬,总能找到支持你的理由。

不仅辛普森悖论这种统计学的把戏可以得出完全相反的结论,即使最简单的“真话不全说”的方法,也能达到这种目的。

比如,我说两个比较荒诞的列子:

1. 把正例说成反例

我想要证明一种物质是有害的,我列举出以下论点:

它是酸雨的主要成分;

对泥土流失有促进作用;

过多的摄取可能导致各种不适;

皮肤与其固体形式长时间的接触会导致严重的组织损伤;

吸入该物质容易引发窒息;

处在气体状态时,它能引起严重灼伤;

在不可救治的癌症病人肿瘤中已经发现该物质;

怎么样,你会不会觉得这是一种非常危险的物质,实际上上面描述的是“水”。

2. 想要把反例说成正例也没问题

比如中国男足,想要把男足描述成世界强队行不行?

当然行。

哥斯达黎加是世界杯史上为数不多能够战胜中国队的国家

即使是巴西队这样的世界强队也仅战胜过中国队一次

自2002年韩日世界杯后,中国队在世界杯正赛上不败纪录已经延续12年

纵观漫长的世界杯史,中国队也仅输过三次

中国队从未在世界杯点球大战中失利过

中国队在领先的情况下从未丢过球

你看,只要你想证明一件事,总能找出一些证据。

所以,预设立场再去找证据是一件相当不靠谱的事。

数据分析部门一般独立于业务部门之外,这样可以确保数据分析师没有业绩压力,分析具有独立性。

因为数据分析的独立性,所以最终问题究竟是在产品上、运营上或者市场上,数据分析师不会有明显的偏向,只认客观数据

同样是转化率下降了,数据分析师的职责就是找出下降的真实原因。他们要梳理出和转化相关联的各个环节,获取数据,根据数据推演出合理的结论。

有些资深的数据分析师有一定的业务敏感度,他们会提出一些可能性很大的假设。比如他们猜测可能是运营出现了问题,那么就需要找到一些数据来验证这个假设。

但是假设验证和预设立场不同。

预设立场,是要找到证据来证明猜想,一个数据不行,那就换另一个数据。直到能证明这个观点为止。

而验证假设,则是事先规划验证这个假设需要的数据。如果数据最终不符合假设,那么就抛弃这个假设。

好的数据分析师,能够根据客观数据,随时抛弃旧的假设,并建立新的假设。

抛弃固有的思维定式,这是非常反人性的,这也是为什么说数据分析需要专业训练的原因。

4. 演绎而不是归纳

逻辑思维方法分为归纳法和演绎法。

归纳法是从特殊到一般的推理,是从结果找原因的方法。

也就是说,通过观察很多个别事物的特殊性,然后概括出同类事物的特征。

但是我们一般不可能观察到这个事物的所有样本。所以归纳法得出的结论是不确定正确性的。

你有没有听过这个故事:

在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是狂风暴雨,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。

于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”

时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….

这个是英国哲学家伯特兰·罗素提出的一个问题,被称为「罗素的火鸡」,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。

大部分人思考问题,会优先使用归纳法。因为这是人类认识世界的方法,这是人性决定的。

比如一月到三月的成交金额连续上升,初级分析师往往会说:成交金额呈现上升的趋势。

这句话的潜台词是,预计交易金额在四月份也会上升。

这是典型的归纳法思维:因为过去是这样的,所以未来应该也会继续这样。这和那只火鸡的思维其实也没有什么本质的差别。而且这和没分析一样,你把数据丢给业务方,他们也能看出目前呈现上涨的趋势。

如果想要做好数据分析,就不能滥用归纳法,这点依然很反人性。

那我们用演绎法,如何思考这个问题的呢?

演绎法是从一般到特殊的推理,是从原因找结果的方法。

要想预测四月份的成交金额会如何,首先需要分析前三个月的成交金额为什么会上涨?当时的背景是什么?上涨需要哪些条件?四月份的这些条件是否依然存在?如果维持成交金额上涨的条件不变,我们才能说四月份会继续延续这种上涨的势头。

经过演绎法推理的结论才是合理的,而且我们通过深挖找出了内部的原因,这才是业务人员想要知道的。

数据分析的价值就体现在这。

5. 找出背后的逻辑

数据分析师是需要大量的逻辑思维训练,但我们自己做好还不够,我们的工作必需和业务方沟通,帮助他们解决实际的业务问题。

但是很多业务人员没有考虑清楚就跑来沟通,他们的需求可能充满了逻辑问题,这时我们就需要帮对方理清思路,找出对方表述背后的逻辑。

数据分析师往往会听到业务方这样问:本周的转化率相比上周已经下降了5%,怎么办?

这句话听起来感觉没什么问题,实际上逻辑并不是特别严密。

首先,这句话的前半部分很好地表达了事实,值得表扬。如果前半句是一个观点,我们还要先找到事实。

但是这句话的后半句有问题,后半句的“怎么办”,放在这个语境中,潜台词其实是这样的:

本周转化率相比上周下降了5%

这是个不好的情况

需要解决这个问题

怎么办?

相比最开始的表述,我们分析出这句话中间出现了两个衍生的问题。

问题1:转化率下降5%真的是不好的情况吗?

这就涉及到了标准了,之前提到了我们要找到一个客观标准,通过标准解决出数据的业务含义。

因此我们首先要协助业务方找到一个标准。

问题2:如果数据表现真的不好,那么这是现在急需解决的问题吗?

这个问题的答案也是不一定。

商业世界要解决的问题太多,在同一时刻,永远存在着各种各样的问题。

而企业的资源是有限的,不可能同时解决所有的问题。问题的解决必然有轻重缓急之分。

那么凭什么要先解决转化率的问题,而不是解决引流的问题、留存的问题、活跃度的问题?

数据分析师必须了解企业当前的战略方向,把有限的资源投入到更重要的方向上。

如果上面这两个隐藏的问题不想清楚,就开始分析怎么办,那么这类分析师的工作往往会费力不讨好,做很多低绩效的工作。

技艺理性需要长时间的练习

说到这儿你有没有觉得,分析师的工作和法律工作者非常的像。

法官只看事实,一切都讲证据。

法官需要标准,标准就是法律文本。即使被告的行为看起来多么地不符合社会道德,只要法律没有规定不允许,那么法官就不能认为有罪。

法官不预设立场,法律的原则是无罪推断,任何人在未经证实和判决有罪之前,都视其无罪。

法官要用演绎法推断。法官的判决讲究证据链完整。证据链中的链字,就有一环扣一环的含义在其中。很明显就是需要用演绎法来进行分析。

最后律师要理清当事人的逻辑,大部分人是说不清一件事的,当事人在律师的引导下把事情逐渐还原。

法律史上有一个非常著名的故事,可以为我们带来一些启发。

在1608年,英国国王詹姆斯召见了法官,提出一项要求:既然法官只是国王的代理人,国王自然有权直接裁决诉讼案。

但大法官柯克反对说:国王本人不能裁决任何案件。

詹姆斯一世说:“法律以理性为基础,除了法官之外,我和其他人一样具有理性,为什么就不可以裁决诉讼案?”

柯克大法官很聪明,先夸了国王一番:“确实,上帝赋予了陛下卓越的技巧和高超的天赋;”

接着,他又说:

“但陛下对于英格兰本土的法律并没有研究,而涉及陛下之臣民的生命或遗产、或货物、或财富的案件,不应当由自然的理性,而应当依据技艺理性和法律的判断来决定,而法律是一门需要长时间地学习和历练的技艺,只有在此之后,一个人才能对它有所把握。”

这个故事中非常重要的观点就是“自然理性”不等同于“技艺理性”,而技艺理性是需要长时间的专业练习的。数据分析也一样。

总结

很多人想要数据分析速成。他们认为“自然理性”加上“分析工具和方法”就能做好数据分析。分析工具、分析方法等技能确实可以速成,但是数据分析的能力不是自然理性能够驾驭的。想要做一个好的数据分析师,必须拥有数据分析的思维,这是一种“技艺理性”,有一点反人性,必须花大量的时间训练才能掌握。

如果你学会了很多数据分析的工具和技巧,依然做不好数据分析。建议尝试练习本文提到的思维。要点很简单,坚持,坚持,坚持。

#专栏作家#

三元方差,公众号:三元方差(sanyuanfangcha),人人都是产品经理专栏作家。专注用数据驱动业务增长,擅长数据分析、用户增长。喜欢阅读、思考和创作。

本文原创发布于人人都是产品经理。

题图来自Unsplash,基于CC0协议

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:数据分析  数据分析词条  要点  要点词条  思维  思维词条  拥有  拥有词条  
金融

 请记住,交易的核心就三件事!

因此,虽然这些东西我以前都写过很多,但是再一次总结归纳一下,给需要的人缕缕逻辑…交易的核心就三件事:1、什么时候入场入场是承担风险的开始,这意味着你准备用亏损的...(展开)