阿里巴巴集团副总裁、数据委员会会长车品觉在新书《决战大数据》中回顾到:2005年,淘宝有了第一个数据分析师,一直致力于用数据来帮助企业运营和解决问题。阿里巴巴在不断使用数据的同时,也发现了数据本身的问题——大数据需要更主动的管理,也需要更多的创新。
数据化运营是用数据解决问题,但如果想把数据做得更好,解决更多新的问题,就需要去做一件以前从未做过的新事情——运营数据。2011年,阿里巴巴才开始有计划地进行这件事。企业主动收集数据,并且以此去创造更优质的新数据,让新数据更好地服务于企业的运营。这是一个“从用数据到养数据”的过程;是一个“从数据化运营到运营数据”的过程,也是一个“从看到真用”的过程。
全书分十一个章节,车品觉从数据化运营到运营数据、阿里巴巴的大数据秘密两大角度、十一个维度,用鲜活的例子详细阐述了其数据化思考。以下是对一些精彩观点提炼。
1、大数据面临的最大问题——人
断层是大数据面临的最严重问题。收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大关键命门。使用数据建模的人,同样不清楚当前数据是如何获得的。
从公司管理层角度看,投资人了解数据的意义吗?高层管理者对数据的期望和中层管理者之间有不同吗?他们知道数据能够帮助企业做什么吗?这些答案因立场而异。
当我们讲到数据价值时,没有人能对此给出一个合理的定位,原因就在于几个关键问题没有分清楚:一是要明确这是谁心里的数据价值,投资人、管理者、中层、数据分析师们心中对数据所产生的价值自然不同;二是要明确数据的分类,不同类型的数据所产生的价值各不相同。
2、大数据的本质是还原用户真实需求
每个人都在通过不同的设备产生着数据,使数据更多在“量”这个维度上不断膨胀,但是“量”的单纯膨胀却对企业真正了解一个用户的需求产生了极大的挑战。所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值将是未来商业中每一个企业必须考虑的问题。
随着O2O的深入和可穿戴设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业数据交流,这样才能更好地还原用户的真实需求,让用户在任何一个场景中都能获得由数据带来的便利。
盲目进行大数据投资,收集越来越多的数据,但这些数据却是“死”数据。“死”数据就是单纯存在数据库中,无法进行分析和使用,并且不能够产生价值的数据。
大数据的真正价值是将数据用于形成主动收集数据的良性循环中,以带动更多的数据进入这个自循环中,并应用于各个行业。多样的自循环方式打开了大数据之门,进入这个循环的关键是从解决问题出发。
面对无线数据,我们需要一种多屏思维——需要考虑到现在用户使用互联网的多场景问题。多屏可能会包括多台电脑、手机和pad,可穿戴式设备。当多屏变成一种常态,不管是数据分析师的分析方法还是推荐系统的推荐算法都必须多屏化。要解决的主要问题有两个:一是做到高效准确的收集,二是培养数据分析师的多屏思维。
数据按照是否可再生,分为不可再生和可再生数据。按照所处存储层次,可分基础层、中间层和应用层。按照数据业务归属,可分为各个数据主体。按照是否为隐私,可分为隐私数据和非隐私数据。
数据价值1、识别与串联价值,2、描述价值,3、时间价值,4、预测价值,5、产出的数据价值。
“养数据”通常有两类,一类是网站自身没有的数据,需要用户自主提供;另一类是公司拥有的,但没有进行数据的收集。
“用数据”更多的是一种方法论,“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策,数据养的时间越早,积累的数据也就越多。养数据也是一种管理和商业艺术,在养之前可能谁也不确定最终会出现的后果,一旦养成会产生非常大的商业价值。
7、数据的盲点
数据盲点可以分为两类,物理盲点和逻辑盲点。物理盲点是指在数据库中不存在这样的数据,即企业没有收集到应该收集的数据,这一类数据问题的产生通常是数据收集策略出了问题。逻辑盲点是有数据,但没有被很好地发掘出来。数据逻辑盲点的出现与数据分析师或数据使用者的经验和敏感度有关。
除了这两种,还有一些人为制造的“盲点”,比如故意把数据进行掩盖,或者人为地调整数据口径。是否看到数据盲点价值的核心是有没有看到应该看到的数据,有没有错失不应该错失的数据。
8、阿里巴巴的大数据实验
一个人在注册某一个网站的时候,性别登记只会是男性或者女性,阿里巴巴竟然有18个标签!阿里巴巴的内部数据化运营流程是:例如,要为一个童装类目做营销推广以征集新客户,会先找到目标客户群,把这个类目感兴趣的消费者用标签找出来,通过发邮件或短信吸引其关注。
数据从“用”上升到“养”,即运营数据。例如,会尝试在整个淘宝中查找,针对12岁年龄之下儿童商品为例,此时在用户中搜索有多少用户家中有12岁以下的孩子,但却未发生过从这个类目购买商品的行为。以前只能运营有过购买行为的几百万用户,现在可以达到几千万。从几百万到几千万就是运营数据,这时一个从主动收集数据到运营数据,再到产生新数据的过程。
9、阿里数据化运营的内三板斧——混、通、晒
作为数据分析师,如果不和业务部混在一起,商业敏感就不会凭空出现在你的面前。坚持带着业务问题来观察数据或者带着数据来观察业务,兼备二者的敏感,就做到“通”,更深层次的通是存在于公司组织中的数据。数据能不能做到在获取、使用、分享、协同、链接、组合之上让自己变得超级简单和便捷,这时数据化运营里面非常重要的一点,正是晒的内容。
10、阿里运营数据的外三板斧——存、管、用
收集数据不是目的,让收集起来的数据如何产生价值才是最终的目的。学会用数据产品来解决获取及使用数据的问题。阿里巴巴数据管理最不一样的地方在于非常依赖数据产品,希望用数据产品来解决获取以及使用数据的问题。在“用”数据的问题上,数据的分裂和重组,都能做到颠覆性创新。