“大数据”是目前最热门的流行词之一,这其中自有其理由。不仅是超级计算机实验室,现在各行各业的公司都可以具备处理大量数据集合的能力。而在过去,这些数据的规模之大是是不可想象的。沃尔玛实验室和可口可乐公司的下一代饮料机Freestyle,都在使用全新的数据库和分析平台,用来分析客户的实时数据,预测客户需求,帮助打造新产品。
CEO们开始怀疑,大数据是否真实可靠,这能否给他们的企业带来重要的竞争优势。这是预先对风险和回报进行权衡的关键因素,因为大数据会迅速带来高昂的成本。众位CEO为了确保这种庞大的分析能力能够带来回报,需要问下面五个问题:
1. 大数据对我的企业有什么帮助?
对于首席信息官来说,大数据涉及处理来自多个来源的数据的数量、速度和变量,支持经营目标。对CEO来说,大数据涉及在公司合并业务系统数据时对情况的分析——比如客户订单和库存水平——更少地运用来自公司网站、Twitter订阅和电子邮件的传统数据。通过重新组合分析大量的数据,能让企业取得领先地位。CEO们不在乎这些信息的来源,也不在乎所使用的技术——但是他们需要知道,大数据是否会对他们的未来和新思想给出令人信服的答案,帮助他们的公司有更好的表现。
比如,汽车公司能够确定在线广告关键词对最大客户更换特定车型带来什么影响,然后这家公司可以改变其网络营销计划。CEO们应该能够直接提出在下个季度或者未来12个月需要回答的首要问题,这会对经营业绩产生最大的影响。
2. 要花多少钱?
大数据应用的建设和管理并不容易,要求企业具备特定的技术专业知识来开发和维护存储和分析平台及专业分析师,这些人称为数据科学家,他们能够处理大量的原始数据。
“大数据栈”(big data stack)通常采用重量级的处理和分析系统、数据清理工具、可视化工具来创建报告以及服务器和存储系统,这些系统能够储存和管理所有的数据。建设和整合大数据栈的成本,包括工作人员的费用,能够轻而易举地让大型企业投入数百万美元的资金。例如,美国**最近支付134万美元,为国家科学基金会(National Science Foundation)建设数据挖掘项目。
建设成本要取决于项目的复杂性和预算,下面是实施大数据项目的三种选择。
最佳组合:公司从每个类别的最佳供应商那里购买技术组件,建设大数据应用——这种方式耗资高昂,但是非常灵活,具有强大的选项。
打包应用程序:从一家技术供应商那里购买大数据集成套件——这个选择表现出色,具有成本效益,尤其是你计划把大数据业务集中在一个领域内,比如在线客户行为分析。
软件服务:服务软件厂商将收集和存储数据,进行基础设施建设,为你进行所有重要分析和数据管理,避免硬件、软件和人员所需的大量资本投资。
3. 大数据的风险度?
聘请合适的人来负责你的大数据项目,可能是一家公司最大限度降低风险的最佳途径。如果没有善于处理大型非结构性数据集合并得出结论的数据科学家和分析师,你的项目将不能长久持续。然而,这些专业人士的薪酬可不低,但是他们仍然奇货可居。
CEO们还应该理解,随着时间的推移如何采取措施来维护大数据项目。随着存储数据的增长,企业更多地依赖于对生成大数据的分析,系统会变得更加难以管理。一家公司需要为基础设施建设技术的持续投资做出规划;直接与首席信息官合作,将有助于决定用最巧妙的方式,从一开始就经济有效地来拓展你的IT系统。最后,应用和服务能够监控遍布内部和外部网络的现代分布式应用程序,比如亚马逊和谷歌的云服务,可以避免大数据项目超载导致的速度放缓。
4. 我们如何衡量回报?
CEO们希望跟踪公司寻求改善的最终业务指标,比如减少应用程序停工或者增加网上销售额。在制造业,大数据分析可以为同一种产品比较两个完全不同的供应链战略,观察哪条供应链成本更低。在金融服务业,大数据可以应用于分析新产品的最佳目标客户,相比传统的交叉销售方法,具有更高的转换目标。
然而,CEO们应该考虑,大数据可以提供强大的信息来协助决策,但是不能直接影响经营业绩。这就是聪明人在企业中的优势,他们知道如何分析和使用信息来改变流程或者产品。项目规划应该衡量决策和行动的效果——这些行动如何影响最终结果。
5. 需要多长时间能看到效果?
CEO们可能根据他们在媒体上看到的报道,放大了对大数据的期望。至关重要的是,CEO们要与他们的同行密切合作来理解这种潜力,同时与参与这项业务的业务经理保持密切联系。软件服务供应商可能在收到数据几分钟后,就能向企业提供结果,因为他们的基础设施建设和处理流程已经到位。如果你的公司在内部管理大数据项目,也许要很长时间才能看到结果。企业如何定义大数据的成功,肯定会影响产生结果的时间,任何新技术总是需要从小做起,精心规划。