最近一年,大数据及配套技术已经开始进入人们生活的方方面面,约会也不例外。据统计,有约20%的恋爱关系是从网络、手机约会服务开始的。作为一个人口大国,中国有约1.4亿“嗷嗷待哺”的单身男女希望从网络交友网站找到自己的真爱。美国18岁以上单身的男女数量为9000万,约占总人口数量的40%,其中又有4000万指望网络约会网站带给他们一个女神或王子。
网络约会走红背后默默无闻的英雄当属网络基础设施。无论是网络交友还是手机交友,它们所依赖的照片、资料、聊天信息数据库都在快速增大。然而,面对几亿单身男女的“饥渴”诉求,没有创新的工具,怎么能当好“红娘”?因此,在网络基础设施方面,出现了越来越多强有力的工具(比如大数据),暗中为鸳鸯们牵线搭桥。
丘比特改行
2010年,人们花在交友网站上的时间是手机交友应用的2倍;2011年,还是2倍,不过换了个边。不管消费者选择什么平台,在线交友都需要服务提供商能够给他们推荐、匹配最合适、最投缘、最有话聊、最能谈下去的交友对象。
今天,使用约会交友应用的人数的增长速度比其他所有应用程序加起来都要高。智能手机的普及,也推动了在线交友行业的“打跨步”前进。单身男女每年为在线交友行业提供10亿美元的收入,巨额的收入也催促着企业提供更高效、更创新的工具和解决方案。同样也给移动运营商、无线网络提供商、网络业务提供商不小的压力。
美国最大的婚恋交友网站Match.com拥有70TB的用户资料,如何提高数据处理能力,成为其发展的绊脚石。利用微软的升级版SQL服务器解决方案,Match.com能在2秒之内搜索100多台服务器,为单身男女找到最合适的交往对象。
大数据邂逅网络交友
许多用户可能不知道,在婚恋网站为他们推荐合适对象的背后,有一群数据库专家、大数据科学家和数学家在辛勤地工作。
用户在注册全球著名婚恋网站eHarmony时,需要填写一份400道问题构成的资料问卷,包括个人喜好、身材状况、爱好以及其他细节。有了这些数据之后,eHarmony利用Oracle 10G数据库从分布全球的服务其中搜索最投缘的交往对象。系统要与其他2000多万名注册用户进行数据比对,至少要进行10亿次计算。经过一系列复杂的算法,你未来的爱人就出现了屏幕上。eHarmony的个人资料库(不包括图片和其他信息)数据总量超过4TB。
设计精良的方程式加上强力的数据中心,这就是在线交友精准匹配的秘密所在。只要用户对自己的资料进行了修改,系统仍旧可以在短时间内为用户找到最合适的交往对象。
为真爱优化
数据输入质量决定输出质量,这是所有数据库共有的特点。用户在在线交友网站上填写的资料越详细,回答的问题越真实,越能找到真爱。