2011年全球著名咨询公司麦肯锡
发表了著名的研究报告
《大数据:竞争、创新和生产力的下一个前沿》
由此标志着大数据时代的到来
牵手七年,大数据进入千家万户
它被企业视为像石油一样的“战略性资源”
号称可以令我们的生活更加便捷
但七年下来
实际生活中的大数据却与预期有点不符
在提供便利的同时,也带来不少麻烦
甚至还成为了一种潜在威胁
今天小巴就来吐槽一下
这些“愚蠢的大数据”
精准不足,麻烦有余
我们在电商网站买买买的时候
其实是让渡了自己的部分隐私权
让大数据可以通过记录分析行为
来优化我们未来的决策
然而很多时候大数据反而帮了倒忙
大家都有过这种体会
比如我吃完俩馒头
淘宝:你要不要来俩馒头?
豆瓣:要不要来碗米饭?
小米:我的馒头五毛一个
闲鱼:要不要卖俩馒头换钱?
百度:湖南株洲馒头机制造厂供应优质馒头机
......
为什么会这样呢?
小巴研究了下
根据搜索网站和电商的
个性化推荐算法
它们是这么给咱们打标签的
▷性别:大裤衩还是连衣裙
▷购买力:正版、海外购、官网、高档
▷地域:电影票
▷年龄段:骷颅图案的T恤还是中老年服饰
因为这些个性化标签
在一段时间内是固定的
因此按照这个大数据系统
最终就只能根据用户过去的买买买
来预测未来的买买买了
而正是这样的“傻瓜推理”
消费者就成了大数据眼中
“只买贵的,不选对的”傻瓜用户
其实,如果只是收到类似的推送
被骚扰下也就罢了
但现在似乎有了更高级的玩法
例如“大数据杀熟”
杀熟,就是我们经常说的宰熟客
由于了解了日常的购买行为
也就吃准了该用户对某个价位的接受程度
因此即便有优惠,却刻意隐瞒
网友就吐槽过这么一件事
当然,小巴没实锤说
此处真有无良商家出没
但这类大数据确实存在着这种漏洞
购买力标签会在某些情况下
反而过滤掉更利于消费者的选项
从而给了有心人“作弊”的机会
本来是要帮我们做精准决策的
结果反而完美地造成信息不对称
细细想来
是不是又怕又惊?
到底是谁在服务谁
相比电商类大数据的“固执”
音乐软件的大数据就人性化多了
因为它的算法则建立在用户更深度的行为上
它们把用户听过的每首歌
当做一个检测样本
然后大数据重点记录
▷是否标记喜欢或不喜欢
▷是否完整听完
▷是否很快切歌
▷该用户过去喜欢的类型
......
总之,用户的偏好是建立在行为上
而不仅仅是历史数据
可我们还是发现了bug
尽管它们做到了尽可能精准地推荐
但大部分时候这仿佛又是个
“养成游戏”
借助小巴朋友的吐槽就是
小巴朋友作为一个资深的摇滚迷
为了换换口味也是煞费苦心
这么想想也很心累
所以到底是谁在服务谁呢?
可怕的自动“关联”
看到这里,音乐软件还算个“孩子”
但算法跑到社交网站
似乎跑偏成了这种画风
是不是有毒?
这种算法,就是关联
但只是这个程度
小巴也默默忍受了
但最近发生的一件惊天事件
就没那么简单了
2018年1月
去年在美国互联网闹得人心惶惶
令人惊怖的邪典动画入侵中国
▷邪典动画:一种限制级甚至扭曲价值观的动画作品。它的内容往往十分血腥暴力、充满性暗示、鼓吹犯罪等等,唯一与成人电影不同的是,邪典动画的扮演者,都是人们熟悉且主要是儿童十分喜爱的角色。
在这次事件中
儿童邪典电影的主演
动画片《冰雪奇缘》里的艾莎(Elsa)
以及大家都十分熟悉的蜘蛛侠
甚至还有米老鼠、小猪佩奇、小黄人等等
这些动画人物
在影片中尽情演绎着
大量严重限制级的变态表演
满嘴烂牙的小猪佩奇被虐待
浑身是血的小黄人
被挖掉眼睛的艾莎公主
被撕成两半的蜘蛛侠
更变态的是
这些动画的背景乐却都是欢快的儿童歌曲
而且它们往往色彩丰富
十分吸引儿童
有些甚至还有儿童角色
小巴放个程度还算轻的上来
各位感受下
这种令人不安作呕的画面
竟然首次出现在经过层层严格过滤的
YouTube儿童版App
这款App被美国大部分家庭
当做开发儿童智力的早教工具
这个事件在美国称为艾莎门(Elsagate)
而艾莎门的帮凶之一,就是大数据
首先,由于主演多为动画人物
因此在算法中,被自动归类到儿童视频
艾莎门爆发后,视频被监管下架
但好事者继续上传
通过#Elsagete##Elsa#等标签
引导大数据继续关联分类
最终死灰复燃
而2018年1月
这些邪典电影的中国版本
被发布在中国各大视频网站
同样的,大数据标签它们
“亲子游戏”“母婴频道”“色彩教学”
尽管我国的监管也进行了及时处理
但一部分孩子的身心已经受到侵蚀
家长们在网上说
有些孩子被吓到做噩梦
但更令人担心的是
有些孩子已经沉迷其中
不给看就大哭大闹
这是另一种形式的网络暴力
只是潜伏在动漫形象之下
而这可能是
愚蠢的大数据所带来的最大危害
一旦被不法分子利用来“洗脑”
后果不堪设想
大数据时代还很稚嫩
大数据的骚扰和危害
带给我们的直观感受是
消费者距离成为
大数据时代真正的得益者
可能还差几百份麦肯锡报告
那我们又该如何应对呢
小巴觉得这需要个人和企业共同应对
▷个人:千万不要困在自己的信息茧房里,尽可能多元化,哪怕需要调教下大数据,否则很有可能被愚蠢的大数据所束缚甚至利用。
*信息茧房是指人们的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像蚕茧一般的“茧房”中的现象。由于信息技术提供了更自我的思想空间和任何领域的巨量知识,一些人还可能进一步逃避社会中的种种矛盾,成为与世隔绝的孤立者。
▷企业:大部分情况下,企业利用大数据得以最大化自己的产品推广,企业依然是目前大数据的最大受益者。因此在发展的同时,也不要忘记及时处理“环境污染”问题。尤其是类似艾莎门这样的恶性事件,更需要及早预防。