快好知 kuaihz

公益大数据:光靠“大”解决不了社会问题

       大数据应用是近来的热点,在社会创新领域,公益数据库在这股大数据热潮下应运而生。

 

       然而大数据并不是一天建成的,公益数据库的建设也依然会存在盲点和痛点,从社会创新设计的角度出发,我们需要深入探讨大数据策略在公益领域的可行性和执行方法,反思公益数据的盲点,尽量避免科技给公益事业带来障碍,另一方面也需要采用设计思维、注重用户体验,抹平公益数据的痛点,让科技可以更好的为公益服务。

 

盲点:大数据是神器

 

       大数据最早是在2011年由麦肯锡公司提出,主要是指信息社会中由用户制造的海量信息。国内外科技圈主要集中在讨论大数据的科技含量、经济价值,鲜有从创新扩散、数字劳工、信息权利等层面对大数据进行深入反思。

 

       美国杜克大学的行为经济学家Dan Ariely这样形容大数据:“大数据就像是青春期的性生活,每个人都在谈论,没人知道真的该怎么做,每个人都觉得别人都在做这件事,所以每个人都声称他们自己也在做这件事。”他用调侃的口吻,讲大数据目前的尴尬局面揭示得一览无遗。

数据成了一种坊间的传奇,似乎每个人都在说大数据“可以做什么”,但是“大数据”到底要怎么做才能实现那些美好的愿景,很少有人讨论。大数据被人们视为一种神器,很多人以为,只要拥有了大数据,或者简单地说,有了大型的数据库,所有问题都能迎刃而解。

 

 

       有机构在数据库项目的宣传稿中写道,“有了这个‘数据仓库’,我们就可以根据需要随时查询我们遇到的问题”,但是问题是,这些“我们遇到的问题”在未输入这个数据仓库之前就存在了,每个机构自然对自己存在的短板和遇到的困难了如指掌,为什么还要专门派人花了时间、录入数据库,然后再登录数据库,在里面搜索自己遇到过的问题?

 

       再说,就算一时半会无法想起“我们遇到的问题”是什么,需要通过数据库检索获知一二,可就算是检索出“我们遇到的困难”,有什么用呢?可以通过检索获得这些问题的解决办法么?如果不能提供解决之道,我们为何要用这个数据库来检索我们自己录入的问题?

 

       最关键的问题是,通过大数据解决社会问题,并不是指仅靠大数据库检索就能把问题解决了。微软研究院新英格兰研究所的数字人类学家Danah Boyd和Kate Crawford在2012年将“大数据”定义为一种文化的、科技的和学术的现象,包括科技,分析和方法论在内的三大板块。大数据除了是一种文化现象,更多的还是一整套科技与社会发展的方法论,数据库只是Boyd和Crawford所指的科技板块的内容。

 

       在国内的公益数据类的项目中,科技板块,比如说大数据库、云存储等技术含量的部分得到强调,但大数据中更为关键的“分析”和“方法论”的部分,我们却很难从这些项目的宣传中看到相关内容,这也从一个侧面看出国内公益数据项目对大数据的技术板块的过度推崇,对分析、方法论的管理和运营板块的忽视。

 

       这种生搬硬套的采用技术创新产品的方法,忽略了科技采用的“本土知识”,也就是说,并没有考虑公益机构以往的技术使用以及问题解决的方式方法,或者说,至少在宣传文案里,并没有很好的传递出“新的公益科技产品所提供的服务,能够切实的满足公益机构的业务需求”的意思。

 

       或许这样一种“大数据好”的吆喝,可以引来好奇和看热闹式的围观,但并不能长久留住用户,如果不能在分析和方法论层面尽快有服务性产品,或者给用户良好的使用体验,用户就会很快流失,连基本的数据收集都很难做到,更别说大数据了。

 

       “中国民间公益组织基础数据库”的主页君曾在微博上无奈地说,“经过十月尾几轮小高潮,数据库增长速度又疲软下来了”,由此可以看出,我所指出的这种盲信技术、忽略用户体验的推广、运营模式所隐藏的风险并非危言耸听,而是的确存在的,也已经给项目推广带来了一定的阻力。

 

痛点一:数据太大了!

 

       雅安地震发生后,益云救灾地图团队曾获得来自腾讯微博约20万的庞大数据。20万条微博,这个数据量够大了吧。当我们得知可以拿到这样一个数量级的数据时,我们欣喜若狂,本以为可以从中找到更多有效的需求信息,为救灾提供更多的信息援助。

 

       但是当我们打开这个数据库,我们全都傻了眼。微博用户制造的数据,往往是个人化的、根据现场的情景发出的,多是情感型、符号型的信息,例如心情描写和表情图案等等,能够直接用于信息救灾的确切灾情时间、地点、人物、需求反而描述很少。信息救灾团队需要大量的人力和时间成本,从堆积如山的信息池里淘洗、分拣、提炼有效数据,为信息救灾的需求洞察、决策提供最精炼、准确的数据。要将这20万条五花八门的个人化数据分拣、提炼、入库、执行,在短短数天的地震救灾时限内,“臣妾做不到啊,亲。”

 

 

       大数据的收集和管理并不像传说中那样高端、大气、上档次,而是最苦、最累、最脏的活,大数据也并没有想象中那样出神入化。大量庞杂信息的无效堆积,就如源源不断的运往灾区的未做任何消毒处理的捐赠来的旧衣服一样,最后恐怕只会因为可利用性极低而被迫弃置,耗费了大量的运营成本不说,还影响了公益项目的正常进行。

 

       所以说,公益数据,光大是不行的。光是通过云存储、网页登记等方式快速收集来的大量庞杂的数据,忽视数据的整理、分析以及大数据的方法论,也会影响公益决策的有效制定和高效执行。运用技术手段实现海量数据的收集只是公益数据的第一步,大数据的管理、洞察才是最关键,也是最难做好的部分。

 

痛点二:大数据安全么?

 

       Boyd和Crawford认为,一方面大数据作为工具可以为癌症研究、全球暖化等问题提供可能的解决途径;另一方面,大数据也成为了意识形态上的“老大哥”的一种隐喻,信息提供者的隐私被拥有数据的“老大哥”侵入和监控。

 

       斯诺登事件曾引起国际政界和学界对于大数据背后的数字监控问题关注。公益数据还依然存在这样的问题,数据收集来了之后给谁看,是否能保证数据提交者的信息安全?是否能保护数据提交者的信息权利?那些被深圳慈展会拒之门外的草根NGO,如果加入这个数据库,是否遭到更加严格的监管呢?这些顾虑是横亘于公益产品和用户之间的鸿沟,阻碍了公益科技产品的创新扩散,简单来讲,就是导致没有多少人愿意使用这些新的公益工具。

 

       从产品运营的角度来看,这些问题都需要给出合理的回答,才能打消用户的疑虑,获得用户认可之后,才能最终赢得用户垂青。设身处地从用户的角度出发,考虑到草根NGO所面临的文化、政治等各方面的处境之后,再设计、提供相应的科技工具,这不仅仅是公益科技产品的设计好坏、技术水平高低的问题,也不仅仅是公益传播和产品运营的问题,而是对草根NGO的信息权益的基本尊重和满足,说到底是对人的尊重。

 

       或许草根NGO真的需要“支持型组织的关注,开辟更多获取资源的途径”,真的希望“进入公益研究和倡导者的视野”,但这不是产品真正的用户需求,这只是愿景。从产品设计的角度来看,真正的产品需求是,一种能够实现这些公益愿景的科技工具,在使用工具时能够满足诸如易于接入、填写方便、信息传达准确、提供解决之道的数据库。公益数据库的宣传和推广需要根据这真正的产品需求来做文章,才能有的放矢,真正吸引到用户。

 

       一旦忽视这些用户需求,用户就会提出这样的问题:为什么一定是公益数据库这样工具?公益数据库项目除了提供一份不知道具体有什么用途的分析报告之外,还能为用户提供什么服务?这说到底是这些数据将来会怎么使用的问题,一个公益数据库项目连具体如何使用都“尚未确定”,那怎么让录入信息的用户相信,他们的数据会被安全使用?

 

       此外,研究者和倡导者向政府建言献策的目的是为草根NGO服务,从这个项目的信息采集页面的内容来看,仅仅是收集输入机构有多少员工、上一年度总支出这类基本情况上的信息,草根NGO用户并不知道研究者和倡导者收集这些数据可以用来干嘛,也根本不知道研究者和倡导者要研究和倡导的议题是什么,更不清楚获得这些数据的研究和倡导者能够为草根NGO提供什么样的服务。

 

       另外,虽然网络调研方法越来越流行,也能帮助研究者减少工作强度、提高调研效率,但是不是说研究者就可以依靠网络问卷翘着二郎腿、一劳永逸的获取数据。网络调研的研究者依然需要尊重受访者,至少是要在网络问卷上说清楚研究的大概背景,并向受访人保证维护他们的隐私安全。草根NGO用户不仅不清楚数据是否会得到隐私保护,也不知道数据会怎么使用,这也让用户不禁怀疑,这样的数据录入,真的安全么?

 

       用户在使用上的不安全感,造成了对这类项目的不信任,项目很难在更大范围内赢取用户,公益科技创新慢慢也就变成了一件“好看不经用”的摆设。

 

数字劳工与草根NGO的信息权益

 

       至于说到草根NGO录入数据,可以帮助公益研究者和倡导者“向政府建言献策”这一点,则更有颠倒主次之嫌。首先,草根NGO本来就是公益倡导者,他们的公益行动本就是在倡导一种公益理念,并不存在一类公益行动者之外的倡导者。不可能说让受助者先完成数据录入任务,再通过抽奖的方式获得援助或奖励,这样做的话,说轻一点是搜集资料为服务草根NGO做准备,说得重一点,有违公益伦理之嫌。

 

       这就好比说,为了帮助救灾人员尽快做好灾情评估、尽快为受灾群众提供救助,现在有一个最新的灾情收集、评估系统,所以让受灾的老乡们自己通过网络录入自己的受灾情况,主动来录入灾情的,先每人发一袋白面,然后根据灾情信息录入的好坏,再弄个抽奖,中奖的受灾老乡,再每人派发一袋大米以示奖励。这哪里是什么公益行动,这明明是土豪地主坐享其成的收租子嘛。

 

       这让我联想到传播学上所说的“数字劳工”(digitallabor)概念。数字劳工,指的是那些通过主动生产的免费信息而使得信息运营商获利的普通用户。他们虽然免费使用推特、微博这些社会化媒体,但是在数字化媒体中制作的数据则令推特、微博的运营商在资本市场获得巨大的利益,而这些利益并不会被分配到这些普通用户身上,社会化媒体运营商通过提供少量的免费服务来剥削普通用户为他们创造的巨大利润,所以称这些用户为“数字劳工”。

 

公益数据的方法论

 

       说到底,玩转公益数据的关键,不仅仅是技术的问题,关键还是在于需要有一套行之有效的大数据方法论。这套方法论一方面来自于以人为本的公益理念,一方面植根于科技为社会创新服务的用户体验。两者缺一不可,也并不矛盾,实际上是一体两面的共生关系。以人为本的公益理念可以通过提升公益科技产品的用户体验得以执行,良好用户体验的获得也需要在公益科技产品的设计、推广和运营的各个阶段、各个层面贯彻以人为本的公益理念。将两者融会贯通,这才是真正意义上的公益科技创新,公益数据的潜力才能得到最大程度的开发,也才能真正为草根NGO插上飞跃发展的科技之翼。

 

 

 

 

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:社会问题  社会问题词条  公益  公益词条  解决  解决词条  数据  数据词条  不了  不了词条