一、背景
今年,国务院印发《促进大数据发展行动纲要》明确指出大数据将成为提升政府治理能力的新途径,提出:建立“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,…,推动政府管理理念和社会治理模式的进步。
与此同时,国外学术界和政府管理部门近年来也发起了一项“大数据社会福祉”(big data for social good)运动。与我国的目标相似,该运动也尝试将大数据技术与社会治理相结合,以数据驱动的方式应对现代社会中面临的一些复杂问题,增进社会福祉。在政府层面,华盛顿、伦敦、慕尼黑、纽约等做了不少探索,成功运用大数据为政府治理问题提供了支持;在研究层面,ACM、IEEE等国际学术联合体设立了专题会议讨论大数据与社会治理的结合;在社会层面,企业、高校、公益组织等开始积极探索应用模式。我们认为总结这些初期探索的经验将有助于我国各级政府更快更好地发展大数据社会治理。
此外,我们发现在目前与大数据政府治理相关的研究文献中,关于宏观层面和理论建构方面的研究已有不少[1][2][3],但涉及微观层面能对具体操作提供借鉴的案例总结还不充分。因此,本文尝试从案例研究出发,总结大数据可以改善社会治理的一些应用领域、模式和方法,以及实施过程中值得注意的一些问题,希望能为大数据社会治理实践提供更多可实际操作的经验借鉴和创新思路。
二、案例选择和综述
我们从公开资料中广泛收集了261个案例,并通过三次筛选最终总结了41个案例。
通过对案例集的元数据进行统计,我们首先识别了目前国外大数据社会治理的主要关注领域,包括:(1)社会安全(31.7%),主要涉及治安、消防、食品安全、交通和灾害等,主要关注点是通过大数据实现安全事件的早期发现和介入、减少损害;(2)开放数据接口(17.1%),主要涉及通过可编程接口获取数据的方法,主要关注点是支持更多数据产品和数据服务的开发和应用;(3)城市建设(14.6%),主要涉及街道、公共设施等选址规划和维护,主要关注点是通过大数据提高城市建设的市民参与度和满意度;(4)社会保障(12.2%),主要涉及为弱势人群提供帮助,主要关注点是通过大数据发现最需要帮助的对象及整合可以提供帮助的社会力量;(5)儿童与教育(9.8%),主要涉及为儿童成长和教育提供支持,主要关注点是通过大数据更有效地分配教育资源或定位困难学生帮助其完成学业等;(6)就业与创业(7.3%),主要涉及为就业和创业提供支持,主要关注点是运用大数据识别供需不平衡并积极加以引导,如弥补“技能沟”等;(7)环境与可持续(7.3%),主要涉及降低能耗和污染,主要关注点是利用传感器等数据识别和排查污染和耗能高发地区,以便早期发现和介入。
除去作为底层服务的开放数据接口建设之外,在应用方面,社会安全、城市建设和社会保障问题受到最多关注。合计约三分之二的成功案例来自这些领域,既说明这些问题急需解决,又显示了大数据可以在其中有所作为。
通过对案例集的进一步分析,我们识别了国外大数据社会治理的一些常用模式,可以作为借鉴。
(一)大数据开放,提高基础服务能力
这一模式就是将已有的数据通过一个开放的网络平台免费提供给所有需要的人。开放数据不但可以给市民直接提供服务,也可以为其他政府部门、科研机构以及公益组织提供进一步整合和利用数据的机会,从而给社会治理提供间接帮助。因此,建设开放平台已经成为各国大数据社会治理的基础模式。根据开放数据统计中心(open data census)的统计[4],全世界已有97个国家或地区建立了开放数据平台,按照其评分中国目前排在57位,美国排在第8位,英国位列第1。从我们收集的案例来看,美英采取的方式都是各城市分别建设大数据开放平台并由国家常设机构统筹各地数据建立统一检索平台。以美国为例,纽约市的DataBridge平台、洛杉矶市的LAOpenData平台等分别负责各自的开放数据,而美国总务署负责全国层面的数据统合平台data.gov建设。这种以市为依托、以国家常设机构统合的模式实行起来比较灵活,但也有一些问题,就是各市和地区的数据平台建设因经济水平和当地政策的差异而产生较大差别。在最近的美国开放数据评分中,洛杉矶、纽约和旧金山是分列前三的城市,评分几乎是排名靠后的城市(如伯班克、休斯顿等)10倍以上。因此,也有一些研究者提出这种“数据沟”(data gap)的现象是不是会导致地区差异进一步扩大。[5]本文案例,无论是完全由政府自主实施、还是由研究机构、非赢利组织或志愿者参与开发,都使用了一种或多种开放平台数据源,其中17%的案例专门致力于开放数据平台的接口研发,体现出开放平台对于促进数据利用的重要价值。
(二)大数据决策,实现科学决策
这一模式将原始大数据加工成能解释、预测社会现象的精炼数据,用于帮助决策者掌握更全面的信息或更有力的证据,从而增强决策的科学性。通过分析案例集,我们发现有两类基本方法被大量使用。
第一类是关联,即广泛收集可能与待解释现象相关的大量数据然后筛选出关联度最高的一组数据或计算成一个指标,以此为依据辅助决策。例如,为判断哪些建筑物容易发生火灾,纽约消防局筛选了消防、建筑、治安、经济、城市建设等多个部门的数据,从中找到60余个与火灾发生关联最大的数据,并以此为依据计算了建筑火灾危险指数。使用该指数,消防局派遣视察人员对高危区域进行日常排查,有效降低了火灾危害。此外,洛杉矶、旧金山等地利用用电、用水、垃圾和投诉等生活数据与居住行为的关联性来排查建筑非法改装和群租行为,为治安和建筑风险治理提供依据;芝加哥公共健康部门利用餐厅的历史记录、市民投诉、商业数据、周边环境等数据对餐厅的食品安全进行排查;伊利诺伊州使用医疗数据、孕妇群体的历史数据和地区经济社会数据来关联最需要帮助的年轻孕妇,提高社会福利并改善生育率,等等。
第二类是预测,即根据现有数据预测未来可能发生的事件,并提前做好预案。例如,多地劳动部门根据就业、企业、经济和教育数据分析劳动技能的供需趋势,引导企业、就业者和教育者提前规划和实施技能培训、填补“技能沟”,以达到充分就业的目的。此外,波士顿教育部门通过成绩、投诉、奖学金和学生活动等数据来预测学生辍学的可能性并提前干预;芝加哥公共教育部门根据学生、学校和教师数据,结合地区治安、住宅、人口和经济发展数据预测辖区各学校的招生人数,并提前划拨公共教育经费;纽约将全市33万余栋建筑物分为2400类并分别预测了火灾发生情况和拟定针对性救火方案,有效提高了救火效率、降低了火灾损失,等等。
在本文案例集中,有59%的案例为大数据决策服务,其中28%使用了某种关联方法,18%使用了某种预测方法,13%同时使用了两种方法。
(三)大数据沟通,改善外部环境
社会治理总体上有利于社会福祉,但也不可避免会对一部分群体带来短期利益的损失。大数据说服利用数据的客观性,以对公开大数据的呈现为依据,引导广大市民自行从整体和长期的角度进行理性思考和辩论,有利于获得更广泛的关注和支持,改善政府治理的外部环境。例如费城使用一种称为Textizen的应用向市民的手机发送短信通知目前正在制定的政策法规、并投递调查问卷,调查结果被作为施政的依据以可视化方式在网站公布,以求凝聚社会共识。此外,纽约市使用一种LBS应用让市民在地图上提出建议,以确定公共自行车租赁站的设置地点,获得广泛支持;佛蒙特州根据位置信息向市民推送粮食捐献政策和捐献点位置,说服市民捐献保质期内可能吃不完的食物,等等。
大数据技术也可以用于收集社会数据,例如通过社交网络,了解群众观点,或改善群众关系,并有利于说服。Kosinski等发现仅通过社交网站(如facebook)的点赞数据即可推测用户的年龄、性别、种族、政治观点、宗教态度等,从而可以根据这些数据有针对性地投放精心设计的说服信息。[6]类似的方法已在美国大选中成功运用。
在本文的案例集中,有15%的案例使用了某种形式的大数据沟通。
(四)大数据群体智慧,弥补政府资源不足
社会治理的政策设计和执行都需要大量的人力物力,一些任务可能极为细琐繁复,完全依靠政府力量往往难以完成或者效率不高。这一模式通过发动群众参与大数据建设,利用群体智慧(wisdom of crowd)来弥补政府资源的不足。群体智慧可以从数据、技术和人力资源等多个方面弥补政府的不足,对大数据社会治理起到极大的支持作用。例如,波士顿市经常下雪,消防栓很容易被雪埋住找不到而耽误消防任务。由于消防栓众多,日常维护光靠消防局显然人手不足。因此波士顿消防局开发了一个称为“认领消防栓”的应用,邀请居民认领一个住宅附近的消防栓,帮助除雪等日常维护,受到居民的积极响应。类似的案例有,英国借助群体智慧维护道路和附属设施;纽约发动群体智慧利用公共空间设计环境艺术和扩大绿化;芝加哥利用群体智慧帮助流浪汉和孤寡老人等。此外,多地政府以支持数据竞赛、工作坊和夏令营等形式发动高校研究机构、公益组织和有条件的个体自愿者基于开放大数据设计、开发数据产品和应用,服务社会,均取得良好效果。
在案例集中,有多达82%的案例使用了某种形式的群体智慧,74%的案例中使用了高校、行业组织等提供的开源软件。
从上述总结来看,“大数据社会福祉”运动与《行动纲要》中提出的“用数据说话、用数据决策、用数据管理、用数据创新”思路不谋而合。所涉及的案例可以视为对《行动纲要》实现方法和操作细节的有益补充,因此具有较强的借鉴价值。此外,通过比较我们也发现了一些容易忽视的问题,值得在未来发展过程中给予关注。
由于自然和社会现象的复杂性和普遍联系性,要准确描述和解释各种复杂现象,就必须尽可能搜集相关的数据,这就导致了数据不断变大,从而产生了大数据。然而,数据变大并非大数据的最终目的而仅仅是中间产物,这是因为:过于庞大的数据无法为人类直接使用,也就不可能对人类决策产生帮助。因此,在数据变大的同时,还必须考虑让大数据变小的方法,以便于决策者使用。通过研究案例集,我们总结了两种让大数据变小的常用方法。
第一种是从对数据的加工入手,包括对数据进行过滤、排序、压缩、计算等操作。经过加工,有时甚至可以用一个指数来表达海量数据的核心意义。例如,谷歌将无数搜索和人群活动数据加工为一个流行病指数、纽约将大量建筑和火灾相关数据浓缩为一个火灾危险指数等都体现了这一思路。只有将大数据加工到足够小,才能真正为决策者所用。
第二种是从对数据的表达入手,主要是对数据进行可视化处理。以数字形式呈现,人类一次只能理解一个数据;但以图像形式呈现,人类一次可以理解很多数据。因此利用人类认知能力的特点,采用可视化形式呈现数据,也是让大数据变小的有效方法。在本文使用的案例集中,除去单纯的数据接口以外,有高达94%的案例使用了数据可视化。
要用好大数据,数据变大(原始数据积累)和数据变小(数据处理和数据可视化)其实缺一不可,但目前我国的大数据平台仍普遍停留在能“大”不能“小”的状态。
截至10月15日,我国的上海、北京、贵州三大数据平台分别提供491类、303类和22类(大类,未细分)开放数据,均仅提供数据文件。而美国洛杉矶、纽约和旧金山三个数据平台分别开放数据1187类、1250类和786类。单从数量来看,中外数据平台的原始数据相差并不大。但国外数据平台普遍提供数据排序、过滤、计算等分析模块和多种可视化工具,让大数据变小,便于理解和使用。相比之下,国内平台仅提供原始“大数据”,一般公众很难有效运用,导致利用率非常低。平均用户访问量的对比也证实了这一情况:国内数据平台的平均访问量只有数百次,约为国外同类平台的1/100到1/1000。
除了数据平台以外,大数据更有价值的一面是将数据深度加工后融入日常生活,这就需要开发多种多样的高可用性数据应用和服务。这些应用和服务可以增加数据平台的使用率,提高社会治理水平,改善人们的生活,并创造新的就业和发展机会。根据北京、上海、贵州三个大数据平台官方网站显示,各自的应用数量分别为15个、75个和6个。作为比较,仅2015年纽约市举行的NYC BigApps比赛就征集到452个应用。下载量的差距更大,最大可达数百倍。经过我们的分析,国内应用大多使用单一数据下载量的差距更大,最大可达数百倍。需求分析和界面设计也存在一些不足之处,造成可用性不高。此外,数据接口服务的差距也较大,如纽约市提供11种,而国内平台仅北京提供了1种。
不解决好应用和服务的问题,重金打造的开放大数据平台很容易“空心化”,难以对社会治理和社会福祉产生应有的支持。这个问题应当引起重视。
(三)有必要重视对群体智慧的运用和发展
我国大数据平台缺乏应用的现状与未能积极利用群体智慧有很大关系。大数据平台建设主要是技术问题,可以通过一两个技术过硬的企业来完成。但大数据在社会各领域的运用则完全是另一回事,单纯依靠个别企业不可能理解千变万化的社会问题和群众需求。因此国外政府大数据治理过程中普遍尝试引入社会群体的力量来帮助收集数据、识别需求、开发应用以更好地服务社会,即群体智慧。目前主要有三种推进方式:
第一种是政府自身发起大数据应用竞赛。例如,美国政府为了鼓励使用data.gov的开放数据,专门建立了challenge.gov网站,持续发布数据竞赛,最高奖励达2000万美元。除此之外,美欧各城市也经常发起数据应用竞赛。最早的一次是2009年华盛顿市耗资5万美元组织的政府开放大数据APP开发大赛,在30天内征集到47款应用。这些应用后来发展成为估值230万美元的各种软件产品。[7]
第二种是利用高校研究机构学术优势开办工作坊、组织夏令营。目前,哈佛大学、芝加哥大学、华盛顿大学等高校都经常组织“大数据社会福祉”工作坊和学术夏令营并提供专项资金支持。这些工作坊和夏令营与所在地政府合作,全社会征集参与者,针对具体的社会治理问题设计开发了许多成功的数据产品,并普及了数据思维和数据产品的设计开发方法。
第三种是号召行业组织和公益机构利用开放大数据。例如,www.drivendata.org等互联网组织面向社会福祉发起专题活动并提供奖金;Datakind、Bayes Impact等非盈利机构致力于推动大数据运用于改善弱势群体生活水平等,很好地弥补了政府和企业未能及时关注的一些社会问题。
这三种方式中,目前仅第一种在国内得到过应用,且规模较小,未能引起社会关注。善用群体智慧,可以通过小投入牵动大收益,值得予以重视。
五、结语
本文的研究说明,我国的大数据社会治理还刚刚起步,存在很大的提高空间。但我国各级政府的执行力很强,只要能将建设热情和对成功经验的借鉴结合起来,相信我国的大数据社会治理一定能得到快速发展,并对提高全社会的福祉起到应有的推动作用。
注:
基金项目:国家社会科学基金重大项目“群体行为涌现机理及风险辨识研究”(编号:11&ZD174);教育部人文社科基金一般项目“基于社交网络的老年人健康传播应用研究”(编号:14YJC860029)
参考文献:
[1]于浩.大数据时代政府数据管理的机遇、挑战与对策[J].中国行政管理,2015(3).
[2]郭建锦,郭建平.大数据背景下的国家治理能力建设研究[J].中国行政管理,2015(3).
[3]John Carlo Bertot,郑磊,徐慧娜,包琳达.大数据与开放数据的政策框架:问题、政策与建议[J].电子政务,2014(1).
[4]Gloabal Open Data Index.http://index.okfn.org/.
[5]Johnson J A.From Open Data to Information Justice.Ethics and Information Technology,2014,16(4):263-274.
[6]Kosinski,M.,Stillwell,D.,&Graepel,T.Private traits and attributes are predictable from digital records of human behavior.Proceedings of the National Academy of Sciences,2013.
[7]Business Models for Open Data Applications.http://www.appsforeurope.eu/article/business-models-open-data-applications.