本文主要从针对在疫情期间的防控大数据产品中精选出部分优质产品,在分享这些独特的产品同时,也对背后的产品实现逻辑及数据逻辑做出相应的解析。
一、疫情期间有哪些痛点?
新型冠状病毒肺炎此次的疫情导致的全国各地、企业、居民住宅区进入并维持紧急的状态。
①相关政府机构、企业单位及居委会等如何在各交通工具关卡识别流动人员是否去过疫情高发地、如武汉?
②各居民如何降低碰到确诊及疑似病例后中招的风险?
③各居民如何在中招后快速找到能够确诊的医院?
④各居民如何及时了解疫情实时情况,保持敏感度?
⑤各小区如何获取小区居民现状信息及物资发放预约?
围绕这5大痛点,疫情期间相对有技术实力及数据实力的企业机构也在快速响应,产生了能够不同程度解决以上问题的系列产品。
本文主要从针对同样痛点的产品系列中精选出部分优质产品,在分享这些独特的产品同时,也对背后的产品实现逻辑及数据逻辑做出相应的解析。
二、疫情期间针对各种痛点,有哪些成熟的产品
猎人看了比较多的产品,其实严格来说就分3种:
第一种是纯粹的用户信息主动登记,管理员后台人工审核识别是否有异常,然后再进行下一步排查;
第二种是通过爬虫手段,监控网络、公众号、各官方网站公布的疫情相关的数据,例如确诊人数、疑似病例,这些确认及疑似曾经的行为轨迹,时间节点等,整合成产品;
第三种相对依靠数据,没有全国性或覆盖大部分用户群体的数据量,是做不出来的,例如腾讯、百度等互联网巨头(基于GPS数据)、例如运营商(基于基站数据)、例如数据宝(基于高速及铁路数据)。通过核心的数据类型针对性作出的能够识别或筛选是否有过疫情地出没或疫情确认人员接触概率的产品。
2.1 居民信息采集登记类产品
2.2.1 居民登记管理(小区住户、返城、返工等)
以下是居民登记的基本页面,只展示部分截图。此类页面主要给各住宅区的居民主动填写个人信息,其实主要目的是为了让居民主动上报近期出行轨迹,例如有无去过疫情地等。主要解决的是各居委会流动人口疫情期间的活动轨迹线上录入。
(想法是好的,此类产品也是相对容易开发出来的,技术含量不高,因此可以在小程序或公众号可以看到各种公司开发的登记产品入口。但上报的数据信息,除了个人姓名身份证信息有接口可以识别外,主动上报的出行轨迹无法判断真伪。)
2.2.2 物资预约及发放管理
疫情期间最稀缺的大众必须物资非口罩莫属,因此无论出远门的还是出门买菜的短途需求,都必须要戴口罩。只要是不在家里蹲的,没口罩除了会增大被感染几率,还纷纷会被管控工作人员教育。
也因为口罩稀缺的正常途径无法购买,所以有危机意识的人们,特别是要经常出门的复工人员都非常主动寻找线上口罩预约登记购买的产品入口,当然各居委会也是积极使用这类工具积极参与口罩计划经济计划。
同时物资预约前往往需要先详细登记你的居民信息。如果是线下的就随便登记个住所信息及个人身份信息即可。
居民信息采集登记类产品,现在还有很多形态,例如在出高铁站时或者在高速卡口上,都有二维码需要乘客或车主主动录入信息及轨迹用于同行快速排查。如何实现真实性判断,其实需要拥有用户及车主全国轨迹大数据的机构支持。
另外居民登记类产品如果是主要给各小区使用,如果小区不提供区内人员的身份信息实现线上的匹对,那大部分情况需要居民带着租赁合同及身份证信息去到相关定点做线下审核匹对。
2.2 爬虫为主的收集汇总实时更新类产品
2.2.1 新型冠状病毒肺炎确诊患者同行程查询工具
你或你身边熟悉的人只要出过门,不管远近,都会担心去过的地方或乘坐的交通工具上是否有潜在感染的危险。因此出门前及出门后的群体都希望有这样的工具可以查询同行程查询工具孕育而出。
只要有一定的爬虫技术能力的公司都可以实现,只要能实时获取各官方媒体公布的确诊用户轨迹信息,然后整合配对挖掘分析形成一张列表即可。
产品特点:1:1查询,对使用者来说属于周期性非高频产品。
除了自己有车的,及坐私家车出行的群体外,坐飞机、火车、地图、长途大巴、公交车、出租车、轮船的群体,及户外活动时的一些场所,都有可能近距离接触过疫情确诊或潜伏期的患者。但大众需要有这样的一个工具可以根据交通工具的时间、车次、车厢、班次等信息查询是否有确诊患者同行的工具,有的话可以及时去医院检查确认。其实也是可以起到一定的互相监督的作用。
而这样的产品内的数据均搜集自各官方公众号/微博/网站发布的信息,其实就是通过爬虫手段收集相关涉及监控关键词的文章内容,然后在文章中抽取相应的字段,例如发布日期、车次(班次)、发车及到达场地、工具类型、车厢情况(座位号、车牌号等)、出发时间、结束时间等。形成表格,并设置好索引查询逻辑及体现逻辑即可。
数据的准确性一般是通过只采集官方的媒体文章,然后数据最新发布日期需要对首发文章进行一定的识别。
2.2.2 腾讯疫情实时追踪
2.2.2.1 腾讯疫情地图
产品特点:1:1查询,对使用者来说属于周期性非高频但每天早晚空闲都会上去看看的,周期性TO C的流量入口产品。
腾讯凭借其强大的技术力量,推出的疫情实时追踪产品集合了多个相对容易实现同时是大众关心疫情数据,满足大众实时获取疫情数据,进展,谣言,治疗及通过公开确诊患者的轨迹提醒周报群体勿随意走动的同事,及时发现轨迹重合的,加强对感染的评估。
疫情期间,每天起床第一件事情,大众最关心的莫过于昨天确诊新增数量、治愈人数及死亡人数。
数据来源:全部数据来源于国家卫健委、各省市卫健委、各省市区政府及港澳台官方渠道。
实时数据方面,腾讯新闻的统计方法如下:
国家卫健委公布数据时,全国总数与国家卫健委保持一致。
各省卫健委陆续公布数据,如果各省数据总和已经超过之前国家卫健委总数,则直接使用各省数据总和作为全国总数。(“疑似病例”仅使用国家卫健委每天公布的共有疑似病例总数,而不做新增累计)
“较上日”是指每两天间的新增数值,由当前的全国总数减去国家卫健委前一天公布的数据得到。这个值会随着全国总数的变动而实时变化。
疑似病例的“较上日”数据由两日全国疑似病例总数相减得到。由于疑似病例既会新增,也会随着确诊和排除而减少,该差值会小于国家卫健委公布的“新增疑似病例数”。
各省卫健委公布数据的发布时间和统计时间段各不相同,故而会在部分时段出现国家总数不等于分省数据之和。
2.2.2.2 腾讯疫情最新进展
2.2.2.3 腾讯疫情辟谣信息
2.2.2.4 腾讯疫情医疗救治医院查询
2.2.2.5 腾讯确诊患者活动轨迹速查
2.2.3 疫情小区分布
上面提到的确诊患者的活动轨迹速查,下面的疫情地图的呈现方式就相对更加直观,可以知道当前位置附件确诊用户的情况。可以给到忍不住出去浪的群体实时提醒:附近有危险,出门请三思。
这种地图类产品,也只有百度、腾讯、高德等有自己地图产品的公司才做的出来,其他公司做了类似的查询接口背后都是基于这几家的能力或直接是页面嵌入而已。
2.2.3.1 高德疫情地图
2.2.3.2 腾讯疫情地图
2.3 全国特殊大数据定制化产品
以下的产品如果开发公司没有特色的数据或数据来源,是没法实现的。而这些已实现的产品都是现在政府非常感兴趣及可以发挥比较大作用的。政府领导们现在最关注的的是流动人员通过主要交通工具的迁徙情况,用于决策参考。
流动人员的真实性迁徙轨迹,特别是疫情地近期出没情况,需要有真实数据可以体现,防止流动人员谎报。
2.3.1 腾讯流动人口迁徙图(按交通工具区分)
迁徙图其实百度也有,但百度的是全国开发迁徙情况,不区分交通工具的。而腾讯的是可以区分汽车、货车、飞机交通工具的迁徙情况,相对来说更有参考价值。因为人口迁徙主要的交通工具就这3块。
那腾讯如何区分迁徙人员是通过汽车还是货车还是飞机的呢?
其实仅从GPS的两点的定位经纬度及两点间耗费的时间,其实就比较容易区分了。铁路有自己的铁路轨迹,铁路站点有自己的经纬度,速度也与汽车的速度有区别。
而飞机仅从一部手机的飞行模式的关闭及开启时的GPS打点位置及开关时间一计算也就出来了啦。其他的细节这里就不讨论了。
2.3.2 运营商大数据:通过用户手机号授权判断是否有与疫情确认人员接触
如果说全中国覆盖人数数据位置信息最广的除了3大运营商,其他的互联网巨头可能也比不上。
但由于用户数据合规查询及隐私问题、三大运营商的体制问题,可用于疫情期间用户自己查询自证没去过疫情地的产品入口也就2月上旬才勉强上线,联通是最快实现的,移动随后(但全国数据没完全连贯),电信据说还没完全实现,还在努力。
这个工具可以给到用户遇到需要自证“清白”时,通过手机号验证码授权模式就查询进去有无到过严重疫情地区了。但严重地区具体指除了湖北省,使用界面也具体说明。这个产品当然也有缺点,如果用的是非常用手机号,或者新办的卡,那可能就无法确认是否真的没去过疫情地,出现遗漏。
除了通过这个页面查询外,3大运营商也可以直接通过短信授权查询近期出行轨迹。
2.3.3 密接人员查询
这个产品主要是中国电子科技集团技术开发的,给群众自己查询是否有可能是密切接触者。
这里的密切接触者定义:密切接触者指14天内与病毒确诊或高度疑似病例直接居住或生活在一起的成员,包括办公室同事、学校师生、同一交通工具的乘客等。
本平台重点查询的密切接触者是:最近14天内,与新冠肺炎确诊或疑似病例同乘火车、飞机位于其前后三排(共七排)以及同乘大巴的相关人员。【也就是以14天潜伏期为查询周期,14天内没接触过确诊患者的相对就是安全的。但无法识别非乘坐交通工具前的接触,这样前后三排其实也有可能遗漏部分接触过确诊患者的乘客】
看产品对密切接触者的定义可以看出,这个产品是接入了铁路、飞机及客运大巴的乘客身份证数据进行关联查询,但可能数据并不是全覆盖。相对来说比较准确。同时这个产品为了防止被滥用,限制用户只能每天查询三次的机会。
2.3.4 基于高速大数据
上面的产品既有通过用户身份证信息查询的,也有通过手机号查询与疫情相关的识别产品,但其实都不适用于批量的、快速的筛查场景。
数据宝基于高速大数据开发的卡口车主疫情地排查产品,在疫情期间可以给卡口工作人员快速输入车主车牌号或者通过OCR快速识别的方式,查询各地通过卡口的车辆最近是否去过湖北等疫情高发地。对于去过疫情地的车辆则用红色块提示,没去过的用绿色块提示。
2.3.5 基于铁路大数据
上面其实也有基于铁路大数据的用户疫情情况识别产品,但产品逻辑不太一样,密接人员查询是将有确诊班次的乘客前后三排的乘客的识别出来。而运营商的产品需要注册才行,产品流程相对较长,只合适乘客或居民查询。
但数据宝基于铁路大数据的疫情查询产品,不单可以给相关工作人员(车站工作人员、小区居委会等)快速输入居民身份证号查询居民最近是否去过湖北等疫情高发地。
对于去过疫情地的则用红色块提示,没去过的用绿色块提示。同时也可以在电脑管理后台批量提供居民身份信息,查询哪些是有去过疫情地的,可以安排人员上门询问排查,加强识别,缩小范围。
三、体会
这次的疫情的影响是突然且巨大的,在这个疫情期间展露头角的各种产品都是为了让大众快速了解情况,降低恐慌,及时找到需要及可以提供医护条件的医院线索,同时也给予各地政府在信息采集、人员管控、疫情排查等方面一定的支持。
而这些产品的背后,体现了各机构对疫情不同场景的需求理解及自身技术能力及大数据资源的有机整合的综合能力。这些都需要快速的响应能力、长时间的技术积累及对大数据在不同场景特别是新场景新需求的理解及应用能力。