作者:东滩顾问 · 莫金玉
随着云计算、移动互联网、物联网、人工智能等技术升级和应用普及,社会和行业信息化的不断发展,全球数据呈现爆发式增长,大数据所蕴含的价值也越发受到重视,被称作“新型的经济资产”。党的十八届五中全会公报提出要实施“国家大数据战略”,这标志着大数据战略正式上升为国家战略,推动我国从“数据大国”向“数据强国”转变。
从产业的角度分析,我国拥有硬件-软件-服务-安全-应用等全产业链环节,产业体系初具雏形;我国已设立8个国家大数据综合试验区,积极引领东部、中部、西部、东北“四大板块”带动相邻省份发展。大数据时代已向我们到来,各地区应根据本地产业基础积极布局,找准大数据产业的切入点和突破口,推动大数据产业特色化、集聚式发展。
大数据产业链包括大数据硬件-大数据软件-大数据服务-大数据安全-大数据应用等五个环节。
1、大数据硬件——云计算的发展降低了存储和计算的成本
大数据硬件是指数据的产生、采集、存储、计算处理、应用等一系列与大数据产业环节相关的硬件设备,包括传感器、移动终端、传输设备、存储设备、服务器、网络设备和安全设备等,其中存储设备、服务器是核心。随着云计算产业的发展,越来越多的企业选择使用云计算服务商提供的平台服务,这降低了整个行业在基础设施层面的成本,企业可以将更多的预算投入到应用层面。
数据中心事大数据领域的核心基建,需求旺盛,市场投资活跃。截至2017年底,我国在用IDC机架总体规模达166万架,总体数量达到1844个,规划在建IDC规模107万架,数量463个。同时,IDC总体布局也在逐步优化,新建大型、超大型数据中心逐步向中西部贵州、呼和浩特等条件适宜地区部署。
2、大数据软件——细分领域市场格局形成,龙头企业优势显著
大数据软件是指数据采集、数据存储、信息挖掘、分析处理及数据交易的平台和工具,包括大数据计算软件、大数据存储软件、数据查询检索软件、基础平台软件、平台管理软件、系统工具软件和大数据应用软件等。根据赛迪研究院的统计,2015-2018年我国大数据软件行业的市场规模保持增长,2018年达到822.5亿元。 软件层面各细分领域的界线并不清晰,有能力的企业普遍选择多点布局,如阿里云提供数据采集、数据存储、分析处理、信息挖掘等多样化服务。经过多年的发展,各细分领域的市场格局基本形成,市场集中度不断提高,龙头企业出现。
大数据服务包括数据采集、交易、应用、标注、分析处理、增值服务等多种服务类型。其中数据标注属于新型行业,属于非寡头占据非充分竞争市场,但随着下游企业基础性需求被满足、存量市场下降,未来行业集中度将不断提高,挤压中小型企业的生存空间,在通用型数据标注领域更加明显。而在垂直行业数据标注服务领域,对行业专业性的要求更高,大型企业难以广泛布局,未来是中小企业进入和竞争的重点。 数据标注是典型的TO B业务,现阶段主要采用人工标注,通过自建生产(采集、标注)团队、搭建众包平台、采购外包服务等模式实现。随着行业数据积累和人工智能技术的发展,下游需求减少,数据标注企业需要向更高精度、更专业化的方向转型,需要研发基于人工智能的处理工具,降本增效,更好地把握客户的需求。
4、大数据安全——自发性需求被激活,吸引大量企业入驻
大数据安全的本质是隐私安全的保护,现阶段主流的商业模式是“安全即服务”,主要从环境安全、系统安全、数据安全、隐私安全四个层面提供咨询、实施、运维、培训服务。据美国投资咨询机构Cybersecurity Ventures相关调查表明,到2025年,全球网络及数据安全预算将达1万亿美元;随着中国网络安全标准的逐步健全,本土安全品牌在政策的驱使下得到了大力扶持,到2020年网络及数据安全行业市场规模将达到1024亿元。
我国大数据安全主要面对政府和企业等对安全产品在合规方面有刚性需求的群体,行业前列企业占据大部分市场份额,且分布较为集中,信息安全行业前50名企业市场规模占据行业总额的90%,前50名的企业主要分布在北京、上海、杭州、深圳等地。随着移动应用的普及个人及家庭对数据安全的需求增加,自发性需求被激活,行业细化成为主流,包括政府、电信、金融、军工、物流、能源、制造、教育、家庭等大数据安全领域,将吸引大量创业公司进入。
二、大数据行业应用不断深化
大数据产业的目标是通过数据分析处理完成商业化目标,经过多年的发展,大数据应用在金融、健康、政务、工业、电信、电商运营、物流等多个行业获得较好应用。
1、典型行业示例
工业大数据:工业大数据是指在工业领域中,围绕智能制造模式,以数据采集集成、分析处理、服务应用为主的各类经济活动所产生的数据的总称,包括从客户需求到销售、订单、计划、研发、设计、制造、采购、供应、库存、售后服务、运维等整个产品全生命周期各个环节产生的数据,在设计、流程优化、需求预测、供应链优化和绿色发展等领域有广泛应用。
健康大数据:医疗健康大数据来源包括医院、第三方检测机构、体检中心、可穿戴医疗设备、移动互联网医疗企业、医学科研机构、药店、社保部门等,通过数据识别、清洗、融合等数据一次开发和医学自然语言处理、医学影像处理、医学数据治理及挖掘等数据二次开发,达到辅助临床决策、新型药物开发、流行病学调查、医保控费等效果。
金融大数据:金融大数据的来源有三类,分别为银行、证券、保险、基金等自有系统采集、舆情数据和个人数据的网络采集、政府侧企业数据的购买。大数据企业的核心在风控,风控的核心在数据的把握,通过大数据改造决策系统,降低坏账率、提高营收和利润,提升金融机构的竞争力。
2、应用深度分析
以健康医疗大数据为例,健康医疗数据量每年增速达48%以上,是增速最快的行业之一。其主要应用领域包括虚拟助理、医学影像、辅助诊疗、医院管理、疾病风险预测、健康管理、药物挖掘、辅助医学研究平台等一系列领域,其中医学影像、疾病风险预测等为市场热门发展方向。
在医学影像方面,以三维重建、病灶识别与标注、靶区自动勾画与自适应放疗为服务重点,商业模式主要以影像识别与处理软件为主,通过CFDA检测后,向产业链上下游扩张。目前肺部、眼底两大类AI影像技术发展较快,涉及肺部疾病的AI影像企业有联影、推想、深睿、依图、科大讯飞等,眼底影像企业有体素科技、Airdoc、健培、爱尔眼科等。
在疾病风险预测方面,针对公共卫生管理部门,重点聚焦疾病预警领域。通过对互联网搜索、社交、LBS等数据,结合疾病、环境数据,采用机械学习和群智等技术,开展监测、传播动力学研究和风险评估,对公共流行疾病提前预警。百度通过医疗检索数据建立流感预测模型,辅助公共卫生管理部门预测流感在各流行区域间传播时空路线和规律,为靶向疫苗研制和使用提供建议。
在药物挖掘方面,以新药研发、药物筛选、跟踪研究为服务重点,商业模式主要为在药物研发和诊疗方面垂直纵深发展,如个性化药物诊断、新药临床研究等领域,提高研发效率,减少新药不良反应事件,麦肯锡估计医疗大数据为医药研发年均创造400-700亿美元的价值。国内提供药物挖掘服务的公司有思路迪、瑞博生物、吉凯基因、太美医疗等。
目前我国已经设立了8大国家大数据综合试验区,积极引领东部、中部、西部、东北“四大板块”发展,带动相邻省份加快建设。京、沪、粤等地依托本地信息产业基础和产业园发展大数据产业,具有良好的发展基础和优势。河南、重庆、辽宁、内蒙古、贵州等依托国家综合试验区的建设,加速推进辖区内大数据产业的发展。其他中部、西部地区也顺应产业发展趋势,积极布局大数据产业园,力促产业转型升级。 从大数据综合试验区分布看,并没有明显的地区倾向性。大数据产业包括软硬件系统研发、数据中心布局和行业应用开发三个主要环节,在产业选址上的倾向性也不同,系统研发倾向于IT人才密集的地方,数据中心对地区气候条件有一定要求,行业应用的多样性也给不同地方提供了发展机会。因此,在大数据产业园的布局上,各个地方可以“八仙过海、各显神通”,下面列举几个大数据产业园的例子对此稍做分析。
中关村大数据产业园于2016年成立,由海淀区政府、北京市经济和信息化委员会、中关村管委会共同建设,建筑面积2.5万平方米,重点发展云计算、物联网、移动互联网等与大数据相关的高精尖产业,构建覆盖数据源、数据采集、数据处理、数据存储、数据分析、数据可视化、数据应用和数据安全等各个细分环节的完整产业链条。园区提供包括从产业研究到创业孵化、品牌拓展、人才培养与服务、技术转移、知识产权保护、信用建设等一系列产业促进服务。目前园区已引进百度、腾讯等互联网巨头、软通动力、东软等软件服务商、IBM、中科曙光等云计算服务商、亚信联创等运营商服务商、汉王科技等技术企业。
案例链接2:贵安综保区电子信息产业园
贵安综保区电子信息产业园是南方数据中心核心区、全国大数据产业集聚区,规划面积42平方公里,重点布局发展大数据产业、电子信息制造产业、新能源新材料产业、文化创意产业、软件及信息服务外包产业、卫星地理信息系统产业及总部研发产业7大产业板块。大数据产业基地分为产业核心区与产业孵化园,其中核心区规划面积约1平方公里,产业孵化区规划面积约0.8平方公里。基地以大数据上、中、下游产业为核心,引进、培育、孵化相关行业企业,丰富和完善产业链条,形成集聚式发展。目前,三大电信运营商在园区分别建设全国性的数据中心,将形成超过2500PB的裸容量存储能力;园区已引进中科院生物医学大数据中心、FAST天文大数据中心、贵州超算中心等示范引领型项目,以及高通、苹果、华为等龙头企业。
南京健康医疗大数据产业园位于南京江北新区,总规划面积17.3平方公里;围绕“一中心三基地”布局建设,其中“一个中心”指人口健康医疗信息平台,“三基地”分别定位于医疗健康大数据在医疗、养生、养老、培训等方面的综合服务应用基地、在生物医药研制方面的应用基地、在高精尖医疗科技研发领域的应用基地。健康医疗大数据存储中心一期工程于2017年完成,可存储江苏省8000万人的个人健康档案、电子病历及全省174家三级医院影像资料等。南京江北新区生物医药谷是江苏省生物医药研发和孵化实力最强、数量最为集中区域,拥有绿叶思科、药石药物、微创医学、海昌中药、金斯康科技等重点企业,园区将与当地健康产业实现融合发展。
以上分析可以看出,无论是构建整个技术链、构建数据中心还是聚焦行业应用,从不同切入点都能找到大数据产业的发展机会。相信随着大数据产业的不断发展,大数据将赋能所有的经济社会和城市发展,各个地方都会从中找到发展大数据产业的机遇。