回顾2019年,AI技术的发展正在改变世界科技走向。
2019这一年,作为“第四次工业革命”技术核心之一的AI,依然是全球科技热点,而且似乎更热了。
你看,在刚刚过去的NeurlPS2019,以13000人参会、1428篇论文发表,创造了历史新高,AI领域人才济济,生态蓬勃。
这一年的AI发展方向,可以说,更加深入到各行各业,也更加贴近人们的衣食住行。你看,各种微博热搜,其实都和AI脱不开关系。
今天,我就通过5个热搜,带你看看今年全球AI的发展热点吧!
01 #谷歌实现量子霸权#看AI的算力提升
10 月 23 日,随着《自然》杂志150周年刊发布,谷歌宣布实现了“量子霸权”。
谷歌使用54 量子比特的量子处理器「Sycamore」,用时200秒,就完成了世界上最强超级计算机 Summit 需要 10000 年才能完成的计算任务 —— 对量子电路随机采样。
消息一经公布,立刻成为全球科技最大热点。
AI的产业发展有三大要素:算力、算法和数据,而“量子计算”将会解锁人类计算能力的新世界,为AI打开全新维度的可能性。
也因此,谷歌从13年前就开始布局量子计算,后来则成立了GoogleAI Quantum团队专门探索。
量子霸权的实现,虽然按照Pichai的话来说,还是“HelloWorld”级的计算任务,但这也足以让2019年成为AI算力发展史中,重要的一年。
如果说“量子计算”实用还很遥远,那在更靠谱的算力提升方面,2019年也是进展颇丰。业内的进步主要在两个方面:芯片研发以及新的云计算中心。
芯片方面,学界和工业界,都在探索更多的可能性。
比如,更通用。
8月1日,《自然》杂志介绍了,来自中国团队的“天机”AI芯片架构。由清华大学主导,中外多所大学联合研究,结合了类脑计算的AI算法,成功驱动了自动驾驶汽车。这项成绩,展现了一种实现终极“通用”AI的可能性。
还有,更大只。
同在8月,CerebrasSystems在硅谷推出了Wafer-Scale Engine (WSE) —— 史上最大AI芯片,比普通芯片大56倍,1.2万亿个晶体管。而后,也随即推出了搭载WSE的全新深度学习计算机CS-1。这样的超级计算机,为大型AI问题提供了新的算力,训练时间将大幅缩短。
以及,更专注。
11月,在英伟达和高通早就上线人工智能专用芯片(TPU)之后,英特尔终于也推出了,解决复杂深度学习计算问题的处理器NervanaNNP。百度则研发了中国首款云端全功能AI芯片“昆仑”,并基于此于12月上线昆仑云服务器,同时支持飞桨在内的主流AI框架/平台。
而在边缘设备上,则更加“专”。7月,百度遵循“软件定义芯片”的全新设计思路,发布了专为远场语音交互打造的百度鸿鹄芯片,主要用于车载语音交互、智能家居等场景。可以说,无论在边缘设备还是服务器上,专用AI芯片的配置已成标准。
云计算中心方面,主题则是利用AI优化AI专用的云计算中心。
随着AI需求的加大,对算力的要求不断提升,现有的机房已经无法满足计算所需。根据IDC预测,到2020年底,世界将有55%企业的数据中心将因此被迫更新或优化。
制冷和节省能源方面,是其中重要一环。根据Gartner分析,到2020年底,随着AI计算需求密度的增加,将会有30%的数据中心不再有经济价值。
今年初,工信部也联合各有关部门,发布《关于加强绿色数据中心建设的指导意见》,明确指出,到2022年,中国数据中心能耗需达到世界先进水平,大型和超大型数据中心设计电能使用效率值不高于1.4。
在2018年DeepMind实现了利用AI冷却数据中心并取得显著效果后,中国也进展喜人。华为持续发布iPower、iCooling、iManager等创新技术,通过AI优化配电系统、端到端能效管理系统等,资源利用率提升20%。
百度在建的云计算中心,拥有超大型神经网络、超大规模高性能计算集群,并且采用百度第四代数据中心基础设施模块架构,基于百度飞桨研发的AI 控制系统,实现设计年均 PUE 1.15,成为数据中心领域首个供电、制冷全分布式预制化的案例。
2019年,全球AI算力继续提升,芯片更加强大、可能性也更多,计算中心则更节能、更经济。
在日后,算力也将继续成为整个业界布局突破的关键一环,而量子计算也将迎来一轮新的爆发。端侧 AI 芯片则将更加低成本、专业化、解决方案集成化,同时,NPU将成为下一代端侧通用 CPU 芯片的基本模块。
02 #大兴机场停车机器人# 看AI产业化落地
9月25日,大兴机场正式投入运营,成为全世界最大机场,同时也是最“高科技”的机场。
其中,自动停车机器人的投入使用,让民众眼前一亮,登上热搜。它由京东数科和首钢S-PARK合作推出,当你开车进入指定停车区后,就可以直接下车走人,剩下的找车位的机器人都会替你完成。
这其实,就是自动导引机器人AGV,它早已在物流、仓储等方面得以应用,这也是一大类工业机器人的代表。
传统的工业机器人只依托机电系统和传统的自动控制理论,适合在生产线上完成既定任务。但是,随着全球工业4.0的推进,更多高智能化、高柔性的应用需求源源不断地出现。
依托工业大数据和传感器,AI赋能下的机器人能“看见了”、“听懂了”,开始更加智能了。不仅可以自行处理更多情况,还可以和人互相配合。
比如,7月,在百度AI开发者大会上,百度对外展示了基于服务机器人方案的机械臂“茶博士”。利用百度3D视觉技术,机器人可以对茶杯的位置进行检测和追踪。通过运动规划和控制,机械臂可以进行碰撞检测、避开障碍物,同时可自动生成倒茶轨迹。语音语义联动,让机器人像“人”一般,听得懂,说得好,做得准。
还有,美国的波士顿动力机器人,之前以各种机器人动作秀视频上热搜,今年终于开始了产业化应用。4月,在收购KinemaSystems后,公司正式商用物流机器人PICK。它可以依靠识别技术进行混合SKU的装卸,几乎等于真人。7月,公司则宣布安防四足机器人SPOT开始商用。
可以说,2019年,AI发展有了更加结实的产业化落地,与各行各业的生产实践更加深入结合。
不仅在第二产业上,有工业机器人帮助制造业和工业提升效率,在农业方面,我们也看到了各类AI应用。比如中国农大等机构和京东数科推出的“神农大脑”等,可以防治病虫害、智能化养殖;百度与京东方植物工厂共同打造的智能无土栽培解决方案,节能节水、降低成本、提升产量。
这些AI应用,将原来农业专家的个人经验进行了数字化、产品化,使其业务具备了规模化生产的可能性。
在未来,AI的应用将会更加深入,各行各业都将会大规模应用深度学习技术,进行创新、加快转型和智能化升级。
03 #上海将投放AI垃圾桶# 看AI通用平台化
7月1日,随着上海开始实施“史上最强”规范,垃圾分类成了中国的常规热点。“某某是什么垃圾”更成为了流行语。
一个月后,“上海将投放2000个AI垃圾桶”的消息上了热搜。人每次单独向垃圾桶投放一个垃圾,然后系统会自动识别“这到底是什么垃圾”,并归入相应位置。
相关的应用,还有百度 APP 的“AI 垃圾分类”智能小程序,基于百度 AI 视觉和语音能力,通过语音搜索或识图搜索,帮助用户识别垃圾类型。
其实,这些AI应用背后的技术都很成熟,开发者只需调用基础AI算法,再加一步映射即可。而这,其实可以直接借助各类AI框架及其预设模型实现,可能都不需要重新训练数据。
一个小小的AI垃圾桶应用,其实反映出整个社会对AI基本能力的广大需求,而千百个类似的需求能在2019年快速落地,则反映出AI框架的平台化、产业化程度的加深,易用性的增强。
比如,从2019年PyTorch和TensorFlow的进展,可以看出两家都在补齐短板,以图点亮AI赛场版图中更多区域。
PyTorch因为本身用起来很简单,几乎就是Python化的代码开发,让它在学界更受欢迎。但之前,出于不支持边缘设备部署等原因,工业界应用时,拥有更多部署服务能力的TensorFlow的用例则更多。
在今年的f8上,PyTorch推出了试验性的PyTorch Mobile。在1.3版本中,从Python开发到iOS和Android上的部署,支持了完整的端到端工作流。而TensorFlow在10月的World大会上,则大幅提升了开发体验,融入了包括自家Deepmind在内的更多预设模型,并强调可以通过TensorFlow Extended、Lite和.JS实现“Deploy ML anywhere”。
国内方面,作为国内唯一开源开放、功能完备的深度学习平台,百度飞桨开发者数量已经超过150万,今年的升级,更是向着标准化、自动化和模块化发展,满足开发者和产业越来越多、越来越复杂的需求。年中时,飞桨与华为麒麟芯片展开合作,打通深度学习框架与芯片AI 算力,打造中国 AI 核心竞争力。
2019年,我们看到,各大AI框架的更新策略,都朝着功能更全面、使用更简单的方向迈进。以后的简单需求开发上,技术可能都不再是问题,拿来就用。AutoML可能很快就能实现,只要输入元知识,框架就能自动选择数据、自动调整优化模型、并进行训练和部署。
随着AI框架平台能力的提升,开发难度的下降,在以后,世界上很可能会出现多家“AI工厂”,他们将会在需求端汇总并抽象本质,然后提出一套可扩展的解决方案。比如,把语音客服,大规模复制应用在1-1教育和金融服务上。
在以后,开发出需求,并知道怎么以正确的姿势落地,可能才是更难的点,也更是市场的人才所需。
04 #5G正式商用# 看智慧城市生活即将开启
11月1日,中国三大运营商正式上线5G套餐,标志着中国正式商用第五代移动通讯技术,而中国也自然成为了世界最大5G市场。
5G的全新能力作为基础设施将和AI一起,相互赋能,开拓出更多机会。
5G的“高并发”应用场景,将让更多设备入网,万物互联得以真正实现。
IDC数据显示,今年全球物联网支出预计7260亿美金,明年将突破1万亿美元大关。今年,从随身佩戴到家居使用,有更多的智能硬件设备出现,销量增速也再创新高。
拥有从插座到手表等众多智能硬件设备的小米,根据其第三季度财报,小米IoT平台设备连接数量超2.1亿台,同比增长62%。在智能音箱方面,国内出货量最大的小度音箱第二季度更是取得了同比高达3700%的增速。
开发者方面,平台能力继续提升,开发厂商更是增速加快。
Alexa平台2月发布年度总结,称其兼容设备已经突破10万种,设备数达到1亿,用户交互也取得了100%的提升,功能方面则支持更多语种,达到15种。DuerOS发布5.0系统,加入了行业领先的全双工免唤醒能力。开发商方面,根据天眼查数据显示,中国智能硬件企业注册数量从2018年的1459家,增加到了2027家,取得近40%的增幅。
5G的“低延迟”应用场景,则开启了无人车和制造业等高可靠性需求的落地。
随着日美欧各大车企在今年大批裁员,无人车在美国进一步商用进展缓慢。一方面是成本太高,今年企业太缺钱,GM已经推迟了自家无人驾驶出租车上路的期限。另一方面,纯全道路适用的无人车开发难度太高,Waymo首席执行官John Krafcik也在1月表态,自动驾驶可能永远无法在全路况条件下行驶。
8月,The Information披露了Waymo的无人出租车在硅谷和凤凰城的用户满意度数据 :70%。按照严苛出租车安全的标准,这其实表明了有30%的情况,用户有感知到的危险情况。比如用户抱怨跟车太近,停车不准甚至直接停在了路上。
中国方面进展喜人,道路测试上百度Apollo依然领跑,L4级别自动驾驶城市道路测试里程达到300万公里。落地方面,随着年初ApolloEnterprise的发布,Apollo也迎来了商业化元年。
小度车载OS 已携手头部生态合作伙伴300余家,和一汽红旗联合研发的“红旗EV”Robotaxi 车队在长沙开始试运营。
随着5G的到来,智能城市改造后的路面,将为无人车在中国的落地提供更多可能性。
狭义来讲,智能城市就是对城市进行各项智能化改造,加入街道传感器、智能灯杆、垃圾桶甚至智能乘凉等设施。依托5G的低延迟,这些传感器可以实时将道路信息传给车辆。改造后,无人车的道路环境将大大改善,不再那么难落地了。
10月31日,谷歌在多伦多的智能城市改造项目Sidewalk Labs终于获得了“有条件的批准”,在经历了种种民众和政府刁难以后,将在明年3月最终投票。建成后,将成为西方世界智慧城市的典型代表之一。
中国则发展得更快。“网路强国、智慧社会”早已上升为国家战略,智能城市则是其中的重要一环。11月赛迪和京东云、京东城市联合发布《2019年中国智能城市发展战略与策略研究》,提出了智能城市发展的五大战略途径:兴业、善政、惠民、共生和筑基。
国内各家企业的布局也在2019年全面提速。
年初,京东iCity大会在北京召开,公布京东城市成为集团一级战略,6月就上线了智能宿迁APP成为首个落地成果,11月的JDD则发布智能城市系统2.0正式落地雄安。百度也在今年与东软集团合作,推出“云智未来城市”新型智慧城市整体解决方案。阿里云在5月和塞纳公司合作,改善大马的交通系统,8月又和高德等合作,推出城市大脑交管联合解决方案。
未来,随着更多高可靠性要求的设备入网,以及5G和边缘计算的发展,算力将会呈现更加分布式的结构。而智能城市也将更快发展,智能交通将加速在园区、物流、公交等场景中率先落地。
05 #AI造假视频不得随意发布#看AI法规大讨论
2019年,你眼前的真,更不一定是真。
今年,中国的ZAO App出世,可以让你亲自扮演各种大片里的角色,一上线就得到了大量用户。这背后,就是基于深度学习的技术演进,使得AI给视频里的人物换脸,再生成各类“Deepfake”视频成为可能。
在为技术进步感到高兴和新应用感到新奇的同时,大家的担心也在2019年达到了峰值。
因为,这项技术也可能办坏事。
比如,可以伪造出奥马巴等政客们子虚乌有的演讲,甚至已经对马来西亚的政治产生影响,英国还有公司被不法分子诈骗。关于AI技术的法规和伦理讨论也提上了各国日程。
11月29日,国信办发布通知,明年起,AI造假视频不能随意发,之后便登上热搜。新规定还要求,各大平台要尽快部署“非真实音视频鉴别技术”。
之前一个月,美国加州州长Gavin Newsom也签署了AB-730法令,明确指出,如果利用Deepfake产生政治影响,将是犯罪行为。7月,弗吉尼亚州也发布了禁止Deepfake滥用的相关禁令。
公司方面,推特在11月发布了首个反Deepfake策略草案,并征集公众意见。微软谷歌等巨头也开始研究鉴定技术。
除了视频可用AI自动生成,文章也可以。其实今年,整个AI业界在自然语言理解方面取得了显著的进步,好在,暂时也还没有假新闻方面的困扰。
今年2月中旬,OpenAI公布了一个训练好的通用语言模型GPT-2,因为这个模型能力过于强大,可以生成令人真假难辨的文章,连行文习惯都能模仿,其创建者甚至认为他过于危险而不敢发布,直到11月才完整发布。GPT-2利用Reddit庞大的在线BBS数据进行了训练生成文章之后,可读性很高,也并没有引发假文字新闻的大灾难。
来自百度、卡内基梅隆大学、谷歌等机构的一系列模型,也都超越了NLP的基准。12月,百度可持续学习的知识增强语义理解框架 ERNIE,更是在NLP领域权威数据集 GLUE 中荣登榜首,并以9个任务平均得分首次突破90大关刷新该榜单历史。
除了用户看到的最终内容形态可能是虚拟的,AI的训练数据也可能是模拟出来的。
因为很多场景下,获取真实数据成本太高,各大机构都在探索高质量的训练数据模型的方法。今年,模拟环境已经可以完成更多数据构建和高质量训练工作。
比如OpenAI Five训练的“五人队伍”打败了Dota2的世界冠军,背后模型的训练就是在模拟环境中进行的。
而类似的模拟在“对话”类型的训练中更多,比如Amazon旗下Alexa的对话能力训练,送货无人机和机器人都在使用模拟数据进行。
自动驾驶领域也在使用模拟数据,Aurora无人车就在训练模型在城市环境中导航时,同时进行数百次模拟。百度团队更是研发了一种增强现实的自动驾驶仿真系统(AADS),还登上了《科学》杂志的《机器人学》子刊。
它使用激光雷达(LiDAR)和相机扫描街景。根据获得的轨迹数据,为汽车和行人生成了看似合理的交通流,并将其合成到背景中。生成的逼真图像添加了完整注释,可用于从感知到规划的自动驾驶系统训练和测试。
今年,更多AI的应用,也在温暖着我们。
任职于阿姆斯特丹自由大学的黄智生,组建了微博树洞行动救援团队,帮助识别在网上企图轻生的人们,并进行救助,一年来已经阻止了507人次的自杀。谷歌的AI团队,更是在全球选择了20个公益和环保机构,注资2500万美元,帮助他们实现AI赋能。
在“百度 AI 寻人”平台,用户发起照片比对接近40万次,9000多个走失者与家庭重新团聚。百度还推出了全球首款听障儿童 AI 手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。
在未来,AI的能力必将会更强,而随着各国法规和社会伦理体系的完善,AI将会更加安全、可控,更加温暖人类。
终
2019年,人工智能相关话题频上热搜。诸如出行、通讯、甚至扔垃圾,AI更加贴近人们生活。而中国的AI发展依然显著影响世界。
2019年,全球AI产业都进一步向算力增强、赋能产业化、AI平台化发展。Intel谷歌等公司为代表,通过芯片、计算中心乃至量子计算增强AI算力;Tensorflow等各大AI平台继续增强算法、易用性,持续广泛影响学术界、工业界;百度则是将百度大脑升级为5.0,打通AI产业化应用落地的全部流程,实现了AI 技术的标准化、自动化和模块化,成为“软硬一体的AI大生产平台”。
中国的AI政策优势在智能城市、基础建设智能化、第一二产业升级上逐渐显著,华为百度京东等企业为代表加快布局;中美两大国都在探索最新AI政策和伦理的新可能。
量子霸权、5G商用、Deepfake,这些热词将会定义2019的AI战况。以AI等技术为核心的新一次工业革命,序幕正在拉开,未来可期。