【TechWeb】12月13日,在英特尔中国研究院2018年媒体开放日上,英特尔中国研究院院长宋继强介绍了研究院取得的最新研究成果及未来主攻研究的方向。
宋继强表示,“经过多年发展,我们已经从一个单纯的项目研发中心蜕变成英特尔全球科研布局的关键一环,取得了一系列令人瞩目、激动人心的技术突破。我们将进一步发挥英特尔的端到端优势,以数据为中心,将人工智能算法、自主系统平台、智能基础设施作为主攻方向,为产业提供源源不断的创造力,创造突破性的产业价值”。
英特尔研究院是英特尔公司的“科技创新引擎”,英特尔中国研究院定位于世界一流的工业研究院,不仅着眼未来革命性的科技研究,还承载着将研究成果转化至全球创新产品的使命。
目前英特尔中国研究院拥有机器人创新实验室、认知计算实验室、智能驾驶实验室、通讯架构实验室和新技术中心等五大研究团队,在人工智能、自动驾驶、5G、服务机器人等领域取得了丰硕成果。
现场还展示了英特尔中国研究院的多项创新研究成果,包括自适应机器人交互、机器人模仿学习与强化学习、人脸属性识别、基于毫米波雷达技术的手势识别、智能交通路口、受真实场景启发的异常情况仿真及验证、基于OpenVINO的物体检测网络在HERO平台上的部署实现等。
以下为宋继强演讲摘录(TechWeb稍做整理):
今天给大家分享的报告题目是“突破计算创新,共赢数据未来”。这里有几个关键词,“计算、数据、未来”。大家知道,英特尔已经成功的从一个以PC为中心的公司发展成以数据为中心的公司。这个成功的转型意味着其实给我们的创新指出了一个新的方向。以前我们在做很多数据处理、数据计算工作的时候,是在把这些数据给编程或者改造成适合让计算机操作处理的数据,现在不是,现在我们各种各样的计算、传输、存储都要按照数据的特点,我们开始让计算为数据服务。这就叫以数据为中心。
数据大量的出现、大量的可用、大量的可以被处理,给我们带来了巨大的变化。这一张是讲对未来的预测,500亿台设备互联设备,有这么多的数据产生。背后的意义是什么,实实在在给我们带到数字化的生活。不知道大家有没有听说过一本书《数字化生存》,是1996年MIT的教授Negroponte写了一本书,那时候是对未来的畅想,现在可以看到很多20年前书里写的已经变成了现实。我们已经成功数字化我们的购物、出行、社交、娱乐甚至是吃饭,都可以数字化。而中国我们非常强大的电子商务、移动支付、社交网络更是让我们有了大量的可以被挖掘和使用的数据,这些数据是人产生的,人产生的数据仍然只是其中一小部分,我们看到大量的来自于物和各种各样的终端设备、基础设施,路上跑的车。这些新出现的数据有非常多的非结构化数据,还有很多是噪音数据,靠人已经是很难处理这么大量的数据和这么繁琐的工作。事实是恰到好处的事实是出现了人工智能技术,人工智能技术可以帮我们快速提升对这些数据的处理能力。同时我们也需要更强、更好的一些计算力,来帮我们去完成这件事情。
我们来看一下,在整个计算发展的过程当中,数据的发展变化跟计算的演变是什么样的关系。这是最早的计算,这里不光是大型机,在这之前有大型机和小型机。在那个时代最开始我们数据的输入方式在纸带上打孔,用哑终端,哑终端就是键盘,没有鼠标,后来又了鼠标,但是没有图形显示,没有声音显示,只能处理一些文字,他们可以很好的去解决特别计算,还有特定的一些行业,比如说财务,来提高生产效率。但是覆盖不了很多的方面,很多人可能都没有听说过大型机、小型机这样的东西,除了计算机专业的人。后来到了PC互联网时代,我们有了便宜的计算机可以上互联网,这时候还是在家里固定的计算机,已经可以把很多日常的一些软件装上去,可以打打游戏,同时也有了多媒体,有了多媒体数据,意味着有的图像、视频声音,可以开远程视频会议,到了有移动笔记本的时候还可以到咖啡馆里办公,这些都在改变我们的生活方式。那个时代我们称为生活方式计算,靠PC、互联网、多媒体改变了我们很多生活方式。
再往前发展一步,智能手机和整个3G、4G移动网络带来的改变。手机上有很多的传感器,还有位置的定位服务,这一下让设备开始知道使用它的人处于何时何地,旁边可能有些什么,在做什么动作,就有了场景的概念。我们看很多的设备都在说应用场景,做场景计算。再往前发展是我们现在所处的时代,传感器越来越多,各种数据大量出现,这些数据是需要人工智能来处理,我们实实在在进入智能的计算时代。因为很多数据并不是围绕着人,而是围绕着物,甚至是我们周围的环境。
英特尔研究院过去十年重要成果
整个计算的发展过程当中,英特尔研究院我们定位是工业研究院,我们的技术是要用在实际的产业里面,在过去的十年当中,我们也非常紧扣计算为产业的发展做出很有意思的贡献,有很多是转化到我们公司内部。举几个例子,在外部大家看得到的成果。2008年大家开始使用智能手机,智能手机上可以播放视频,可以有好多图片,那个屏幕太小,当你走到一个环境里面有电视机、大屏幕的时候、投影的时候,就想能不能用这个,这是很直观的需求。那时候你没有办法,不能拿一根线连,我们做了什么,英特尔中国研究院做了这样的原型,第一个Wireless Display的原型,包含了通讯结构,一些协议,包含了一些延时怎么控制的一些技术,这些技术被英特尔的产品部门接受,看到这样是可以工作的,2011年就开始了Wireless 1.0的标准,之后就成为产业都在用的一种方式,一直到现在都内含了无线播放的功能。另外一个方向,假如电脑PC和设备上有这么大量高清的视频,怎么互相传来传去,无线还是比较慢,有线也不够快,而且有不同种类的接口,我们做了第一个原型是Light Peak,光峰,其实是在用光线技术去加工,所以第一个10GBS的参数,当时是在2010年做的,后来这个原型发展成了现在的THUNDERBOLT,雷电,现在已经到3.0阶段了,最初就是被苹果拿走的。CRAN,可能做通讯的很多专家了解,来解决什么问题呢?当我们手机用的非常多的时候需要很多的基站,建基站的时候,如果照原来建基站的方式每个用固定的专用设备做基站的话,会发现这时候很难去做动态的资源调制,基站是一堆专用硬件堆在那儿,当它很闲的时候,晚上没人的时候,还是一堆东西在那儿,让给别人用。CRAN(Cloud Radio Access Network) ,云接入网的核心概念,就是用不大的一朵小云,去支持好多个基站,把基站一些接入网的信号处理的功能在云上运作,这样就很好的做动态资源调整。我做部署的时候,本身基站的成本也变低了,增加了一个基站也不是一个很大的问题。这个技术往后发展成为了英特尔在4G、5G支持很多运营商去建云基站的重要因素,我们叫FlexRAN,2013年的时候我们跟中国移动的研究院一起在IBM展示这个原型。还有我们有智能硬件方面的创新,我们的创客运动在2014、2015、2016风起云涌,那时候我们给出最小的全功能的集成的计算机。在计算机模块里有无线通讯、有计算、有存储,还有I/O,是System on Module,我们在2014年CES发布出来变成一个主流产品Edison。还有人工智能技术,这是我们英特尔研究院长期的研究形象,在最新的深度学习热门的这段时间里,我们也是在这方面有很好的工作,不光是在学术界有很多的产出,获得了比赛的前几名,同时也给我们的产品部门提供了很好的技术输出。举两个例子,一是人脸的关键点检测,表情识别,我们进入了RealSense,摄像头的SPK。还有深度神经网络模型的裁减、压缩、一体机优化的方式,进入到前端的视觉加速芯片里的Movidius,因为我们既想用到深度学习神经网络的好处,又想在前端资源低功耗的地方部署,怎么办呢,我们就要对大的模型进行稀疏化的裁减和优化,同时我们要精度,进行低比对的量化,这是一整套的工作,在学术界受到很多的应用。这是我们在过去十年在外面可以看到的一些技术的输出。
手机后 下一代可能不再有单一主流设备类别
继续往前看,后面会怎么样?贝尔定律是大家可能听说过的关于计算机发展的类别演进的定律,从70年代开始就有。它讲每隔差不多十年,主流计算机的设备类型会体积上至少缩小10倍,用户量和使用规模增大至少10倍。特别是从工作站到PC,PC到手机,假如说我们把smart iPhone的崛起放在2018年,以iPhone获得成功为一个时间点的话,现在是2018年,我们有没有看到某一个设备类型能够成为新一代的设备类型,好像还没有。会是VR的头盔吗,会是AR的眼镜吗,还是手机的变形分拆版,还是无人驾驶车,还是智能家居,不知道,看起来并不像。为什么?因为如果想要形成一个生态,首先要有一个非常清晰的产品形态,这个产品形态上要能够承载好多种不同的应用,从而形成一个平台,像智能手机显然是、PC显然是,从一个产品变成一个平台,最后构建了一个完整的生态。现在很多的创新设备,你会发现形不成非常大的平台,无人驾驶车有可能,现在还没有显现出真实的能力,有没有发现有很多设备有这个潜力,都有可能成为某一种新兴应用的平台。这是因为现在这个时间点已经到了可能一个转折点,计算可以很小,很低功耗的去产生,通讯也可以,存储也可以,传感也可以,意味着这样集成的模块可以藏到很多东西里,可以藏到桌子里、茶杯里、你家的墙里、台灯里,都有可能。那么也就意味着未来可能不是一种计算设备,而是有好多种设备共同为我们未来的生活提供智能化的服务。
如果这么多种设备,我们想怎么对它们的数据流动来支持它的计算和传输呢?数据类型可能是多种多样的,设备的部署和使用形式是多种多样的,我们发现他们对数据使用的生命周期里面一些重要的步骤是差不多的,是类似的。首先要对这个数据能够感知和理解,这是最基本的。然后要把这个数据或者处理的数据传给别的设备,传给边缘和云端,也要从别的设备拿出去过来给我自己做一些融合,这样才能做更好的做分析和增值,为设备提供更好的服务做好准备。而且这一块非常重要,因为很可能这个设备在当前这一刻就拿到这些数据并不完整,或者本身就有一些局限性,我们需要加入知识,加入人制定一些规则,加入一些策略,然后再加上一些可能对过去数据的一些统计,综合起来去洞察现在这个数据的表象下面蕴藏的真正价值给挖掘出来。这几个步骤是我们对数据未来可能给我们带来计算要求的一个认知。
举个简单的例子,无人驾驶是一个非常典型的例子。首先这个车本身是一个完整的自主的智能设备,通过感知做了决策,又去执行,能够去开车,转弯。但是又不是说万能的,有很多信息也是收不到,有它识别不好的情况。当有网络的时候,当可以跟其他的车,跟基础设施通讯的时候,可以进一步的增强它驾驶的安全性,驾驶的效率都可以提升。边缘的计算,云的计算都对他有帮助。再进一步讲,我们希望车能够处理各种各样的极端情况,不会出交通事故,我们需要每个车把它可能碰到的事故送到云端,去做训练,这时候下发到各个车,让所有的车都具备这样的能力。这是一个完整的循环,我们觉得非常重要。
如果把计算拆分,会看到感知阶段都是视觉数据,3D的雷达数据需要并行计算,在决策阶段已经是语义信息,把知识、规则、法规策略结合进来考虑是串行计算,有可能是多线程。行动,我要去刹车的时候立刻就得刹,我要过一个路口转弯的时候立刻就得转,要不然就错了,这叫实时计算,这三种计算的支持要同时做。所以我们需要异构计算来支持,光有异构计算还不够,因为我们真实世界的状态对人来讲也是未知和已知,你在北京什么都知道,把你放到以色列你又什么都不知道了,所以必须要有学习和适应的能力,感知的时候要考虑概率,在做一些行动的时候要观察行动的真实的反馈,对预期做比较,预期和反馈做比较,最后调整决策。这是一个完整的方式。
整合AI、无线和异构计算
所以对于英特尔中国研究院来讲,在英特尔整个端到端的战略里面,我们是做前面设备到边缘这一段,主要是通过三样东西,智能算法、无线技术、异构系统架构,来去提供整合的技术的方案去赋能,让自主系统它们能够做得更好。我们的研究目标是要有突破性的产业价值,什么是突破性的?比如我可以给自动驾驶这个领域提供前所未有的边缘的智能,这是一种。也可以把更高级的认知和学习能力赋予智能家居或者机器人,这都是突破性的。到具体的地方,这是软件算法层面的,这是硬件平台层面的,这是集成性能层面的,我们有几个主要的目标在做。分成门类的话,水平方向上我们有人工智能和5G作为横向的技术支撑,应用到各个领域都可以。纵向上我们把智能驾驶和机器人作为长期需要研究的主赛道,去当做应用的场景做科研,这里面具体的我们下面有四个技术报告会说。这两个技术生态和学术社区非常重要,我们是开放式创新,我们要把大家的智慧集成起来。
举两个简单的例子,这是刚刚李克强教授和王教授也提到我们成立关于智能网联汽车大学合作研究中心,对于这件很困难的事情不是英特尔一家在做这件事情,我们把很多学术成果给它集合起来,大家一起来做,安全是最重要的,我们做任何无人驾驶自动驾驶这方面的研究,最后是为了安全的把人从A处送到B处。开放数据集和基准测试,包括人和车的界面,包括车和外面的人,车和车内的,与人已经在车内由司机变成了乘客,也有人机界面上的变化。还有先进的算法架构,这些都是跟车本身是有关的。而这一块是跟环境有关,假如说这个车还有环境做支持,我们可以怎么样提升它运输的效率和安全。
机器人方面,我们给出了硬件的平台,硬件平台之上需要我们合作伙伴,我们需要有做系统整合的平台级合作伙伴,因为我们不做机器人,我们需要有机器人的集成商把它用起来,要有应用级合作伙伴,对于一些领域的行业应用,比如应用在客服、送餐、导购,都应用起来,生态级的就是一些新的材料、新的设备我们希望去加进来考虑。
大家看到我们在好几个领域都在做科研,并且我们不光在中国做广泛而深入的一些合作科研,同时在这些不同的领域也跟世界各地的一些学术机构在做研究,这样保证我们做东西始终能够走在科研的前列。
最后跟大家说一下,像我们刚才唱的歌一样未来是一片光明,我们刚好在非常好的时代,这几项技术都让我们把以前很多在未来科幻小说里看到的事情变成现实。跨学科的合作,人才的交叉合作思维碰撞,一定可以产生出一加一大于二的效果。希望大家来持续关注英特尔完整的科研战略和我们的产品布局。谢谢大家!