2017 年即将过去,2018 年即将到来。在大数据、数据科学、人工智能、机器学习几个领域飞速发展的当下,如何总结 2017 年的重大进展,在 2018 年又会有什么值得期待的趋势呢?雷锋网 AI 科技评论正在筹划系列文章,解析我们眼中 2017 年中发生的最值得纪念的人工智能进展。
外媒 KDnuggets 也邀请了九位机器学习人工智能方面的专家和研究人员谈了谈他们的看法。具体来说,他们问的问题是:「2017 年中,机器学习和人工智能相关的主要进展有哪些?你觉得 2018 年会有哪些趋势?」参与回答的嘉宾们会给出大约三四百字的回答。
另外,简单回顾一下 2016 年的成果和趋势问答,当时嘉宾们给出的答案主要围绕着 AlphaGo 的成功、深度学习的风靡、自动驾驶,以及 TensorFlow 对神经网络相关技术商业化的巨大推进作用。
以下是今年的嘉宾们给出的回答,AI 科技评论编译如下:
Xavier Amatriain,Curai 联合创始人、CTO,前 Quora 工程副总裁,Netflix 研究和工程总监
如果要我选最重要的那个年度亮点的话,那肯定是 AlphaGo Zero。这种新的做法不仅在以深度强化学习为代表的、富有前景的领域做出了改进,而且它体现出了一种范式的转换:模型的学习可以不再需要数据。近期我们也了解到 AlphaGo Zero 可以泛化到其它棋类上,比如国际象棋(AI 科技评论注: 意指 AlphaZero,报道文章见这里)。在我看来这将是影响长远的一项发展。
如果我们看 AI 在工程方面的变化,2017 年中 Pytorch 开始越来越受欢迎,对 TensorFlow 形成了真正的威胁,尤其是在研究机构中。而 TensorFlow 也不甘示弱,很快借助 TensorFlow Fold 版本引入了对动态网络的支持。
AI 巨头之间的「战争」还有许多,其中最为火热的是围绕着云服务的。所有的主流云服务提供商都跟进了深度学习的热潮,增强了云服务中对人工智能的支持。亚马逊在 AWS 中加入了许多创新,如果近期发布的 Sagemaker 可以帮助客户快速构建、部署机器学习模型。规模小一些的竞争者也在涌入这个潮流,比如英伟达最近就公布了自己的 GPU 云服务,很有希望成为训练深度学习模型的又一个有竞争力的选择。在如此之多的竞争之外,我们同时也看到,有必要的时候各个业界企业还是可以联手协作的,新的神经网络表示标准 ONNX 就已经得到了大部分开发工具的支持,而这也是保证工具互用性的重要一步。
在 2017 年中,有关 AI 的社会问题的讨论也在继续变得越来越剧烈。马斯克一直在散播「会杀人的 AI 离我们越来越近了」这样的观点,很多人听到这样的想法以后都觉得很悲观。关于 AI 会如何影响未来工作的讨论也有许多。最后,AI 算法的透明度和偏见的问题也获得了更多的关注。
Pedro Domingos,华盛顿大学计算机科学与工程系教授
德州扑克上 AI 打败人类,人工智能在不完全信息博弈中也要开始称霸了。
自动驾驶汽车和虚拟助手两个领域的竞赛越来越激烈,而 Alexa 在虚拟助手中已经鹤立鸡群。
谷歌、亚马逊、微软、IBM 之间对于云 AI 服务的竞争也在不断升级
AlphaGo Zero 很棒,但是算不上突破。自我对弈 (self play) 是机器学习领域里最早的点子之一了,而且人类也根本不需要五百万场对局才能学会围棋。
Ajit Jaokar,牛津大学物联网课程首席科学家和创始人
2017 年是 AI 之年。2018 年将会是 AI 成熟的一年,我们已经可以从 AI 的系统工程和原生云支持的角度看到种种迹象。AI 也正在变得越来越复杂,但也有许多公司致力于让 AI 的部署变得越来越简单。
在我看来,使用 AI 的企业已经越来越多地在竞争中建立了优势,尤其在工业级物联网、零售业以及医疗保健几个领域,传统企业衰退得尤其快。AI 在各个规模的企业中都有迅速的开发和应用(同样地,在带来新机会的同时,更多的角色将被替代)。所以,我们也已经走过了讨论 Python 和 R 哪个好、猫和狗要如何识别的那个阶段了。
在我看来,AI 的力量正在让传统企业和更广泛的供应链融合在一起,借助的就是嵌入式 AI(比如覆盖了企业应用和物联网的数据科学模型)。
最后,懂 AI 和深度学习的数据科学家处于短缺状况,这一会继续让银行之类的传统商业类型难以入局。
Hugo Larochelle,谷歌研究科学家,加拿大高等研究院机器和脑学习计划副主任
机器学习中有一个趋势曾经让我觉得非常兴奋,而且我也在这个方向上努力过。它就是元学习(meta-learning),它是一种应用范围尤其广的方法。不过今年最让我觉得兴奋的是小样本学习方面的研究进展,它研究的就是如何找到只需要寥寥几个样本就可以泛化得很好的算法。Chelsea Finn 写过一篇很棒的文章,介绍了今年早些时候时候这个领域中的研究进展,可以看这里 bair.berkeley.edu/blog/2017/07/18/learning-to-learn/。值得一提的是,机器学习领域现在有许许多多令人敬佩的在读博士生,Chelsea Finn 今年的表现绝对是产出最多、最令人印象深刻的之一。
今年下半年,更多研究员发表了他们关于小样本学习的元学习的论文,有的用深度时序卷积网络 (arxiv.org/abs/1707.03141),有的用图神经网络 (arxiv.org/abs/1711.04043),等等。我们也看到了用元学习的方法做主动学习 (arxiv.org/abs/1708.00088)、冷启动项目推荐 (papers.nips.cc/paper/7266-a-meta-learning-perspective-on-cold-start-recommendations-for-items)、小样本分布预测 (arxiv.org/abs/1710.10304)、强化学习 (arxiv.org/abs/1611.05763)、层次化强化学习 (arxiv.org/abs/1710.09767)、模仿学习 (arxiv.org/abs/1709.04905) 等等许多研究。
这绝对是一个非常有趣的研究领域,在整个 2018 年中我也会密切关注这个领域的动向。
Charles Martin,数据科学、机器学习、人工智能顾问
2017 年,我们看到了深度学习 AI 平台和应用的井喷式增长。年初 Facebook 就发布了 PyTorch,向 TensorFlow 发起正面竞争。Gluon、Alex、AlphaGo 等等,各种新进展不断出现。机器学习在不断发展,原来的特征工程和逻辑回归到了现在的看论文、实现神经网络、优化训练参数。在我的顾问经历中,我的客户们寻求过定制的目标识别、高级自然语言处理以及强化学习的解决方案。股市和比特币一直都吸收了很多的关注度,而 AI 在悄悄地发生革命;零售业的大衰退也已经形成了切实的证据,表明 AI 会把传统工业搅得天翻地覆。许多公司都想要转型,我们也看到了很多想要在 AI 方面寻求技术和战略指导的需求。
2018 年我们将会迎来全球性的突破性转变,AI 第一的经济模式将会开始普及,欧洲、亚洲、印度甚至沙特都有公司向我们提出了需求。随着中国和加拿大不断在 AI 方面做出创新、印度这样的国家从 IT 转型为 AI,全球公司对变革的渴求会越来越多。商业化培训会有很大需求,不管是在美国还是其它国家。AI 也会带来巨大的效率提升,制造业、医疗、金融等传统行业也会受益。AI 创业公司将会带来新的 AI 产品,在美国内外都带来丰厚的投资回报。从机器人到自动驾驶汽车的新技术也会不断带来更多令人惊讶的进展。
这将会是充满了精彩的创新的一年。可别错过了。
Sebastian Raschka,密歇根州立大学应用机器学习和深度学习研究员、计算生物学家,《Python 机器学习》作者
在过去几年中,开源社区里对各种新冒出的深度学习框架有着许多的讨论。现在,随着这些工具慢慢变得成熟了,我希望,我也期待可以看到大家的研究方法会更少依赖于工具,大家可以把更多精力投入新点子的摸索和实现,以及深度学习的实际应用中。具体来说,我期待看到 GANs 和 Hinton 的胶囊可以解决更多有意思的问题,这两件事都是今年的讨论热点。
以及,我们最近的一篇半对抗性神经网络的论文表明可以从面部图像解读出隐私信息,在我看来深度学习应用中的用户隐私也是一个非常重大的问题,我希望以及期待这个话题在 2018 年能获得更多的关注。
Brandon Rohrer,Facebook 数据科学家
2017 年里出现了更多机器打败人类的事件。2016 年的时候,AlphaGo 在构建超越人类水平的人工智能之路上达到了一个人们期待已久的里程碑,那就是打败人类最强的围棋选手。今年的 AlphaGo Zero 从零开始学习再次超过了自己的老版本。它不仅仅是击败了一个人,它击败的是所有人类的围棋经验的总和。从更现实的角度上讲,把 Switchboard 里的电话聊天录音转成文字,机器现在也能做得和人类一样好了 (arxiv.org/abs/1708.06073)。
不过,人工智能的成就依然非常窄、非常脆弱,甚至只要改变图像中的一个像素就可以骗过当前最好的图像分类器 (arxiv.org/pdf/1710.08864.pdf)。我预测 2018 年中会出现更通用、更鲁棒的 AI 解决方案,也引发更多的关注。而且,几乎每个大型科技公司都已经开始在通用人工智能方面做出努力,这些联合研究团体和他们的早期研究成果也会获得很多的媒体关注。最后,2018 年的热门词汇将会是「通用人工智能 AGI」,而不再是 2017 年的「人工智能 AI」。
Elena Sharova,投资银行数据科学家
2017 年机器学习和人工智能相关的主要进展有哪些:越来越多的公司和个人开始把他们的数据和分析转移到基于云的解决方案上。同时大家现在都深刻认识到数据安全的重要性。
最大、最成功的科技公司们都在进行激烈竞争,想要成为我们的数据存储和分析工具平台。对于数据科学家来说,这意味着可用的工具包和他们所能做出的解决方案很大程度上取决于这个平台提供了多少功能、这些功能又好不好用。
2017 年中全球也出现了多起严重的数据泄露安全事故。这是不应当被忽略的发展状况。随着越来越多的数据存储在第三方服务器上,人们对强大的安全防护能力也需求也会越来越高,以便抵抗可能的新威胁。
2018 年会有哪些趋势:确保执行全球数据保护协定 (GDPR),以及继续补上机器学习系统欠的技术债,在我看来将会是 2018 年的重点趋势。GDPR 作为欧盟的协定,对全球的商业都有约束能力,所有的数据科学家也都应该了解这会对他们的工作产生何种影响。就像谷歌的 NIPS 2016 论文中讲到的那样,围绕数据构建业务是非常花钱的,随着企业们创造出越来越复杂的数据驱动模型,他们需要仔细考虑考虑如何面对其中的成本。
Rachel Thomas,USF 副教授、fast.ai 创始人
虽然不如 AlphaGo 或者会翻跟头的机器人那么亮眼,但我最喜欢的 2017 年的 AI 趋势是各种深度学习框架都变得非常易用、触手可及。今年发布的 PyTorch 对任何会 Python 语言的人来说都非常易于上手(很大程度上是由于动态计算和 OOP 设计)。即便 TensorFlow 也在向着这个方向改进,已经把 Keras 包含进核心代码库内,并且宣布了 eager execution(动态执行)。程序员们使用深度学习的门槛开始变得越来越低。我期待在 2018 年看到这个趋势持续下去,让开发者们越来越觉得它们好用、易用。
第二个趋势是媒体会越来越多地报道独裁政府如何借助 AI 的力量对人民进行监控。这种威胁在 2017 年就已经不是什么新鲜事了,但它直到最近才开始引起广泛的关注。已经有研究展示出深度学习可以识别出戴围巾和帽子的示威者,或者看面部照片就识别出某人的性取向,这都让媒体增加了许多对于 AI 隐私安全的关注度。希望在 2018 年我们可以继续拓展关于 AI 伦理的讨论,而不仅仅是和马斯克一起害怕邪恶的超级人工智能即将到来;同时,监控、隐私权、对性别和种族歧视状况的采集也还有很大的讨论必要。