快好知 kuaihz

从0到1”基础研究: 从人工智能三盘棋说起

“从0到1”基础研究: 从人工智能三盘棋说起

 国家科技部、国家发改委、国家教育部、中科院和国家自然科学基金委等五部门于3月3日联合发文《加强“从0到1”基础研究工作方案》,提出了很多切实可行的举措以加强“从0到1”的原创性基础研究,以鼓励我国科学家,尤其是青年科学家,开辟新领域、提出新理论、发展新方法,取得重大开创性的原始创新成果,抢占国际科技竞争的制高点。该方案出现得非常及时,是“破除四唯”的组合拳之一,是广大从事基础研究的科研人员,尤其是青年科研人员的“福音”。

由于该方案是全国性纲领性文件,以宏观原则和总体思路为主。 针对每个具体学科,还需要具体问题具体分析,提出相应的对策。 本文从现在热门的人工智能(AI)学科的发展,试图总结如何实现“从0到1”基础研究的一些具体的规律。人工智能自从1956年提出以来,其发展里程并非一帆风顺,也看不到今天的如日中天,走过的道路非常曲折,经历了三落三起。在每一次即将衰落之际,恰巧有一个大专家(团队)临危受命,以一盘棋挽狂澜于既倒,扶大厦之将倾。人生如棋局局新,幸亏棋局AI终复兴。

第一盘棋,是IBM的萨缪尔(Arthur Lee Samuel) 研制的西洋跳棋AI程序,在1962年击败了当时全美西洋棋冠军,引起了巨大的轰动。这个AI程序采用了机器学习中的强化学习技术,具有自学习能力,能不断提高弈棋水平。萨缪尔参加了人工智能起点的1956年达特茅斯会议, 是AI的创始人之一。他提出了“机器学习”的概念:让机器在学习中不断提高性能,并在跳棋程序中进行了实现。因此,一个AI跳棋程序,实现了2个“从0到1”基础研究:机器学习和强化学习,直到今天还影响深远。据说萨缪尔研究和完善这个程序化了约10年的功夫,做到了十年磨一剑。

跳棋AI程序把AI从谷底拉起,使得AI名声大振,让更多研究者获得更多的支持。但是,跳棋游戏还是有些简单,复杂度不高。之后,虽然有80年代神经网络的兴起,但是毕竟解决的都是些简单的问题(Toy Problem),大家慢慢对人工智能又失去了兴趣。此时,急需AI解决一个高难度的问题以重振士气。

国际象棋比跳棋复杂得多,国际象棋大师是人类智慧的杰出代表。从读博士期间,就专注计算机下棋的许峰雄博士,在IBM公司的支持下,花费约12年时间,终于研发出国际象棋AI程序深蓝(Deep Blue),具有超级运算,快速推理和搜索能力。在1997年5月12日,深蓝击败了棋王卡斯帕罗夫。当时虽然没有移动互联网,也有数以亿计的观众观看了现场直播,基本实现了AI家喻户晓,也再一次挽救了无数AI研究者和研究项目。深蓝也有2个“0到1”基础研究: 1.  将通用处理器和象棋加速芯片相结合,极大地提高了计算和搜索速度;2) 汇聚了诸多人类国际象棋大师的知识与智慧,形成了超级专家系统。

 

   在此之后,人工智能研究又平稳发展了一段时间。虽然在2012年,深度卷积神经网络技术,使得图像识别的精度大幅度提高。但是,图像识别还局限于人工智能很小的领域,知道的人不太多,在社会上反响不大。与此同时,人工智能的热度也在逐渐下降。如果任其发展,人工智能有可能再此跌入谷底。这个时候,AI急需一场更大的胜利来鼓舞人心。

     围棋是最复杂的棋类,复杂度远超国际象棋,围棋大师是人类智慧的最高代表之一。 AlphaGo是 由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。2016年3月,在数十亿互联网观众的围观下,AlphaGo以4:1战胜了世界围棋冠军李世石,终于引爆了人工智能,使之家喻户晓,妇孺皆知。AlphaGO实现了2个“从0到1“基础研究突破:1)将深度学习和强化学习完美结合,形成深度强化学习核心算法;2)将蒙特卡洛方法与深度强化学习有机结合,快速找到超级复杂问题的次优解。

 

从这三盘棋,我总结人工智能研究“从0到1“基础研究有三个具体思路。首先,AI研究要挑战各种人类冠军,比如中国象棋冠军,世界桥牌冠军和各类游戏冠军等等。各类人形机器人要与人类选手同场竞技,比如与博尔特比短跑,与费德勒比网球 等等。其次,要公开进行比赛,现场直播,尤其要网上直播,形成社会热点。AI研究水平,是骡子是马要牵出来溜溜。论文中的结果与仿真中的结果可信度不行,不太靠谱。必须要真刀真枪的公开比试,类似于我国古代的登台打擂。最后,要实现相互比赛,看谁家能独领风骚,一览众山小。 比如,谁研究的围棋程序能击败谷歌公司的AlphaGO,我们就承认他的AI研究水平达到了世界领先水平。 

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:人工智能  人工智能词条  说起  说起词条  基础  基础词条  研究  研究词条