随着人工智能,AI(Artificial Intelligence)的应用前景逐渐明朗,各大高科技公司开始重金投资这个领域。2014年8月,IBM发布了模仿人脑神经元结构的芯片TrueNorth,功耗仅为现有芯片功耗的1/1 000。百度投资3亿美元在硅谷建立新的研发中心,并聘请人工智能专家、斯坦福大学的吴恩达教授担任首席科学家。吴教授是深度学习方面的专家,同时还是在线教育网站Coursera的创始人。
2013年初,谷歌收购了由深度神经网络理论提出者、“深度学习之父”、多伦多大学教授杰弗里·希尔顿(Geoffrey Hinton)创立的DNNResearch,并于今年1月以6.5亿美元的价格收购了英国的人工智能公司DeepMind。
人工智能时代要来了?还是已经来了?
人工智能应该用来做什么
人工智能应该用来做什么?这个问题从来不乏争议。
早在20世纪70年代,施乐PARC研究中心的首席科学家马克·威斯尔(Mark Weiser)针对信息爆炸的问题,提出人工智能的最高境界是像无处不在的小精灵一样,预测人类的需要,并自动提供相应的服务。他与MIT媒体实验室的创始人尼古拉斯·尼葛洛庞帝(Nicholas Negroponte)发生了激烈的辩论,后者认为人工智能应该是一种类似于机器人管家或仆人的Agent,根据人类的指令而行。
马克·威斯尔创立了“普适计算(Ubiquitous Computing)”这一重要的研究领域。继威斯尔之后,他的追随者相继提出了基于情景的计算(Context-Aware Computing),通过跟踪人的位置和行为,来分析其意图和需求,并自动去执行。
威斯尔本人用充满诗意的语言,去描述了人与智能环境无间共栖的场景:
清晨唤醒我的铃声,会与我今天上午日程表上的活动相关。快节奏预示着8点有重要会议,而舒缓的轻音乐则告诉我一上午都会空闲。我透过窗户上的透明显示器,看到家附近的各种过客留下的步履。紫色的爪印是小猫的,红色的是小狗的,绿色的则是人的。
2000年前后,惠普、飞利浦、诺基亚等厂商相继投入千万美元,赞助MIT和Stanford等科研机构,开展关于“情境智能(Ambient Intelligence)”的研究。微软和通用电气更是设立了自己的实验室,专门研究智能环境中的交互。
但是,由于当时的人工智能算法还不够准确,这些实验并没有最终进入产品阶段。2006年,也就是深度学习算法刚刚冒出苗头,还未被主流研究者所广泛接受的时候,人工智能研究者开始反思:无处不在的计算是否真的如马克·威斯尔所描绘的那样美好?
智能环境的设计师应该如何决定:哪些功能应该由机器自动完成,哪些应该留给人类来决定?以一个常见的智能家居应用场景为例:早上起床后,灯光会自动点亮,电视或收音机自动打开,窗帘拉起,浴缸里开始自动放热水,牛奶在加热,面包在烘烤……这似乎很惬意。但是,自动化不等于智能化,人不是千篇一律的机器,会有各种临时状况,每天的心情和感觉不一样,用户今天想去街上买豆浆喝,可是机器已经把牛奶热上了。
另一个问题是,人工智能作出的决定,应该由谁来负责?例如,智能家居决定停止空调运转,如果家中有婴儿,由于高温而受到伤害,那么是空调供应商,还是家居设计师,或是决定安装智能系统的家长来为婴儿的受伤负责?又如,无人驾驶的汽车发生了交通事故,坐在车内的人都没有控制方向盘,那么谁是肇事者?
威斯尔以前的合作者约翰·布朗(John Seely Brown)提出,人工智能不应该一味将人视为被动接受服务的对象,而应该给人更多主动选择的权利。不能一味用人工智能来剥夺人类思考的必要性,而应该找到一个合理的平衡点,让人可以继续拥有做创造性的思考和最终判断的权利。
带来第四次浪潮
英国科幻大师亚瑟·克拉克爵士曾说过:“任何一项足够先进的技术,初看起来都与魔术无异。”当魔术背后的玄机被公开,它的魔力就消失了。也就是说,一种技术一旦在日常生活普及,也就失去了那层让人觉得“智能”的神秘面纱。人手一台的“智能”手机,以及具有语音识别功能的Siri都是近在眼前的例子。
任何一个成功的技术都会经历“研发创新、早期应用、主流化、被更好的技术取代”这一周期。随着深度学习技术在学术界广泛研究和工业界的应用,它有望在不久的将来变成如同GPS和智能手机一样普及的技术。用户在经历了最初对它的效果的惊奇之后,也会习以为常。不使用深度学习技术的产品会如纸质地图和功能手机一样,变成老古董和异类。
21世纪将是人类从后工业化社会进入后人工智能社会的世纪。现在人们习以为常的垃圾邮件过滤、商品推荐、网页搜索,都已经融入了人工智能的元素。人工智能大范围普及之后,下一个革命性的技术是什么?有人预言是“人工知觉(Artificial Sentience)”。
事实上,机器智能之间的战争已经拉开了帷幕。例如,垃圾邮件过滤功能的基本原理就是用关键字、词频分析等自然语言理解的算法,来区分垃圾邮件和有用的邮件。然而垃圾邮件的制造者为了绕过自动过滤算法,会使用机器人自动产生读起来更像有用邮件的垃圾邮件。垃圾邮件产生器与过滤器之间的战争,在不知不觉中推进了自然语言理解这一人工智能领域的发展,最终甚至能够教会机器真正理解人类的思维方式。
谷歌自然语言理解项目的总监雷·科兹维尔(Ray Kurzweil)在近作《奇点将至》中提出,21世纪之内,电脑与人体的融合将成为可能,甚至将人的意识数字化后上传到电脑中,使人获得永生。
与此同时,人工智能将极大地改变商业模式和劳动力市场。诺贝尔经济学奖获得者保罗·克鲁格曼已经在构想人工智能技术普及带来的第四次浪潮,并称之为“偏袒资本的技术进步”——随着技术进步,工作机会将减少,而员工的工资将会降低。
正如工业自动化让福特通用汽车公司生产线上的工人失业一样,智能的机器算法将让一些传统的金领职员失业,例如:出纳、会计、精算、统计、股票交易。这些工作的共同特点,是基于重复经验所总结出的确定规则,从业人员执行的是一个归纳(Deduce)的过程。而深度学习技术最擅长的正是从海量数据中归纳出确定性的规则,并应用到新的数据上。
当然对于工作机会的减少,也有乐观的观点,例如谷歌创始人佩奇预言机器将大幅度提高整个社会的产出和效率,因此人们也就可以缩短工作时间。佩奇表示:“多数人喜欢工作,但他们也同样喜欢花更多的时间陪伴家人或者追求自己的业余爱好。而且这样做的另一个好处是,通过减少工作周数,你可以把工作分配给更多的人去做。”
会超越人类吗?
现在比较主流的人工智能,是用计算机算法来帮助人类完成一些任务。这种观点将人脑看成一个黑箱,通过收集这个黑箱的输入输出来模仿黑箱的功能。黑箱内部的算法与人脑的结构和机理相去甚远。但是,有一些特立独行的人工智能学者选择了完全不同的研究方式。
人类意识的核心就是在不同层次的“怪圈”之间的递归。如果我们联系深度神经网络的核心“自编码”算法,正是这种“指向自身的怪圈”。侯世达在发表《集异璧之大成》之后的几十年里,专心研究“思考是什么”以及智能和意识之间的关系。他在最近的一次采访中这样概括“思考”:“思考就是尝试去触及你身处境况的本质。”
迄今为止的机器智能,都还只是在模仿人类的逻辑思维,即意识的部分;而真正驱动人类行为的本源性的潜意识还停留在心理学领域,远没有被计算机科学家们充分认识,更谈不上模仿了。
作曲、编导、新产品设计这类凭借直觉的创造性工作,人工智能在未来10年里还无法取代。创造的实质是想到别人从未想到的东西,此时不仅需要应用现成的规则,更需要突破现有规则。引领时代的是设计,设计的核心是决定做什么,而技术只能跟随设计,解决怎么做的问题。
在创意驱动的产业,核心的资源是创新的想法,所以控制无形的知识产权(例如专利、版权)的机构和个人将获得最高的利润。美国著名的专利运营公司InterDigital只有290名员工,每个员工2012年带来的收入是93万美元。
相比之下,同是2012财年,苹果公司在全球雇用了8万个员工,这些人给公司带来了550亿美元的利润,平均每人超过69万美元。而遍布全球的44万名麦当劳员工,每人创造的利润则只有18万美元。
文/周涵宁 美国伊利诺伊大学电子与计算机工程博士、中国计算机协会计算机视觉专业组委员