即使是地球上最聪明的人,也低估了人类大脑的复杂程度。直到今天,智能机器距离人类的大脑依然很远。在这个世界上,一部分人选择看到丑恶与混乱, 但我选择看到美好的一面。
01:
让我们来做一个思想实验:
尽管人类经常干蠢事,但其实大脑非常强大,而且能耗只有20瓦。假如我们要造一个类似大脑功能的计算机,能耗将高达一万亿倍。
请问:假如人类发明了一种技术,每周可以让上面这个计算机的能耗降低一半,请问多久这个计算机可以和人脑一样高效而省电?
答案:只用40个星期。
2的四十次方是一个惊人的数字。
这背后的秘密是什么?
技术的指数级增长。
在过去的半个世纪里,摩尔定律一直“神奇”地令集成电路单位成本性能每18-24个月就增强一倍,结果就是,我们手上的手机,计算能力是当年登月的阿波罗飞船的1.2亿倍。
雷·库兹韦尔的核心论点是:加速回报定律。
他认为这是信息科技中的基本理论,它遵循可预见的指数级增长规律,反对传统的认为“你无法预知未来”的观念。
虽然仍有许多事情都是未知数(例如哪个项目、公司或者技术指标会在市场流行,中东何时能迎来和平),但事实证明,基础性价比及信息承载量却确确实实可以预见。
更让人吃惊的是,这些变化并不受战争或和平、繁荣或萧条等因素的干扰。
图片来自《人工智能的未来》
以此为“秘密武器”,雷·库兹韦尔保持了惊人的预测纪录,包括非常准确地预言AI将先后在国际象棋和围棋上战胜人类。
比尔盖茨评价雷·库兹韦尔是“在预测人工智能方面,我所知道的最厉害的人”。
对于未来,雷·库兹韦尔还有如下预测:
2045年左右,强人工智能将出现,奇点来临;
人类在本世纪内就可能借助机器实现“长生不死”的梦想;
未来人工智能将可能拥有自主意识,摆脱人类的控制;
22世纪中叶,纯粹的人类可能将不复存在。
他的如上预测,会实现吗?
02:
关于人工智能的预测,整体而言,人类并没有很好的记录。
在上个世纪60年代,人类发出了两个雄心勃勃的10年“壮志”:
一个是约翰·肯尼迪总统宣布:在10年内,人类将登上月球。
一个是怪才赫伯特·西蒙宣称:“我们离复制人类大脑解决问题的能力和信息处理的能力已经不远了。”
西蒙给的时间也是10年。
众所周知,看起来工程浩大的登月计划成功实现了;而破解那个不到1.4公斤的大脑,直到今天都毫无头绪。
赫伯特·西蒙绝非信口开河。他是一位罕见的跨界天才,拿过九个博士学位,在顶尖大学里担任计算机和心理学教授。他开创性地提出了决策理论,从事过计量学研究,是企业界和政府的聪明大脑。
赫伯特·西蒙看到了一个机会:用计算机作为对于符号(因而是对于思维)的通用处理机而非仅仅是用作算术运算的快速引擎。
1955年底,他与合作者发明了为计算机编程使用的列表处理语言,并利用该语言创造了首个通过选择性搜索解决非数字问题的计算机程序。
从此,计算机不仅会计算,还会“算计”。
赫伯特·西蒙自己用大白话解释道:
我们发明了能够思考非数值问题的计算机程序,从而解决了历史悠久的心/身问题,解释了由物质构成的系统如何能具备心理的特征。
借此,我们开辟了将大量以前只能由人类智能完成的任务进行自动化操作的道路,对研究思维提供了新的方法—计算机“模拟。
从此,一个旷日持久的争执开始了:机器能思考吗?
赫伯特·西蒙认为能。
1975年,赫伯特·西蒙荣获计算机科学最高奖——图灵奖。
1978年,他又拿下诺贝尔经济学奖。
然而,即使是地球上最聪明的人,也低估了人类大脑的复杂程度。直到今天,智能机器距离人类的大脑依然很远。
03:
追溯“智能机器”的思想萌芽,会让我们去到300多年前,遇见一个叫帕斯卡的人。
总有些人,神奇地出现在人类历史进程中的某个重要交叉路口,并且如先知般,将那些毫无头绪的要素汇在一处。
帕斯卡为人类点燃了三盏与智能机器有关的明灯:
(1)人对自我的认知
帕斯卡说人不过是一棵芦苇,是自然界最脆弱的东西。然而,这是一棵会思考的芦苇。
纵使宇宙毁灭了他,人却仍然要比致他于死命的东西高贵得多。
(2)会计算的机器
帕斯卡的父亲是位税务监督官,帕斯卡为了帮父亲减轻繁重的计算任务而设计出了这部机器,是17世纪唯一的机械计算器。
(3)概率思维与计算
帕斯卡和费马,在书信来往中,开始了对概率论这个数学分支的第一次实质性研究。
仔细想想看,感叹人不过是一棵芦苇的帕斯卡,和造出一部计算机器的帕斯卡,是矛盾的,用确定的数学知识,去思考看起来不确定的概率问题,似乎也是矛盾的。
这似乎暗示着,对于智能的思考,从来都不是单一命题,而是需要多学科的思维。
300多年后,我们知道帕斯卡的这三盏明灯分别对应着认知科学、计算机和算法。
04:
计算机的本质是用代码“模仿”人类的思想。要做到这一点,我们首先必须将思想“解码”。
亚里士多德认为逻辑是一切科学的基础,开创了形式逻辑学。
然而在他之后,逻辑学和数学都是各行其路,可计算和不可计算似乎是泾渭分明的。直到莱布尼兹开始尝试将二者联系起来。他结合逻辑学和数学,形成第三种创新思想,这就是所谓“异类联想”。
莱布尼兹发明了能够进行加、减、乘、除及开方运算的二进制,创立了符号逻辑学的基本概念,后来发展出“数理逻辑”这门学科。
莱布尼兹对于“一切皆可计算”满怀热情,据说他的口头禅是:来,让我们算一下。
1651年,托马斯·霍布斯在其名著《利维坦》中提出了一个开创性的思想:
从这个层面来说,“推理”只不过是“计算”,也就是对我们大脑中的一些符号与表达的结果进行加加减减。当我们独立计算时,称其为“符号”;当我们向他人展示与证明我们的计算时,则称其为“表达”。
随后,交织着伟大的思想和伟大的公式,不同的学科先后发生着融合:
1847年,午治·布尔成功地把形式逻辑归结为一种代数,创立了逻辑代数学;
1936年,图灵严格地描述了计算机的逻辑结构,首次提出了计算机的通用模型——“图灵机”;
1938年,香农用二进制系统表达布尔代数中的逻辑关系,把二进制运算与电子器件相结合,实现了逻辑功能,将逻辑映射到现实物理世界;
1945年6月,冯·诺依曼提出了在数字计算机内部的存储器中存放程序的概念,这是所有现代电子计算机的模板,被称为“冯· 诺依曼结构”。
如果我们跳出现代计算机的定义,还可以向前追溯至“通用计算机之父”巴贝奇,以及为他的机器编写了最早计算机软件的Ada。
也许是因为流淌着父亲——著名诗人拜伦的血液,Ada做出了远超那个时代的浪漫主义预测:机器不仅可以计算,还能够做谱曲,写诗,编织,以及别的更复杂的事情。
当我们从亚里士多德开始,回顾人类在发明计算机过程中的大胆探索,会有这样一个发现:思考“会思考的机器”,需要兼顾科学与人文的大脑,需要在智慧的不同疆界之间搭起桥梁,需要最大胆的想象力。
05:
今天,我们审视人类在“计算”和“智能”上所处的历史阶段,会不由得发出感慨:
我们的运气真好。
原因有三:
从蒸汽时代,到电气时代,再到信息时代,“计算”已经成为社会的基础设施。
人工智能在经历了过于乐观和过于悲观的起起伏伏之后,来到了一个新的转折点。
在软件时代有些薄弱的中国,有机会在云计算和智能时代弯道超车。
一切正在发生。
也许你觉得人工智能离你还有点远,AI似乎还是实验室里的概念,还在做些挑战世界围棋冠军这种很厉害但又“没啥用”的事情。
其实,透过互联网和智能手机,人工智能已经开始渗入我们每天的日常生活。
当你登录上淘宝,里面每一件商品、每一项活动,甚至每一张图片,它们的展示顺序、方式,都是智能后台根据你过往行为进行的定制化推荐。在你打开淘宝首页的一刹那,它们被一一摆放到了你想看到的位置。
当你通过登陆手机淘宝和手机天猫“召唤”新版阿里小蜜,就可以获得属于自己专属的智能服务助理,享受量身打造的服务体验。
“猜你想问”基于促销活动、用户偏好和购物场景等,主动判断你的需求和提问方向。
“服务管家”自动推送服务流程中的处理信息。不仅可以直接查看正在进行中的售后进程,处理完毕后还将自动推送结果信息给到用户,并打通热线、在线数据,实现用户“只来一次,只说一次”的极致服务体验。
我们似乎早习惯了中国电商和手机支付的便利。像那些平常住在海外的华人,例如我,回到国内,才会强烈地感受到一种似乎跨时代的科技先进性。
06:
科幻小说大师阿瑟·克拉克说:
“如果一个德高望重的老科学家说:‘这件事情是可能的’,那他可能是正确的。但如果他说:‘某件事情是不可能的’,那他也许是非常错误的。”
数字化和人工智能的指数级进步,重新定义了“远见”这个词。
我想问一个问题:马云聪明吗?
从数学和围棋的角度看,马云一点儿也不聪明,众所周知他的数学成绩很差。从马云自己讲过的往事可以知道,他在围棋上也没有什么天赋。
为什么一个看起来不太懂计算的创始人,可以率领一家算法时代的超级科技公司?
一个简化的答案是,马云自己不懂技术,恰恰让他避免陷入“过度拟合”的陷阱。我曾经说过,愿景是一种粗线条的算法。
在围棋上,不存在只靠大局观好就能够赢棋的。然而企业可以,因为你可以雇用比自己更聪明的人。在2019年的云栖大会上,我看见阿里云的那些良将们,不禁感慨:“不靠谱”的马云挑了一堆靠谱的人。
一个真相是:我们对现实世界所不知道的东西,要远远多于自己所知道的东西。但是,绝大多数人把“熟悉”当作“知道”,所以,人们总觉得至少知道自己世界的大多数东西。这只是一个幻觉。
在一个新兴的、快速发展的领域,一个专家可能比普通人懂10倍,但也只是1%和千分之一的区别。大家懂的绝对值都很低,二者蠢的程度是非常接近的。换而言之,一个承认自己蠢的普通人,可能比一个“总觉得自己对的聪明人”正确的时间还要多。尤其是在一个指数级增长的领域,老专家们的预测反而可能是错的。
马云聪明吗?按照我们传统的对智商的定义,他并不聪明,这让我们意识到,对“智能”的定义应该是多样化的。同样,在一个算法时代,我们对算法的定义也应该有更广阔的视野。但是他技术上的“外行”,以及受益于围棋的“大局观”,反而令他有一种与众不同的“远见”。
阿里是怎样成为一家技术领先的公司的?
说起阿里巴巴,我们脑中会涌现出“价值观”、“双11”等关键词。
但似乎是不知不觉间,作为商业高手的阿里,突然变成了一名技术高手:
在2019年“阿里云主论坛·飞天智能”上,阿里亮出了技术成果:
平头哥发布全球最强AI芯片含光800,打破业界纪录,性能及能效比全球第一;
全球前三、亚太第一的阿里云已构建起亚洲种类最全、规模最大的人工智能集;
阿里巴巴AI每天调用超1万亿次,服务全球10亿人;
日处理图像10亿张、日处理视频120万小时、日处理语音55万小时、日处理自然语言5千亿句;
阿里巴巴视觉智能日调用量超过1600亿次;
达摩院在国际顶级学术会议上累计发表450多篇论文,在自然语言处理、智能语音、视觉计算等领域算法夺得40多项世界第一;
全球23个城市引入了城市大脑。
“商业阿里”如何成为“技术阿里”,其实包含着两个悬念:
阿里的价值观优势,是如何延伸至阿里云和达摩院的?
为什么从全球范围内来看,商业公司成为人工智能研发的主战场?07:
让我们再次回到AI元年:1956年。
正是在那一年,科学家麦卡锡、明斯基、罗切阿斯特和香农等在美国达特茅斯学院召开“人工智能”研讨会,标志着“人工智能”这门新兴学科的正式诞生,1956年也被称为AI元年。
随后,人工智能经历了数次高潮和低谷。
第一次高潮(1956~1973年):第一个聊天程序ELIZA诞生。在西洋跳棋项目上,计算机开始取得“人机大战”的胜利。
第一次低谷(1974~1980年):1973年,英国著名数学家莱特希尔对当时的机器人技术、语言处理技术和图像识别技术进行了严厉的批评,并表达了对先前的AI投资未能产生预期收益的失望。
随后,各国政府和机构也停止或减少了资金投入,人工智能在70年代陷入了第一次寒冬。
第二次高潮(1981~1987年):由卡耐基梅隆大学开发的一款帮助顾客自动选配计算机配件的软件程序XCON投入实际使用,标志着“专家系统”从理论到实际工业应用迈出了第一步。深度学习”三巨头”发表反向传播算法论文,开启深度学习潮流。
第二次低谷(1987年~2005年):“专家系统”应用领域狭窄、推理方法单一、数据获取困难等问题逐渐暴露出来,同时无法自我学习并更新知识库和算法,导致维护越来越麻烦,成本激增。
1997年,IBM的深蓝战胜了世界国际象棋冠军卡斯帕罗夫。然而,胜利背后,是IBM的高速计算机资源、定制的国际象棋芯片、强大的国际象棋特级大师顾问团。
人们多多少少认为,这场计算机的胜利够“暴力计算”,而不够“人工智能”。
因为国际象棋的变化,相对而言不像围棋复杂得那样惊人–比宇宙间所有原子加起来还要多。
深蓝的研发者许峰雄,在2002年时这样判断计算机下围棋的前景:“它实在太难了,以至于在未来20年中可能得不到解决。”
第三次高潮(2006年至今,又称人工智能之春):计算机性能进一步提高,GPU加速技术出现,计算量不再是阻碍神经网络发展的问题。2012年的ImageNet年度挑战把深度学习和大数据推到前台,大量投资资金涌入。
2016年,AlphaGo打破了许峰雄的预言,战胜了世界围棋冠军,震惊世界。
AlphaGo围棋程序应用了近年来在人工智能领域有重大突破的深度学习(Deep Learning)和强化学习(Reinforcement Learning)等技术,加上谷歌强大的并行计算实力,可以说其“智能”水平已经远远超过当年的“深蓝”。
2018年AlphaGo之父哈萨比斯,创立了专注于人工智能研发的DeepMind公司,其目标是建立强大的通用学习算法,将技术应用于解决现实世界的难题。
这一目标,比以往任何时候都更具野心,但又似乎值得冒险。
回顾人工智能的发展历程,我们会发现这样一个秘密:人工智能其实是一个有点儿笼统的概念。
也许因此,人工智能研究人员倾向于组成不同的阵营,甚至会互相批评。这已经成为并且将继续成为进步的阻碍。
布莱·惠特比在《人人都该懂的人工智能》一书中这样写道:
“人工智能问题的领域如此广泛,人工智能技术应用的领域同样广泛……但是,人工智能研究人员常常只在自己的工具包里放置一种技术。”
为什么人工智能历史如此短暂,却会引发派系之争?
原因之一是:研究人员需要在激烈的竞争中争取到资金。
好消息是,在商业世界里,不同的技术路线的整合是可行的。
在这里,我们可以回答上一节的悬念之一:
为什么从全球范围内来看,商业公司成为人工智能研发的主战场?
答案如下:
企业里的研究人员更加务实,那些成功的商业人工智能产品,包含了不同的技术组合;
企业有数据、算法、算力方面的资源优势;
科技公司自身的主营业务,本身就是一个巨大的人工智能实验室;
有价值的人工智能研究,需要有具体的应用场景。在现实中“有用”,要比在实验室里“有效”,更能激励技术的进步。
那么另外一个悬念呢?
阿里的价值观优势,是如何延伸至阿里云和达摩院的?
一个原因是前面提及的“愿景”,马云因为是技术外行,所以没有受到技术细节的限制,反而拥有了“粗线条算法”的优势。
另外一个原因是,“商业阿里”与“技术阿里”的基因是一致的,那就是:敢于试错。
商业的阿里,是一家敢于失败的公司。例如从“来往”到“钉钉”,血战到底,卷土重来。
技术的阿里,信仰科学的方法。
科学的本质在于不断承认你是错误的,并接受新的、概括性更强的模型。
如路易斯•达特内尔所言:科学作为一个理解世界运作的体系如此有用,科学方法本身才是最伟大的发明。
08:
作为公司内部的独立实体,贝尔实验室是晶体管、激光器、太阳能电池、发光二极管、数字交换机、通信卫星、电子数字计算机、蜂窝移动通信设备、长途电视传送、仿真语言、有声电影、立体声录音,以及通信网等许多重大发明的诞生地。
贝尔实验室的科学家们一共获得过8项诺贝尔奖,其中7项物理学奖,1项化学奖。
真是神一般的存在。
前面提到的信息论之父香农,就是在贝尔实验室提出了香农定理。香农也体现了贝尔实验室科学天才们的特点:研究那些可能做出来产品的科学。
阿里的达摩院,是一个被阿里巴巴定义为“探索未来科技,为人类愿景而努力的科研机构”。
“达摩院”由马云亲自取名,从这个名字就可以看出他寄予的厚望。
在金庸的武侠世界里,达摩院是少林寺的最高武学机构,研究天下武学恩惠天下的天下观,是达摩院的精髓。
这种观世界、济天下的胸怀和情怀也融入了达摩院的初心。
短短两年,达摩院交出了漂亮的成绩单。
截至 2019 年 9 月,达摩院在国际顶级学术会议上累计发表 450 多篇论文,在自然语言处理、智能语音、视觉计算等领域算法夺得 40 多项世界第一,已成为阿里聚集科技人才和基础技术研发的 “技术基石”。
达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并取得多个世界领先水平的成果,包括自研的语音识别算法(DFSMN)、在机器翻译的国际顶级大赛 WMT 获 5 项第一,在被誉为人工智能世界杯的 WebVision 竞赛斩获冠军……
其中特别令人瞩目的是,在量子计算领域,达摩院量子实验室完成了第一个可控的量子比特研发工作,该比特的设计、制备和测量全部由达摩院量子实验室自主完成。此外,量子实验室也在着手量子芯片研发。
在指数式增长的数字化和智能化时代,达摩院还将创造什么奇迹?
09:
从2016年AlphaGo掀起的热潮迄今,人们开始对人工智能有更多不同角度的审视。
图灵奖得主朱迪亚·珀尔认为 :当下的AI只是曲线拟合,而不是真正的智能。
珀尔说,除非算法和由它们控制的机器能够推理因果关系,或者至少概念化差异,否则它们的效用和通用性永远不会接近人类。
朱迪亚·珀尔以人工智能概率方法的杰出成绩和贝叶斯网络的研发而知名。2011年,他因通过概率和因果推理的算法研发在人工智能取得的杰出贡献而获得图灵奖,被称为贝叶斯网络之父。
诺贝尔经济学奖获得者托马斯·萨金特说,人工智能其实就是统计学,只不过用了一个很华丽的辞藻。好多的公式都非常老,但是所有的人工智能都是利用统计学来解决问题。
南加州大学信息科学家巴特·卡斯科认为:人工智能=高速计算机上运行的老算法
所以机器不会思考。它们更类似于函数,即将输入变为输出。
他说,大数据和机器学习中最流行的两种算法:无监督算法,监督算法,都是现代统计学中同一标准算法——期望最大化算法的特例。大多数所谓的人工智能只不过是“机器爬山算法”而已。
麻省理工学院的一篇论文指出:
创建类人的学习和思考的机器需要他们能够构建出世界的因果模型,能够理解和解释他们的环境,而不仅仅是使用模式识别来解决问题。
这样的系统必须建立在物理(物理学)和社会(心理学)科学的基础上,才能具备对世界进行直观推理的能力,从而使机器能够“迅速获取知识,并将其推广到新的任务和情况中”。
然而,这些科学家们可能忽略了一个重要的现实:不管现在的人工智能技术是否算真的“智能”,它们真的很有用。
尤其对中国而言,因为没有经历过完备的信息化洗礼,大数据+人工智能,其实是顺手把“信息化”缺的课也全都补上了。
这就像在中国,移动支付被广泛应用的原因之一是信用卡不像国外那样普及,没有存量顾虑。
结果,支付宝把信用卡该办的事儿也办好了。
达摩院的技术研究有两个特点:
阿里自己要用。正所谓“己之所欲,方施于人”。
致力于成为全社会的信息化基础设施,技术的目的是造福社会。
“整个阿里巴巴的AI的调用次数已经达到了1万亿次,服务的人数已经达到了10亿人!我们在不知不觉当中,已经成为最大的一家AI公司。”
10:
你如何看待人工智能的未来?
我自己的态度是:乐观向往,参与其中。
我认同哈萨比斯的观点:“如果未来的世界没有AI,我会对这个世界非常悲观。”
技术上的指数级改进,有可能让人工智能实现巨大飞跃。
我对AGI(人工通用智能)充满期待。
人工通用智能(artificial general intelligence,AGI)技术将能够解决人工智能目前能够解决的更复杂的问题。
人们相信,创造有益的AGI将是人类历史上最重要的技术发展,有可能塑造人类的发展轨迹。
除了乐观向往,我还希望参与其中。
我创立的教育科技公司未来春藤,这一年来经历了超出我预期的快速增长。
未来春藤致力于成为亿万中国家庭的教育智能助理。
作为一家初创的小公司,我们能如何参与到人工智能的浪潮中呢?
我在2019年的云栖大会上发现了机会:达摩院所打造的云智能,作为底层基础设施,将成为大家的AI。
AI是云的内核,云是AI的形态。
人工智能是引擎,数据是石油。
达摩院提出“零时差上云”,步骤是:上阿里云官网,选择适用的AI能力,比如“语音合成TTS”,点击“申请开通”。
整个过程如此简单,30分钟就能够使用达摩院研发几年的语音、语言能力。
我期待未来春藤的App,能够借助最好的云智能技术,把最好的教育资源带给中国孩子。
结语
马云曾说,“动物讲究本能、机器讲究智能、人类必须坚持自己的智慧。”
人类,不仅是能思想的芦苇,也是会行动的实践者。
由人类创造出来的人工智能,是天使还是魔鬼?是开启新世界的钥匙还是终结人类的武器?
它的未来,由人类的集体意识和行动来决定。这个世界未来的算法,终将掌握在我们的手中。
在HBO的“西部世界”里,人工智能和人类展开了残酷的斗争,但是仍有一句话,闪烁着温暖的人性之光:“在这个世界上,一部分人选择看到丑恶与混乱, 但我选择看到美好的一面。”