如果真的希望获得比别人更强的能力,要超级勤奋,Work Super Hard。
方法论重不重要?非常重要,但当你的方法论精进到极致之后,你还是得回到最最根本的勤奋,甚至是可怕的勤奋!
那做到可怕的勤奋就够了吗?依然是不够的。
可能我们只是在原地打转,一直在努力做些事倍功半的事。
所以,我们还得再加上两个字——“高效”,高效而可怕的勤奋。
— 1 —
前两天,教育部一则新增 35 所高校“人工智能”本科专业的消息,引发了社会的广泛关注。
这意味着人工智能将以更快的速度和更猛烈的势头,融入我们生活的方方面面。
大多数人对于人工智能的认识,应该是从 AlphaGo ——那个让棋手们咬牙切齿的机器人开始的。
AlphaGo 把“高效而可怕的勤奋”体现得淋漓尽致,大数据和人工智能技术,让它建立了每一步都有反馈的学习机制。
如果你了解到更多 AlphaGo 的“成长历程”,可能你也会跟我一样,从叹为观止,到不寒而栗。
— 2 —
2016 年 4 月,AlphaGo 战胜李世石;
2017 年 5 月,AlphaGo 战胜柯洁。
出现在柯洁面前的 AlphaGo 早已今非昔比,这一年里,它从 1.0 版进化到了 2.0 版。
差别在哪里?
1.0 版战胜李世石的 AlphaGo ,先学 10 万局棋谱,把全人类的经典棋谱尽收眼底。
然后,分析棋局定式和得失,最后生成了自己的策略算法。
但是后来,开发 AlphaGo 的公司 DeepMind 觉得这还不是最强形态。
就算是把人类的 10 万局棋谱学过来,只不过相当于古今中外所有围棋高手合战一人罢了。
可以下赢一个李世石,但也注定比李世石高不到哪儿去。
如果对手无比强大,可能一拥而上再多人也不是对手。
于是,有了后来的 AlphaGo 2.0。
AlphaGo 2.0 与之前最大的不同是:没有棋谱喂养。
工程师们只告诉 AlphaGo 最基本的围棋规则。
大概就是黑先白后、交替落子,怎么算输、怎么算赢……
然后,找两个这样的 AlphaGo 围棋宝宝,开始对弈。
从 0 开始学,从 0 开始下,下了多少盘?
第一天嘛,先下 100 万盘,试试水。
就这样,每天 100 万盘……
2.0 版本的 AlphaGo ,不再跟人类学怎么下围棋,而是跟自己学。
这时的 AlphaGo 肯定不知道什么是相思断、无忧角……
但它们知道谁输谁赢,甚至还能复盘棋局,为每一步打分,推测哪一步对、哪一步错、哪一步可以更好。
基于规则和输赢,AlphaGo 建立了反馈体系,根据每天的 100 万盘,AlphaGo 开始不断优化算法。
就这样,每天下、不断学……
直到柯洁出现,这时,AlphaGo 跟柯洁早已不是同一量级。
或者说,它已经超越了整个人类的围棋水平。
聂卫平讲过一句话:
AlphaGo 最可怕的地方在于——
它终于让我们知道,人类其实根本就不懂围棋。
过去,人类对围棋的理解,从一开始,可能就被我们有限的知识框定了。
基于反馈机制的学习,才是真正的高效而可怕的学习。
— 3 —
我们再来看几个 AlphaGo 的学习片段,看看什么是高效而可怕的学习能力。
AlphaGo 诞生之后,为了检验它的学习能力,DeepMind 做过一个测试。
让它挑战简单的电子游戏——打方块。
很多人小时候玩过这游戏,屏幕下方有一个小球拍,球掉下来时,你要控制球拍把球挡回去。
屏幕上方有很多砖块,用小球把砖块一个个打掉,全打完就算赢了。
这游戏的规则和输赢标准特别清楚,先跟 AlphaGo 明确了底层反馈体系。
与下围棋一样,一旦建立了规则和反馈体系,根本不用教它“应该”怎么玩,反正你就去玩吧!
接下来,我们观察他的学习方式。
这是它玩了 100 局的结果——
这个阶段,球拍在 AlphaGo 的控制下,显得特别的木讷,都不知道该往哪动,很多球接不起来。
然后,它自我学习了 200 局之后——
你是不是明显感觉到它的身法灵活多了?它逐步开始对球的落点有了判断。
继续进步,这是 400 局练习之后——
每个球都能接起来,非常棒!
好,时间来到了第 600 局,可怕的事情发生了——
你看出什么没?
从来没有人教过他这种打法,可能就连你以前也没这么玩过。
但是,玩着玩着,因为有一套底层反馈机制,AlphaGo 最后自己建立了一套策略。
这个策略是,它发现打开一个缺口之后,把球弹上去,球在中间不断的弹弹弹……效率是最高的、移动次数是最少的。
第一次看到这个视频的时候,我觉得特别“可怕”,不寒而栗。
AlphaGo 拥有了我们过去认为只有人类才会拥有一种东西,叫做智慧。
之所以人工智能在今天如此强大,是因为它拥有的深度学习能力——基于策略的不断反馈、持续优化。
更可怕的是,它不光比我们会学习,还比我们更勤奋——高效而可怕的勤奋。
— 4 —
怎样把这个逻辑运用到人的身上?
其实就是我们经常说的——刻意练习。
刻意练习,不能重复地做过去一直在做的、自动完成的动作。
有一本很著名的书,书名就叫《刻意练习》,可能你也看过。
书里介绍了 3 个建立反馈的方法,特别生动形象。
第一个建立反馈的办法,我们称之为音乐模式。
什么叫音乐模式?
钢琴水平是怎么练出来?我身为一个外行,认为肯定是对着琴谱弹呗。
可琴谱可能早在几百年前就写好了,所以钢琴家们不断练的是什么?
是钢琴的演奏表演的能力,练的是手法、是节奏。
钢琴家们会用录音,发现练习中的错误,然后纠正。
刻意练习中的音乐模式,就是把这一小段琴谱,切割成一个个小段,每个段落循环练习。
还有哪些能力,是用这种方法来训练出来的?
最具代表性的,就是演讲能力。
你必须要能站在台上张口去讲,讲完每一场,结合大家的反馈做出调整优化。
甚至架个摄像机,把你演讲的过程拍下来,然后你一看视频回放,发现——
我的腿为什么一直在颤抖啊……
我的身体怎么一直往后躲啊……
我怎么说了那么多“然后”啊……
这些是平时感觉不到的,就必须通过观察和反馈,不断纠正。
发现了不足怎么办?下次再讲,再录一遍,不断重复这种练习。
我曾经写过一篇文章,是关于我从高中开始学习辩论和演讲的故事,年少的我误打误撞,进入了刻意练习的音乐模式。
一次次,一段段提高能力,你的水平才会真正的提高。
演讲、唱歌、表演……这些技能只有借助音乐模式的反复训练,才会变成你的能力。
第二个建立反馈的方法,叫做国际象棋模式。
简单地说,在这个模式下,能力是可以通过找到对手、学习高手来获得的。
以下棋为例,人类学习下棋,水平提升的快慢,很多时候取决于陪练的水平。
所以,研究高手的棋谱,是棋手们常用的训练方法。
比如辩论这种能力,如果没有对手跟你真刀真枪地战个痛快,可能很难练出来。
再比如说商业,也是当你找到了对手、甚至是宿敌,你才能被激发,真的顿悟。
这就是为什么,很多人经常在说百战归来再读书。
你只有在战争中,才能学会战争。
第三种建立反馈的模式,体育模式。
体育模式需要我们对单项技能反复练习。
比如说游泳,有个运动员非常厉害,叫菲尔普斯。
你想过一个问题没有,菲尔普斯都是世界上游泳最快的人之一了,还有人有资格做他的教练吗?
如果没有的话,那奥运冠军岂不是都没有教练?
但真相是,不论一个运动员多么厉害,旁边都要有个教练。
既然教练的比赛成绩不如运动员,那他们的工作是什么?是基于运动项目的方法论和训练产生的反馈体系,来帮助运动员不断提高。
踢足球时,什么位置的任意球要怎么发?
长跑或短跑时,每个阶段的步子迈多大?
骑自行车时,什么时候站着什么时候趴下?
所有运动项目的背后,都是行之有效的逻辑和方法。
不是去跟游泳最快的人学游泳,而是要在单项上,用专业方法训练自己,借助教练的专业知识和经验给自己反馈,这是体育模式给我们的启发。
最后的话
很多人号称自己有 10 年工作经验,其实,他只是把 1 年的工作经验,重复了 10 次而已……
重复,不带来进步,真正的进步,来自“刻意练习”。
所谓的“刻意练习”,是因为不断反馈、调整,每一次都比上一次有进步。
每个领域最杰出的人,往往是刻意练习时间最久的那个人。
在 AI 时代,很多我们曾引以为傲的能力,被“初生”的人工智能碾压,这也让我们变得愈发焦虑和不安。
但每个时代都不乏“天才”,当下更是如此。
找到你的激情和梦想,拥有百折不回的坚毅,掌握刻意练习的方法……
然后,千万千万记住,还有勤奋、可怕的勤奋,甚至是高效而可怕的勤奋。
这样,你会离目标更近一些。
图片:全景视觉