今天我们讲一讲关于利用蒙特卡洛树搜索(Monte Carlo tree search)来做风险评估。
首先我们需要了解他的基本原理:
通过上面的图,可以得知蒙特卡洛树搜索分五步:
扩展:若需要进行一个新的动作A,需要在节点L下创建子节点,任选其中一个子节点C进行扩展。
模拟:从C节点开始随机向下进行,直到找到最终的结果。
反向传播:记录下此次的迭代结果,为新出现的子节点评分。
重复1到4步,最后选择每项评分最高的节点,即我们所需的最优解。
蒙特卡洛树搜索的优点是......
停停停,我们不是来这里学算法的!
我们工程师经常会犯一个错误:当他想要介绍一个技术多么有用,可以带来什么效益,有什么好处时,却开始介绍这个技术本身了。最后工程师还不能理解:“为什么我解释的这么清楚了,他却依然不懂我在说什么?”
因为你可能没注意到:当你懂得了一个技术原理的同时,你就自动剔除了不懂时的记忆。
为何教小孩子很累?因为你认为是常识的东西,他并不能理解。你是站在“懂”的角度来看待这个问题的,而他站在“不懂”的角度。而这中间隔着很深的鸿沟。
虽然现在与你沟通的都是成年人,但是在技术领域中,他们也只是新手,还处于“不懂”的角度看待问题。枯燥的技术讲解并不能让你们的沟通变得高效。
那么,如何才能将让别人“懂”呢?
我们需要做到以下四点:
阐述结论,讲明效用
活用例子,允许偏差
少用术语,多用图形
相互沟通,加强反馈
1、阐述结论,讲明效用
在餐厅吃饭时,你不会在意厨师的切菜技艺多么高超,而是他做的好不好吃。
在买香水时,你不会在意里面的成分是什么,而是它香不香。
在挑手机时,你不会在意里面的工艺走线,而是它好不好用。
所以,在你介绍一门技术时,讲清楚有什么用,远比讲技术本身重要。
如果你看过我写的其他文章,你会发现我的文章都有清楚明了的加粗了关键词。
正和一本书的目录一样,这些关键词的作用在于,你哪怕不去看文章本身,你也可以从中大概预估到文章内容。
如果你找到了有兴趣的部分,就可以选择性阅读。这样大大减少了阅读的时间和精力。
和阅读时类似,你想要在有限的时间内将自己的想法让他人引起兴趣,首先就需要讲明结论和效用。
技术手段都是用来解决问题的。大多数人对技术本身不感兴趣,他们是出于“技术变现”的态度来了解这项技术的。你的技术介绍,是用来佐证技术的可行性,而不是来进行知识科普的。
我们需要抓住听众的核心需求。
如果他是老板,就告诉他效益的提升。
如果他是经理,就告诉他时间的节省。
如果他是客户,就告诉他产品的优势。
2、活用例子,允许偏差
很多情况下,利用一个大家常用的例子,就能很容易的解释一个看起来很高深的问题。
比如说初中课本里,我们在解释电流时,学生很难想象电流在电线中流动的样子。
但是如果将电流类比成水流,将电压类比成水压,将电阻类比成流阻,那么就能很清楚直观的将电流的基础原理解释清楚。
觉得这个太简单了?我们来解释一下区块链。
如果按照正常情况来说,你需要解释关于公共账本,分布记账,权益证明等等。
如果要更加深入的话,你就要解释SHA-256, 区块存储单元,默克尔树等等。
而我会利用非常简单一个例子:
假设我们有一个小村庄,每个人都担心其他人是坏人。那么怎么样才能在这种情况下将张三家的白菜卖给李四呢?
我们规定每家门口有一个邮箱,这个邮箱的邮件可以阅读,但是不能更改内容。
当张三要卖白菜给李四,他们要将“卖白菜”这件事情群发到所有人的邮箱里,然后每个人都要回信“我知道了”。那么,张三才能将这颗白菜才能卖给李四。
因为大家都了解“张三将白菜卖给李四”这件事情了,那么张三就不能将同一颗白菜再卖给其他人了。
那个邮箱就是区块链。
区块链的专业人士一定会觉得我这个例子十分不靠谱:哪有这么简单?而且根本没有讲清楚关于记账权,交易认证,分布式存储等等!
那么,你还记得牛顿力学原理么?
我们现在通过引力波证明了“牛顿力学原理是有偏差的”。那么为何我们中学还在教牛顿三定律呢?
因为大多数情况下,了解到基础知识已经足够于应用了。
而和非专业人士交流时,他们只想要了解其中的核心思想。所以适当的偏差其实并不影响技术的理解,还能利用生动的例子来引起他人的兴趣。
3、少用术语,多用图形
如果我们想要传授一个知识点时,专业术语是必不可少的。
但我们不是培训机构,不必利用专业术语来显示自己的专业多么强。过多的专业术语,反而更难让听众理解。
那么,我们如何才能让听众简单明了的听懂呢?
一图胜千言。
人是视觉动物。法国科学家就证明过,我们的视觉在150毫秒内,就可以将图片中非常复杂的信息读取出来。这也是为何我们到现在为止,都无法利用计算机来处理图片中,物体与物体间的关系的问题。正如下图,电脑无法识别“人站在羊驼旁”和“人被羊驼追”的区别。
所以当我们看见一张图片时,我们的大脑会其中的信息自动分类,而这样也能避免我们用语言沟通时带来的各种不便。
比如,如果你想告诉你同事,新开的那家牛肉面馆汤头多么的鲜美,面条多么劲道,肉料多么丰富。不管你用多浮夸的语言来形容牛肉面的味道,都不如直接给他发一张图:
看到这张图,他还不会心动吗?
所以,一张恰到好处的图片,完全可以替代你的所想所说。激发听众的自我思考,可以促进他们对知识的理解。
4、相互沟通,加强反馈
当你用尽量平实的语言,配合以图片和例子,将一个技术难题用生动形象的方式解释清楚。那么你还缺什么?
你还缺乏听众的反馈。
本杰明·富兰克林说过:“告诉我,我会忘记;教给我,我可能会记得;让我参与,我才能学会。” 我们很容易陷入自说自话的窘境。当你讲的时间过长时,听众就很容易走神。而减少走神的方法就是互动。
激活你和听众的互动,才能真正理解到听众了解了多少。
我们在讲解的过程中,很容易将自己代入老师的身份。
那你还记得你上学时最喜欢哪种老师么?
你是喜欢:
你们听懂没有?
你,来重新讲一遍。
这么简单都不懂。
还是喜欢:
大家觉得我哪个地方讲的难懂?
有没有哪里还需要我复述一遍的?
我们来画个图。
我们不能让听众产生“听不懂是因为自己笨”,而是“多交流就能解决问题”。
所以我们的互动不能是直接式,命令式的。互动方式应该是间接式,请求式的。
那么我们现在重新介绍一下蒙特卡洛树搜索。
蒙特卡洛树搜索可以减少50%风险评估时的工作量。是一个非常适用于风险评估师的辅助工具。
蒙特卡洛树搜索作为一种启发式算法,常用于不确定游戏中,例如著名的围棋大师,阿尔法狗(Alpha Go),就利用该算法打败了柯洁。
因为风险的不确定性也很强,所以我们可以利用这个算法来提升我们评估的准确度,从而大量节省评估时间和成本。
既然是树搜索,那么我们就用树来举一个例子:
一颗小树长大了,它需要向着阳光生长才能更好的吸收营养。
以下是先决条件:
太阳是按照一定规律运行的(信息对称)。
周围有其他物体遮挡,小树不知道具体在什么方位阳光最好(黑盒)。
小树的营养是有限的(时间限制)。
小树长得越高,就越能接近阳光(最优策略)。
我们从种子阶段开始,一共有四步:
随意向着一个地方生长。
如果这里光线温暖,就分配更多营养在这里增长(权重增加)。
如果这里光线暗淡,也不会停止生长,而是减缓生长速度(权重减少),直到发现这个地方的阳光更好。
重复1到3步。
最后,小树就能找到最合适的方向生长了。
这样理解的话,蒙特卡洛树搜索是不是一下子变得简单明了?
作者|卤豆干
来源|微信公众号:卤豆干(ID:ludouganquan),让我们用科学的手段,找到合适你的商业模式。
图片|全景视觉