预测者越能认识到自己的局限,对不确定性的影响越抱以敬畏,做出的预测就能相对更准确。
“预测行业”的声誉并不太好,那些名气很大的专家和分析师,看上去很高的预测正确成果,也多是数据剪裁加工的结果。尽管如此,人们还是不敢忽视天气预报机构、地震台等机构发布的警示信息,就算这种警示信息落空了若干次,但人们仍然承担不起因为忽略某一次“偶然”说对的警示信息而带来的沉重代价。
这就提出了两个问题,为什么不管是专家,还是作为普通人的我们,都会出现大量的预测错误?该怎么提高预测的准确性?美国统计学家纳特·西尔弗所著的《信号与噪声》一书,就对以上问题做出了解答。
美国2007~2009年金融危机不仅让华尔街多家顶级投行陷入向美国政府伸手要援助的窘境,更让评级机构陷入尴尬。以标准普尔为代表的评级机构在美国房地产泡沫、有毒债券泡沫破灭之前乃至破灭过程中,仍在发表带有极强误导性的预测结论。这些评级公司忽略了泡沫现象,严重低估了显示高风险的信息。
纳特·西尔弗指出,评级公司孤立判定许多项目内的风险,并在预估总体风险时将各项风险的概率相乘,这样就得出可以被忽略不计的极小数据;问题是,以次级债为例,涉及到的各个环节在风险上是相互连接的,即一个风险的爆发会触发其他的、系统性的风险,计算总体风险应该以最高风险值的项目为锚定。
并且,风险概率的存在,并不意味着风险事件将严格按照特定周期的时长出现,比如某金融机构出现坏账的概率为5%,这不能被理解为在头一次坏账出现后的第20年才会曝出第2次坏账问题。归结起来,预测常常流于错误,第一个原因就是我们对风险、概率等基本问题的不正确理解。
国际政治学者常常通过大众媒体和自媒体,发表对欧美国家政治选举的预测结论。一些学者的预测结论频频出错,并不是因为对影响政治选举结果的各项因素、风险、概率的理解出了问题,而是受到意识形态影响,在收集各方面信息得出预判之前在自己的大脑里就形成了先入为主的判断,认为自己的判断是“应当正确”的判断,拒绝接受与之相反的信息。
纳特·西尔弗将这种学者称之为“刺猬型专家”,分析指出他们虽然善于从噪声中辨识和捕捉信号,却遗漏和忽略了其他信号,预测正确率也因此降到了“路人”随机选择的胜率之下。先入为主、固执己见,就成为导致预测出错的第2项原因。
纳特·西尔弗建议人们要注意吸取“刺猬型专家”的教训,学会“狐狸型”的预测方法,用概率的方法思考问题、重视外部信息包括那些显示己方预判存在错误的信息,承认自己在做出判断时面临的局限性。
判断一个年轻运动员的成长潜力,球探的主观经验更值得信赖,还是基于计算机平台的数据分析系统更靠谱?计算机数据分析的优势在于,可以不带偏见的根据运动员过去和现在的训练、比赛准确数据,参照其他运动员的数据资料和成长轨迹做出判断,会帮助足球、篮球等职业体育项目的俱乐部从看似同等水准表现的运动员中,选出相对较好的一批;但要让这个优势得以发挥,前提在于数据系统对数据收集要做到准确、权重设置要趋于科学。
并且,计算机往往不能准确反映出年轻运动员的比赛投入、压力管理、协作意识等情况,而这些恰恰是资深球探所擅长的,后者往往还能以直觉从一群有潜力的新苗中挖掘出真正意义上的竞技天才。只重视那些实际上代表性存疑的数据,或者只依赖感性经验而得出预测,可归为预测出错的第3项原因。
具有讽刺意味的是,按照纳特·西尔弗的分析,导致预测出错的第4项原因,是预测者屈从于商业利益或社会观念压力而对预测结果所作的“技术性处理”。
如果一项天气预报结论显示下雨,实际上并没有下雨,民众顶多嘲讽预报机构“又错了”,但反过来,如果预报天晴却下了大雨,预报机构就会面临更大压力甚至诉讼。这直接推高了天气预报中的灾害天气比重。金融机构往往也基于同样的考虑,“报喜不报忧”,免得因悲观预报信息而流失客户。
预测的准确性有赖于预测者对不确定性的认识,预测者越能认识到自己的局限,对不确定性的影响越抱以敬畏,做出的预测就能相对更准确;反之,那些仅仅根据一套精妙的数据模型,或者在“大数据”系统的帮助下掌握更多信息而显得自信满满,对不确定性不屑一顾的人,就会非常明显的产生偏离乃至错误。