前段时间写了两篇关于诺奖的推送,今天接着来说些与诺奖相关的有意思的研究。
【第一篇研究】巧克力消费、认知功能和诺贝尔奖获得者(Chocolate Consumption, Cognitive Function, and Nobel Laureates)
这篇文章2012年发表在著名的新英格兰医学杂志(The New England Journal of Medicine)上,作者是Franz H. Messerli。
文章首先说明了食物中的类黄酮被证明可以改善认知功能。此外,一些研究报告表明黄酮类化合物中的一个亚类黄烷醇似乎也具有改善认知能力的作用。于是假设食用含有此类物质的巧克力不仅可以改善个人的认知能力,也可以改善整个人口的认知能力,从而探究一个国家的巧克力消费水平与其人口的认知功能之间是否具有关联,并将人均诺贝尔奖获得者总数作为代表该国家整体认知功能的数据。
基于这个假设,作者开始了他的研究。首先是获取数据,他从维基百科上下载的每个国家的人均诺贝尔奖获得者人数乘以1000万,得到代表每个国家每1000万人口中的诺贝尔奖获得者人数,然后从几个网站中下载了全世界各个国家的人均巧克力消费量数据。然后将得到的这两个数据进行关联分析。
根据分析得到的结果,发现在23个国家中,人均巧克力消费量与每1000万人中的诺贝尔奖获得者人数之间存在着密切的、线性的关系(r=0.791,P
并且,当剔除掉瑞典后重新计算时,相关系数增加到了0.862。通过计算回归线的斜率,可以估算出,要使得某国诺贝尔奖获得者人数增加1人,大约需要人均每年吃掉0.4kg巧克力。巧克力的最低有效剂量似乎徘徊在每年2kg左右,回归线显示,在每年11kg的最高巧克力剂量水平上,诺贝尔奖获得者人数没有明显的上限。
按这样的计算,中国14亿人,每年需要吃掉5.6亿公斤巧克力才可以获得一个诺贝尔奖。难怪中国获奖这么难,原来是因为大家巧克力吃的不够呀。真的不怪科学家,还是怪我们普通人吃巧克力不给力。
作者对结果进行了分析和讨论,提出了三个结论,总结起来如下:
第一:各国的人均巧克力摄入量能够影响诺贝尔获得者数量。
各国的人均巧克力摄入量与诺贝尔奖获得者数量之间确实存在着非常强的相关性。 虽然相关性不能证明因果关系,但是可以说明二者之间是相互影响或者是受共同的基础机制的影响。因此,既然已经有文献记载证明食用巧克力可以改善认知功能,那么巧克力的摄入量就有可能为诺贝尔奖得主的产生提供了所需的丰富沃土。但这仍然仅仅是假设,还有待检验。 从结果的图中发现,唯一可能的异常值似乎是瑞典,其人均巧克力摄入量为每年6.4kg,根据已有的线性关系可以计算出瑞典应该产生约14名诺贝尔奖获得者,但实际上有32名,是预期的2倍多。因此,要么就是斯德哥尔摩的诺贝尔委员会在评奖的时候带有某种固有的爱国主义偏见,要么就是瑞典人对巧克力特别敏感,即使是很少的摄入量也会大大增强他们的认知能力。
第二:反向因果关系,即:认知能力的提高可以刺激全国范围内的巧克力消费量。
认知能力强的人更了解黑巧克力中的黄烷醇对健康的好处,因此容易增加巧克力的消费量。 尽管获得诺贝尔奖这一荣誉的相关庆祝活动可能会引发广泛而短暂消费增长,但获奖本身就会增加全国范围内的巧克力摄入量似乎不太可能。
第三:很难确定一个可能推动多年来巧克力消费量与诺贝尔奖获得者数量的可信的共同点。
各国的经济地位差异以及地理和气候因素可能发挥了一定的作用,但这些因素并不能完全解释所观察到的巧克力摄入量与诺贝尔奖获得者数量之间的密切关系。
文章最后简单地说明了研究的限制并得出了结论:食用巧克力可以提高认知功能,而认知功能是获得诺贝尔奖的必要条件,而且它与每个国家的诺贝尔奖获得者人数密切相关。观察到的巧克力与认知功能改善的关联,是否是食用巧克力的根本机制还有待确定。
【第二篇研究】牛奶、巧克力和诺贝尔奖(Milk, chocolate and Nobel prizes)
在巧克力的研究之后,又有人在此基础上做了牛奶与诺贝尔奖之间的相关性研究。文章认为,巧克力通常并不会单独食用,而是会与牛奶搭配,或是混合的巧克力牛奶,所以该篇研究采用了与巧克力相同的方法去探究牛奶消费量与诺贝尔奖之间是否存在关联。得出的结论与巧克力一文的结果基本相同,值得注意的一点是,与牛奶的相关性研究并没有发现瑞典存在异常,说明巧克力研究者Messerli提出的爱国主义偏见并不存在,所以要想提高自己获得诺贝尔奖的机会,不仅要多吃巧克力,或许还要喝牛奶。
那么,事实是否真的如上面的研究结论一样呢?多吃巧克力和牛奶就能提高获得诺贝尔奖的机会?稍微有点常识或者做过研究的人听到这个结论都会觉得很不靠谱。(我很奇怪这种文章能发表在新英格兰医学杂志这样的期刊上,我n多年前本科生做小组课程汇报已经比这个做的好很多了。)
但是从统计数据来看,牛奶巧克力的摄入量确实又与诺贝尔奖获得者人数存在着非常强的正相关性,这又该如何解释呢?
其实,如果这种相关性发生在个人层面上,那么结论可能会有很大参考意义,全世界的学者无疑会按吨订购巧克力和牛奶,从而实现他们终身的梦想。然而,他们采用的是生态学分析,所得的数据是按国家汇总的,所以结果表明,巧克力和牛奶消费量高的国家往往产生了更多的诺贝尔奖获得者;但关键是,我们不知道获奖者本身的饮食习惯是什么。
由此引出了这些研究产生谬论的关键点:生态学谬误。简而言之,就是说在总体水平上发现的关联,不管是以国家、城市甚至是更小的群体为单位的总体,都不一定适用于生活在那里的个人。这种生态学谬误和关联很常见,例如,世卫组织统计的冠心病标准年龄死亡率的数据,与获得诺贝尔奖有很显著的关联,虽然0.41的相关性是低于与巧克力消费的相关性的。但这是否说明了一种因果关系:获得诺贝尔奖会缩短寿命吗?
许多生态学研究在收集个人数据时并没有显现出生态学谬误,在总体水平上发现的关联往往在个人水平上也有发现。然而,这种谬误始终是一种可能性,因此必须非常谨慎的解释这些研究的结果。
Messerli使用的数据还有一个重要问题,巧克力消费的数据是基于近期的消费。如果巧克力消费对获得诺贝尔奖的倾向有影响,那么消费必须是在获奖之前,在某些情况下还需要在100多年前的数据。收集这样的数据会很困难,尤其是在个人层面。如果对获奖者以及其他背景相似但未获奖的人进行巧克力消费调查,那么时间方面的问题将变得非常重要。如果发现得奖的人比未得奖的人吃的巧克力更多,这也可能是一个反向因果关系的例子——也许他们通过出去吃巧克力来庆祝他们的奖项呢。
此外,还可以从方法论、统计学和逻辑学的角度对巧克力、牛奶与诺贝尔奖的相关性研究结论提出质疑。
在方法论层面,也就是前面提到的整体与个体层面的问题,观察到的相关性是基于国家平均巧克力消费量而不是基于诺贝尔奖获得者本身的实际消费量。这样的解释就导致了一个重大的问题,即所谓的生态学谬误。另外,巧克力消费的相关数据只涉及了最近两年,而诺贝尔奖获得者的数据分布在一个多世纪的时间里,上文也提到了,这种时间上的差距显然会限制相关性分析的针对性,因此近期的消费量不能作为过去一段时间的良好估计。更重要的是,巧克力只是众多含有黄酮类物质的来源之一,如果食物中的黄酮类物质的数量是关键的解释因素,那么其他含有此类物质的食品消费量也应该被考虑进来。并且,已经有人做了类似的统计,在同样的23个国家中,茶叶(r=0.03;P=0.88)(图A)和葡萄酒(r=0.16;P=0.47)(图B)的年人均消费量并没有这样的相关性。
在统计层面,需要注意的是,相关性从来不意味着因果关系。有许多例子表明,对相关关系进行因果解释是没有意义的。与巧克力牛奶类似的相关性研究还有很多,如下图中的每千万人口中诺贝尔奖获得者人数与宜家店数量之间的相关性(图C)。我们发现宜家家具店的数量和诺贝尔奖获得者之间有难以置信的高相关性(r=0.82;P
在逻辑层面上,即使知道并牢记相关性并不意味着因果关系,但当高相关性与合理的解释同时出现时,很容易推断出变量之间的某种松散的倾向性。毕竟,黄酮类物质的摄入对人群认知功能的有益影响是可信的,听起来肯定比诺贝尔奖可能导致更多的巧克力消费的反向因果关系更符合逻辑。因此,尽管那篇文章作者承认观察到的相关性不能直接解释为反映因果关系,但讨论倾向于排除其他解释,并提出巧克力消费量越高,诺贝尔奖获得者的数量就越多。然而,即使有表面上有意义的关系,也不能直接得出从相关性到方向性的解释漂移,因为,由于不能排除分别影响两个变量的隐藏因素,总是可能涉及第三种原因的谬误。
例如,在本案例中,我们推测GDP作为衡量一个国家生活水平的指标,可以同时对奢侈食品消费和科研水平有影响。正如我们所猜测的那样,结果发现GDP与诺贝尔奖获得者人数(r=0.66;P<0.001)(图D)和巧克力消费(r=0.73;P<0.001)(图E)都有很强的相关性。此外,利用Fisher r-to-z变换,可以对不同相关性的强度进行统计比较,我们发现,原始的巧克力诺贝尔相关性(r = 0.79;P
总而言之,相关性不等于因果性,要得出因果关系还需要进行很多更加严谨的论证、检验与解释。尤其是在一些特殊的研究中,一个错误的推论很可能会导致将有益(或有害)的影响归结于错误的原因,从而造成巨大的危害和损失。