快好知 kuaihz

生育率高估错觉何来:一道数学题告诉你

一、一个假想例子中的生育率错觉

在谈论人口趋势时,经常听到有人说,中国生育率根本不低,我家孩子班上独生子女并不多,好多同学都有兄弟姐妹,有人还有好几个。那么在这种情况下,生育率真的很高吗?通俗来说,生育率是指每个家庭平均生育的孩子数,下面我们通过一个假想的例子来探讨生育率估算中的错觉。

假设一个幼儿园小班有14个孩子,其中3个是独生子女,4个来自两孩家庭,3个来自三孩家庭,4个来自四孩家庭,那么他们的父母辈平均有几个孩子?换言之,他们父母的生育率是多少?

在这个小班的14个孩子中,独生子女只有3个,不到总数的1/4;来自三孩和四孩家庭的有7个,占了总数一半。看到这种情况,很多人的直觉是,这些孩子的父母生得太多了,这样下去人口会膨胀。这种直觉可靠吗?

要估算这个小班父母辈平均孩子数量,一个自然的想法是对孩子的兄弟姐妹数做算术平均。这里的分母是班上的14个孩子,分子是所有孩子包括自己在内的兄弟姐妹数的总和,即1*3 + 2*4 + 3*3 + 4*4 = 36。由此得出的生育率是36/14 = 2.57。

也就是说,根据这种估算方法,每个家庭平均生育2.57个孩子,给人的直观感受是孩子比父母多,人口要膨胀。

但其实这只是一种错觉,这种算法严重高估了生育率。这是因为生育率反映每个家庭平均有几个孩子,所以基本的抽样单位是家庭,而不是孩子个人。如果把这个幼儿园小班看成来自全社会的抽样,那么被抽取的是14个孩子,而不是14个家庭。

抽取家庭和抽取孩子的区别在哪里呢?反观之,如果在全社会完全随机地抽取家庭的话时,那么任何一个家庭不管有几个孩子,被抽到的概率都是一样的。但是在随机而抽取孩子时,孩子多的家庭被抽到的概率却要更大。因此,根据孩子兄弟姐妹数来估算生育率,需要考虑到每个家庭孩子数量多寡对家庭被抽取概率的影响。

由于一个N孩家庭对应于N个孩子,我们可以同等地说,一个来自于N孩家庭的孩子对应于1/N个家庭。按此关系,每个独生子女对应于1个家庭,每个来自两孩家庭的孩子对应于1/2个家庭,每个来自三孩家庭的孩子对应于1/3个家庭,而每个来自四孩家庭的孩子对应于1/4个家庭。

因此,幼儿园小班14个孩子对应于3 *(1/1) + 4*(1/2) + 3 *(1/3) + 4 *(1/4) = 7个家庭。由此可以计算出,平均每个家庭有14/7 = 2个孩子,远少于之前计算的2.57个孩子

按照数学语言,这里计算的是班上所有孩子家里包括自己在内的兄弟姐妹数的调和平均,也称为倒数平均。之前计算的则是每个孩子家里包括自己在内的兄弟姐妹数的算术平均。

当人们在进行直观的判断时,很自然会默认一个孩子代表一个家庭而使用算术平均,从而给予多孩家庭与孩子数量成比例的权重,但真正该使用的应该是调和平均。这是因为对N孩家庭来说,N个孩子才能代表一个家庭,与此等价的是一个孩子才代表1/N个家庭。简言之,根据孩子兄弟姐妹数来判断生育率时,人们的直观感受接近于算术平均,但其实应该使用的是调和平均。

如果每个孩子家里的兄弟姐妹数一样多,调和平均与算术平均相等。比如,如果班上所有孩子都是独生子女,算术平均和调和平均都是1,他们父母平均就只有一个孩子;又如,如果班上所有孩子都来自两孩家庭,算术平均和调和平均都是2,他们父母平均就是两个孩子

但是,如果孩子的兄弟姐妹数不等,那么调和平均就一定小于算术平均。不同家庭之间孩子数差异越大,算术平均就比调和平均大得越多,对生育率的高估错觉也就越严重。

二、假想例子中的人口趋势

前面的例子说明,针对各个孩子兄弟姐妹数这样的数据,我们应该使用调和平均,而不是更符合直观的算术平均来估算上一辈生育率。如果孩子的兄弟姐妹数不等,调和平均就必定小于算术平均。

但需要指出的是,即使使用调和平均依然会高估生育率,这是因为那些不婚不孕不育而没有孩子的家庭并没有被计入分母。

下图显示了这个幼儿园小班孩子父母辈的一种可能情形。在图中,7对夫妻有孩子,其中1对生了四个孩子,1对生了三个孩子,2对各生了两个孩子,3对各生了一个孩子。也就是说,7个家庭一共生育了14个孩子生育率为2。这与我们上节使用调和平均计算的生育率是一样的。

图1:8个家庭一共生育了14个孩子

但考虑到目前我国每8对夫妻就有1对不孕不育,图中还包括1对没有孩子的夫妻。在这种情况下,上一辈8对夫妻只生育了14个孩子生育率仅为1.75。再者,由于出生时男孩多于女孩,并且不是每个女孩都能存活到生育结束,孩子父母辈在出生时其实还不止16人。如果上一辈最初是17人,到孩子辈变成14人,这相当于每代人萎缩17.6%(即1-14/17),每两代人萎缩32.2%(即1-(14/17)^2)。

在人口统计学中,更替水平是指,维持孩子数量与父母辈持平所需要的生育率。根据中国出生男女性别比和女性存活率,中国生育率的更替水平大约为2.15,也就是说每对夫妻需要平均生育2.15个孩子才能保持孩子数量与父母辈持平。

相对于2.15的更替水平,图中1.75的生育率意味着每代人减少18.6% (即1-1.75/2.15),每两代人减少33.7% (即1-(1.75/2.15)^2)。也就是说,即使有一半孩子来自三孩或四孩家庭,独生子女不到1/4,人口依然可能萎缩而非膨胀。

也许有人会说,这个例子中很多孩子来自同一家庭,这与现实不符。比如,4个四孩家庭的孩子就来自同一个家庭。如果他们来自不同家庭,那么使用调和平均可能就不对了。但其实这是个误解。我们在上节的算法叙述中,完全没有提及这些孩子来自相同或者不同的家庭,因为这丝毫不影响计算结论。

只要每个记录表示的是孩子的兄弟姐妹数,算术平均反映的是每个孩子包括自己在内平均有几个兄弟姐妹,而不是每个家庭平均生育几个孩子。这两个概念看起来相似,但其实是不同的。不管数据是来自抽样还是完整的总体,我们都应该使用调和平均而非算术平均来估算每个家庭的平均孩子数。

为了让读者进一步熟悉这点,我们假设全社会每100个孩子中,独生子女有35个,来自两孩家庭的有20个,来自三孩家庭的有20个,来自四孩家庭的有15个,来自五孩家庭的有10个,那么孩子父母辈的生育率是多少呢?人们直观感觉的生育率是算术平均,即(35 *1 + 20 *2 + 20 * 3 + 15 * 4 + 10 * 5 )/100 = 2.45,但合理的估算应该是调和平均,即100/(35*1 + 20/2 + 20/3 + 15/4 + 10/5 ) = 1.742。

如果再考虑1/8的夫妻没有孩子的话,那么实际生育率仅为1.524。在这个例子中,虽然有为数不少的孩子来自四孩和五孩家庭,但生育率依然远低于更替水平。

三、对中国生育率的错觉

前面例子说明,即使两孩甚至三四孩普遍出现,实际生育率可能已经远低于更替水平。这点可在其他国家得到印证。例如,访问日本的人会发现,无论是在东京地铁还是在关西农村,两孩甚至三孩的家庭都很普遍,而独生子女却很少见。但日本其实是世界上生育率最低的国家之一。根据日本的官方数据,在过去10年间,日本生育率处于1.26-1.45之间。没有人质疑日本统计数据的准确性。

本文作者之一黄文政1992年刚去美国霍普金斯大学念博士时,曾与同系一位美国同学争论过中国的计划生育政策。这个同学叫Sterling Hiltton,来自提倡多育的大家庭,他自己一共9个兄弟姐妹,他妻子则有7个。他们夫妻当时的目标是五六个孩子,但最后仅有4个孩子,包括一位领养的黑人孩子。他们9个兄弟姐妹共有43个孩子

在早年的争论中,黄文政的立场是为计划生育辩护。但他毕业后在哈佛任教时,无意中看到易富贤的一篇文章列出了世界一些国家的生育率,发现东亚的生育率几乎垫底。这让他认识到,所谓中国人特别喜欢生孩子的看法完全是想当然,并因此开始怀疑整个人口政策的方向。之后他发现所有支持生育的观点都似是而非,咋乍一听很有道理,深入分析下却没有一条站得住脚。因此,在2010年回国后,黄文政就开始密切关注人口问题,并在2012年与开始与本文另一位作者梁建章在人口议题方面进行合作,呼吁取消生育限制并大力鼓励生育。

同年,黄文政想起当年与同学Sterling的争论,通过网络找到对方的电子邮箱,发邮件告知对方自己早年的观点是错误的,现在在中国呼吁取消生育限制。Sterling收到邮件后非常开心,回了一封长信,并附上了下面这张全家福。这是他父亲生日那天,父母和他们所有到场的晚辈和配偶和合影。照片中有57人,如果晚辈和配偶全部到齐有80人。黄文政自己是60后独生子,自己也只生了一个女儿。他的父亲与Sterling的父亲年龄相仿,如果父亲当时过生日,那么全家人在一起只有5个人,只有Sterling父亲全家福到齐人数的1/16。

图2:Sterling Hilton的父母及其晚辈,另外有23人未到场

按照直观感觉,身边的美国人就有这样的大家庭,那美国人口该爆炸了吧?但其实美国的生育率之前也不过是在更替水平附近,近年甚至低于更替水平。

中国社会对中外生育率的对比存在非常矛盾的反应。无论在国内的街头、景区甚至农村,很多人见到多孩的中国家庭都会觉得诧异,而他们在发达国家看到外国父母带着两三个孩子则会觉得理所当然。尽管如此,要说起生育率来,许多人却又顽固地相信中国的生育率要比发达国家高。例如,2000年人口普查就显示,中国的生育率就处于极低水平,有些学者就质疑,中国的生育率怎么可能比欧洲还低呢?

其实,即使在国内媒体上也能偶尔看见有关欧洲大家庭的报道。比如,2019年10月20日英国《镜报》报道,英国的一对夫妇兴奋地宣布他们的第22个孩子将于明年四月出生。尽管英国的多子女家庭很普遍,但现在英国的生育率也不到2。中国网络上针对这类外国多子女家庭报道的评论,大多是正面的,有人羡慕,有人祝福。相比之下,针对有国内多子女家庭报道的评论就比较负面,甚至一些读者因此认为中国生育率还是太高。

这种想当然的背后,除了此前提到的直观上高估生育率的错觉外,还有可能就是长期“一胎化”政策,让很多人把每家只有一两个孩子默认为正常状态。在这种潜意识的映衬下,目睹三四孩的所谓“超生”家庭很容易造成巨大的心理冲击。

这种冲击对那些居住在大城市的人们尤其强烈。他们普遍只有一个孩子,却看到外地年轻人源源不断地涌入。当他们再了解到,很多来自农村的年轻人都有好几个兄弟姐妹时,内心自然的反应是,计划生育实行了这么多年,怎么还有这么多“超生”的呢?由此,他们会错误地得出结论:农村实在生得太多了。

但即便农村年轻人普遍都有好几个兄弟姐妹,我们前面的例子也说明,这也丝毫不意味着当年的生育率有多高。何况来自农村的独生子女也不鲜见,这反过来说明中国当年农村的生育率早已经大大低于更替水平。过去二十多年的数据也一再印证了这点。

农村生育率大幅下滑的背后,是大量农村人来到城市工作和生活,面临着更大的生活压力,且脱离了之前的亲友氛围,传宗接代、养儿防老等观念都随之淡化。同时,农村的社会经济发展水平在逐渐提高,养育孩子的现实和机会成本都在增加。过去一二十年无数调查都显示,中国农村的生育意愿甚至都低于日本和韩国。那种农村生得很多的时代早已经过去了。

四、中国的生育率和人口趋势

中国的生育率处于极低水平确凿无疑。农村的生育率虽然整体上高于城市,但却依然远低于更替水平。随着城市化的提升,农村人口占总人口的比例会不断下降。这意味着,农村相对于城市较高的生育率对整体生育率的贡献会越来越小。到2018年。中国城市化率为60%。假设农村的生育率比城市高出30%,即使农村和城市的生育率维持不变,那么城市化率从60%上升到80%就会导致整体生育率下降5.4%。

全面二孩政策实施之后,出生人口一再大幅低于官方预期,也进一步印证了中国生育率的低迷。根据国家统计局数据,2018年出生人口为1523万,与此对应的生育率为1.46。但该年出生人口中有很大的比例来自二孩政策带来的生育堆积效应。由于生了一孩才能生二孩,而且根据目前的生育意愿趋势,生育了一孩的家庭最终可能只有一半会生育二孩,所以在生育状况稳定时,二孩数量大概只有一孩的一半左右。而2018年出生人口中,二孩却比一孩还多。这意味着,2018年1.46的总和生育率中还有约1/4可归因于暂时性的堆积效应。去掉该因素,自然生育率只有1.1。

这个判断并不离奇,因为在长期的生育限制下,中国城市已经把生育一孩当成正常的默认选择,而农村在向城市看齐。这是人类历史前所未有的现象。韩国社会并没有像中国这种把一孩当成默认选择,调查数据也显示韩国家庭心目中的理想孩子数超过2,比中国农村还高,但根据最新的数据,韩国生育率已经跌到1.0以下。有什么理由认为中国未来的自然生育率会大幅高于韩国呢?

在高生育率下出生的60后依然普遍存活的情况下,超低生育率导致的出生人口雪崩还不会表现为中国总人口的大幅减少。但如果生育率一直处于1.1的超低水平,不仅出生人口,而且总人口也将以每代人,也就是不到30年的时间,减少49%的速度萎缩。以后按照这个速度,10亿人口在30年内将会锐减到5亿。长此以往,中国人口的规模优势在几代人时间内就会消失殆尽。

这种衰减速度可能超过很多人的预料,这是因为在生育率恒定的条件下,人口数量变化是指数性的。对指数性变化,人们通常会高估短期趋势,而低估长期趋势。

谈到指数变化,很多人都熟悉这样的故事,在棋盘的第1个格子放1粒米,第2个格子放2米,之后每个格子的米粒数加倍,等到第30个格子就有10.7亿粒米。把这个故事反过来想,就是说如果每代人减半,只要经过30代,就是不到一千年时间,10亿人口的群体就会完全消失。当然,这只是按现在趋势进行的简单外推。如果在全面放开之后,大力鼓励生育,特别是减轻养育家庭的负担,让年轻人愿意生养,未来显著提升生育率也并非完全不可能。

我们希望用这篇文章说明的是,当人们感觉来自三四孩家庭的孩子非常普遍时,生育率可能还不到替代水平。当人们感觉二孩家庭孩子很多,但经常可以见到独生子女时,生育率就已经远低于替代水平了,出生人口在快速萎缩。当人们感觉到独生子女很普遍时,生育率早已经处于超低水平,出生人口在急剧萎缩就毫无悬念了。

实际上,只有在周围普遍都是来自三四孩家庭的孩子时,那些生一孩或不生孩子的家庭所造成的亏缺才能得到弥补,民族才有可能延续下去。如果你理解了本文对生育率高估错觉的解释,你应该会认识到,中国社会现在距离这种能够维持民族正常繁衍的生育状态有多么遥远。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:生育率  生育率词条  数学题  数学题词条  高估  高估词条  何来  何来词条  错觉  错觉词条