美国企业研究所的分析师Derek Scissors在上周发表文章,文章参考了瑞士信贷(Credit Suisse)在2014年10月进行的一项研究。该研究旨在对分国家、分地区的家庭总财富进行测度。在就中国是否取代美国成为全球最大经济体的无止境争论上,Scissors认为人们普遍认为,比较两国GDP是得出正确结论的唯一方法。一些人认为现行汇率下的名义GDP是一个合适的指标,而另一些人更偏好对其进行购买力平价调整。Scissors指出,两者可能都不合适:
哪一个国家是全球最大经济体是存在争议的。一些人引用GDP的购买力平价调整值,认为中国是全球最大经济体;然而依据其它很多指标,美国又处于领先地位。这些观点被用于衡量中国的重要性,强调中美竞争关系,并且在某些情况下被用于支持中国威胁论。
毫无疑问,中国相较于美国是一个新兴经济体。人们认为,即使中国目前尚未处于领先地位,那一天也终将到来。尽管如此,这个论点中至少包含一个存疑的指标:国民财富。自2008年始至2014年中期,中国或已在国民财富方面落后于美国。
Scissors指出,“根据瑞士信贷计算,美国净私人财富总额为42.9万亿美元,而中国则为4.7万亿美元,两者比值超过9:1”,这意味着美国比中国富有8.1倍。然而两国的GDP比值与上述比值差异巨大。中国宣布2014年年末GDP总值达到了9.18万亿美元,而美国是16.77万亿美元,后者仅为前者的1.8倍。
这初看或令人感到奇怪。GDP是衡量一国在给定时间段内总财富创造量的指标,常与一个行业创造的收入进行类比。我不确定瑞士信贷对家庭总财富的估值意味着什么,但是如果我们认为它等同于(或至少正比于)一个经济体所拥有的资产、生产及提供服务能力(依附于中美人民的劳动力)的总市值,那么同样一美元收入在美国的价值就是在中国的五倍。类比股票市场,美国的市盈率就是中国的五倍。
这种情况合理吗?答案是肯定的,尽管我提到的“五”这个倍数并不是精确值。美国当然比中国有更大的“倍数”,但这个倍数究竟是多少是不可能证明的。虽然人们关于中国经济是否最终会超越美国,以及这可能何时发生(这个问题格外有趣)并无争议,我确实认为两国的相对经济价值问题引人入胜,因为它反映出中国经济状况,并且对我们理解经济发展有很大作用。
但是在我说明为何美国显然拥有一个更高的“倍数”之前,我将先回到GDP这个问题上。一国的国内生产总值,即GDP,被认为是其在给定时期内生产的商品及服务总价值的理想度量指标,包含了其资本存量的所有增减。OECD组织将GDP定义为“对参与生产的所有居民、机构单位产出的总价值的度量(并且对不在计算范围内的产品,加上全部税收收入并减去补助支出)”,尽管这一定义或许不那么“优雅”。
GDP有何优越之处?
众所周知,GDP理应反映一国(或地区)在给定时间段内的经济财富创造量。然而同样广为人知的是,这种反映并不十分精准。Simon Kuznets在1934年向美国国会递交的一份报告中首次“发明”了GDP这一概念。他意识到GDP的缺点,并且一直在警示其可能的误用。GDP的问题在于,在其标准算法中包含了很多要素——例如一些人提议将国防开支或者经纪费纳入口径——而这些要素并不能反映其所属经济体在提供商品和服务能力上的变化,同时另一些有反映能力的要素却被排除在外。后者最典型的例子就是我们所讲的正负外部性。例如,一家将臭水排到附近河流的制造化学产品的工厂可能带来很大的正面经济价值,但这种污染行为会带来经济成本,包括未来农业和渔业更低的回报,未来更高的医疗卫生支出,对未来旅行者、泛舟者、自然爱好者的福利损害等。假如我们忽略了这种经济成本,那么这种化学产品生产过程对GDP的贡献就会高于其实际价值。
此外,只有存在于现金经济记录中的项目才能纳入GDP统计口径。相比于酒保,娼妓和毒贩提供的消费性劳务价值很高,但他们的活动未被包含在GDP的计量中(虽然一些国家的经济学家正着手于此)。由中介机构提供的托婴服务包含在GDP中,然而假如这一服务是由邻居或亲戚无偿提供的,它就没有包含在GDP中。有一些项目未被认可为家庭消费的一部分,然而我认为作为消费性劳务它们的价值很高。毫不夸张的说,谷歌的搜索功能显著地改善了我的生活,我确信它提高了我本人以及全世界的福利,而其对全球GDP的贡献远不足以反映这一影响。在办公室、家甚至出租车上,我都能获得大量信息、参考文献和数据,获取这些资源加在一起原本会耗费我数周的时间。或许并非所有人都像我一样对此感到满意,但如果失去互联网搜索服务,我受到的打击远大于丢掉一辆车或全部衣服。
换句话说,GDP毫无疑问并不能衡量我们认为它能衡量的东西,但这并不意味着GDP只是一串无用的数字。有两个理由支持花费时间和精力来计算GDP。首先,只要我们持续提醒自己GDP计算中可能出现的错误,并且努力消除它们,那么在非正式情况下,GDP就能用作对财富创造值的一个粗略估计。其次或许更重要的是,GDP让我们能够对不同经济体或经济体不同时间段的经济状况进行比较。
事实上后者是GDP的主要用处,并且在这一方面GDP的度量十分精准。但这种度量的效用是有条件的,尽管这些条件很容易罗列,但人们对其理解甚少。同时令人有些惊讶的是,即使是经济学家也经常违背这些条件限制。GDP的计算可能无法精确反映实际价值的创造,并且有时这些误差十分巨大,但只要这些“误差”是一致的、同一方向的,那么对GDP数值进行的比较就依然有效,依然可以是十分精准的。例如,2013年统计美国GDP时产生的误差很可能与2014年的一致,故而计算得到的两年间GDP的比值,或者说GDP增长率,可能很接近美国的实际经济增长率。
同理,就价值创造来看,对加拿大和英国的GDP计算存在一些错误,这些错误很可能与计算美国GDP时发生的错误是一致的。当我声称根据GDP统计,2014年末美国的经济总量是加拿大的9.1倍,是英国的7.4倍时,我对这些数据的准确性很有信心。尽管如此,当涉及到其他国家时,我应该对GDP比值对提供商品与服务的实际价值比值的代表性保持审慎。
尽管一些人可能自然而然地理解了为什么上述比值在一些国家之间比在另一些国家之间更可靠,我将在接下来的文章中说明,并非所有经济学家都有这个直觉。虽然不同国家在计算GDP时的确采用不同口径,但这不是问题的关键。正如Hyman Minsky所充分阐明的,真正的原因在于经济体作为一种系统,是由互相连锁的资产负债表组成的,并且其内部经济活动依附于这些不同决算表之间的联系,而在不同经济体之间这些制度化结构是很不一样的。
“所有经济活动,特别是经济的快速增长,都会导致系统内部的不平衡,而这些不平衡最终总会被过度补偿而转到相反的方向。”这是Albert Hirschman最深刻的见解之一,而我认为很多经济学家们对此仍然不完全赞同。尽管如此,不平衡的转向方式在不同经济体之间差异巨大,并且受到这些经济体内部结构的限制。在某些情况下——例如当某一经济体的国有部门很强大,或当它严重依赖于某些商品,或当它被其他高度集中的部门主导(或许包括美国,在那里银行业以惊人速度集中),或当它内部庞大的农村失业人口涌入城市中心,或当它的商业活动高度腐败、官僚化,等等——这些制度会扭曲再平衡过程,或是对此造成长期阻碍以至于经济体内部的不平衡程度很深。
这些深度不平衡在GDP的计算中都会造成同样严重的系统性误差,而这违背了所有对GDP进行的比较背后的隐含假设:虽然GDP的计算必然不能精确反映当期所有商品和服务的总价值,包括资本存量的所有增减,只要这些“误差”大致稳定并且是同一方向的,对GDP的比较就是有意义的。但是制度结构差异巨大的经济体很可能产生截然不同的偏差,并且我并不确知为何经济学家们很容易理解“代理问题”——不同的激励结构导致管理者做出不同的决定,而这些决定或许并不代表持股者的最大利益——却难以理解不同的制度能够在经济活动和价值创造的关系上带来不同的偏差,而这降低了GDP作为比较经济体的工具的适用性。归根结底,代理问题本身是一个制度的例子,它能造成显著的价值扭曲,特别是在被国有部门主导的经济体内。另一个例子是在利率被人为拔高的国家中,经济主体对资本的处理方式与拥有人为低利率的国家的经济主体显著不同,因此在计算GDP的时候,涉及资本活动的经济价值差异巨大。
不准确的度量标准下能衡量什么?
幸运的是,并非所有影响GDP之间相互比较的因素都如此棘手。不同国家间的GDP可能通过一种方式受到扭曲,即GDP的比较是在当期汇率下进行的,而显然在实际情况中汇率会不断发生变动。最终当你对成本进行调整后,美国的生活标准可能表明其经济总量并非严格是加拿大经济总量的9.1倍或是英国的7.4倍。然而有一种方法能够修正这个问题,那就是将英国和加拿大的GDP值按购买力平价进行调整,如此由货币真实价值波动引起的价格差异就可以被消除。这一修正并不简单,除非加拿大、英国和美国家庭对不同商品和服务的购买比例完全相同,但要得到一个合理估算还是有可能的。
我接下来会给出一些比喻来再次阐明我的观点,这些比喻可能看上去并不重要,但其存在自有其原因,所有请不要跳过。我想要阐释我之前给过的一个非常重要的观点,尽管工程师、数学家和股票交易员会认为这十分显然,经济学家要理解它却十分困难,以至于我希望通过日志再度作出说明。
我们经常听到一种说法,认为比较两个经济体总量的实际方法是基于购买力平价调整后的GDP而非名义GDP。但这并不正确。在特定背景下,购买力平价调整是有效的,但在其它大多数情况下并非如此。但本文并不着重解释其原因。正如文章之前所引用的,Derek Scissors指出就“中美两国哪国是世界最大经济体”的争论上,“一方引用购买力平价调整后的GDP作为参考,认为中国是最大经济体”。Scissors在他的另一篇文章中解释了他为何认为这一修正是无效的。虽然他的观点是正确的,我认为他遗漏了导致这一调整在中国失效的主要原因。
为了进一步说明我的看法,我们将话题转到另一个方向。假设我家的秤有问题,它导致每个人的称量体重以同一比例高于实际体重。这令人感到困扰,但这并不意味着度量结果没有意义。至少在两个方面,称量体重依旧能发挥作用。首先,最显然的,假如我每天都称体重,我就能得到自己体重日变化率的精确记录,并且虽然我或许不知道自己实际有多重,假如我只关心自己控制体重的方法有没有效果,那么这台坏掉的秤对我来说和精确的秤并没有区别。这等价于比较一国GDP随时间的变动情况——实际数据可能并不精确,但百分比变动是精确的。
这个记录的另一个作用是当我的朋友也用这台秤称体重时,比较我和朋友的体重。假设我们每年1月1日称体重并发布在我的博客上,这就让我们的朋友能够比较我们的(减肥)进度。虽然记录的体重不真实,坏掉的秤所显示的进度是真实可靠的。举例来说,假如我们在任一给定年份的1月1日称体重,并且显示我的某个朋友比我重10%,那么其他人会很确信我们的实际体重关系正如记录所示。显然,比较美国与英国,或美国与加拿大的GDP可以套用这个逻辑。实际数字可能并不正确,但据此进行的比较是有效的。
但假如我们坚持每天起床就称重会发生什么?鉴于今年我的朋友离家很远,当他到达我家时已经是晚上了,此时他已经吃过晚餐了,因此他可能会比早晨更重。在这种情况下,对我们体重的比较会受到扭曲,结果偏向有利于我的方向。
尽管如此,依旧有办法解决这个问题。我可以要求他每天早上和晚上称量自己的体重,如此数日便可将差值平均化。之后我就能用这个平均值来调整他去年1月1日记录的体重。这种调整不会是完美的,但是我们公认它是有效的,因为它让我们能更准确地比较彼此在1月1日的体重差异。当然,这种调整类似于购买力平价调整——数据不准确,但仍能提高比较的精准度。
再假设由于某些原因,我的另一个朋友也参与了这一活动。问题在于这第二个朋友有自己的秤,而这台秤也是不准的,但其偏差和我的秤并不一样。由于我们互相之间住的很远,我们没有机会弄清楚这种偏差的区别在哪里,仅仅知道两台秤各自以不同的方式偏离准确值。
显然,虽然我的第二个朋友也能够用他的秤来衡量其体重管理的成就,但将我们的记录互相比较是没有意义的。我们都知道他怎样年复一年地记录自己的体重,也都知道我是怎么做的,但若想弄清哪一年我们的体重恰好相同,这是一个不可能的任务。
尽管如此,我的第二个朋友并不够聪明。假如在1月1日,他照常在晚上记录了自己的体重,并且和我的第一个朋友一样对其进行了修正,且将数据公之于众并声称这种调整让我们之间的体重比较更加可靠,这个论断将会是荒谬的。为什么?因为这种调整的作用是随机的。假如对同一个物体,他秤的数值一贯大于我的,且两者差值大于调整值,那么他对调整有助于提高准确度的论断是正确的,但这只是一种可能性。假如他秤的数值一贯小于我的,或者大于我秤的数值但小于调整值的一半,那么这种调整事实上会让我们之间体重的比较更不准确。
令人困扰的购买力平价
假如每个人都理解我与第二个朋友间的体重比较是不准确的,并且我的第二个朋友进行了可笑的修正,同时每个人都理解这种修正是没有意义的,那这就不会造成困扰。然而,假如当他们听说进行了修正,并且由于相信修正的有效性而严肃对待这一体重比较,那我会觉得整件事或恼人或滑稽。
所以我要讨论的是——这个荒谬的故事是否真能找到其现实类比?不幸的是现实就如故事般荒谬。通过购买力平价调整,对中美GDP进行的比较恰如故事所示。当世界银行公布中国GDP的购买力平价调整值时,它看上去远大于人们的期望,并且表明根据这一数值,中国将在经济上提前赶超美国。对此,我在博客上发表了我认为十分显然的一个解释:由于中国GDP的构成与美国不同,对两者的直接比较是无用的。更糟糕的是对GDP进行购买力平价调整并据此推断这种修正改善了比较的质量,而事实上这彻头彻尾是一个愚蠢的行为,其实际作用是随机的。
一些人将我的观点解读为中国采用了不同的方法来构成其GDP,但这不是我要讲的全部。我的观点是这种比较的无效不仅仅是由于两国政府扮演的角色的巨大差异,更是由于两国经济如此不同,特别是在金融领域,以及最关键的是对中国道德风险的普遍看法。美国GDP计量方式的偏差与中国的偏差不可避免地存在显著区别,这涉及两国在名义GDP和提供的商品与服务真实价值之间方方面面的差异。因此任何所谓“修正”都不能针对性地消除这些误差,特别是购买力平价调整,其带来积极与消极作用的可能性是一样的。
两国的制度差异是如此巨大以至于其造成的不一致的误差导致两国的GDP不可比较。我假定上述论断是显然的,但以防万一,我提一下两国最大差异,即两国对产不抵支项目贷款的记录方式的差异。在美国,这些贷款更有可能被记录在案,同时大多数经济学家认同这方面差异对GDP有巨大影响,仅仅基于这两个原因,购买力平价的修正就远不足以弥补两国GDP统计上的区别。
但对其他人来说,上述论断似乎没有我想的那么显然。几个月后我的一个朋友发给我一篇彭博的文章,其题目是《中国GDP的领先是一个数学错误》(Bad Math Makes China’s GDP No.1),而我发现自己就是文中所谓“犯数学错误”的人。开始我对此感到一丝担忧,因为我认为自己精于数学。在和朋友共享晚餐时,参与关于概率论纯粹美的讨论使我成为一个有魅力的健谈的人,且通常当我努力做经济研究而周围的聪明人耐心指出我的错误时,这些错误并不发生在数学领域。从逻辑上讲,那篇文章的作者Noah Smith只有两种途径证明我是错误的。一是证明GDP的计算事实上准确地反映了真实的价值创造,二是证明中国的道德风险并不导致其银行漏记对产不抵支项目的贷款。
对准确性的苛求是否不利于经济学的健康发展?
我被指责用我糟糕的数学水平来标新立异,这一点我已经预料到了。假如我理解正确的话,Smith的责难是由于他认为我企图阻止经济学家用惯常的方法计算GDP。事实上我并没有这么做。在我的关于购买力平价的文章里,至少我自己认为我是在指出一个事实,即GDP计算的会计模式是依据一系列一致的规则,对事实进行拟合的尝试。并且有时,甚至是经常地,这种估计十分合理,但某些时候它们也可能很大程度上扭曲了现实,以至于我们应该认识到这种模式的局限性,并摒弃基于它的推论。
Smith似乎认为我在做一些颠覆性的事情。我对他的责难感到困惑,部分由于我认为我对“为何应放弃将购买力平价应用于中国GDP”这一点的阐述并非什么不同凡响的观点。至少他写道:
当然,中国的GDP数值受到很多质疑。最近的价格调查可能和之前的一样不准确。众所周知,中国的省级GDP数据被追求业绩的地方官员严重夸大了。IMF用以修正价格差异的方法,即购买力平价,包含很多假设——基于市场汇率,美国仍然是最大的经济体。
所以当我打开Quartz上的文章《不,中国经济并未超过美国》(Nope,China’s economy hasn’t yet surpassed America’s)时,我本以为会看到对这些因素的强调。相反,我发现北京大学的著名教授Michael Pettis在宣扬一贯聪明可靠的中国观察家Gwynn Guilford的一个刁钻的理论。
一言蔽之,Pettis的理论认为不良投资不应被计入GDP…他建议我们彻底改变计算GDP的方式。他希望我们采用资产的折现值——换句话说,一种对远期的猜测——来作为GDP计算的基础。即,他认为真实GDP应该是对财富创造能力而非当下生产能力的度量。
…我们必须反对这个观点。假如经济学家开始着手将不良投资从GDP中减去,那么由于对泡沫大小的看法不同,不同经济学家对GDP的估算就会很不一样。例如,假如今年是2007年并且我认为大多数在建房产最终能销售一空,而你认为它们会滞销并最终被拆除。假如我们按Pettis的建议从GDP中减去我们主观估计的未来未被利用的房屋价值,那么你和我最终会得出两个不同的GDP数值!
把这篇文章发给我的是我的一个数学家朋友,他对从财务角度理解经济学很感兴趣。当时他十分高兴,因为他知道我对经济学家的一些常见行为深恶痛绝,即怀着对数学的敬畏,将他们那笨拙的数学直觉和对数学表达的过度应用结合到一起。他同样知道在课堂上,我特别坚持每个模型都有其隐含的假设,而在充分了解并发现它们与我们的其他假设一致之前,我们不应仓促应用这些模型(多年前,在哥伦比亚商学院他曾上过我教的套利课程)。我说购买力平价调整应用于中国GDP是无用的并非是因为我想打破经济学的知识体系,而是因为其隐含的假设是假如这种修正能改善比较的质量,那么任何GDP统计中的偏差都应与美国GDP中的偏差保持一致。我的朋友理解这一点,他在邮件中提到:
那个人说你错了,不是因为你那神圣的隐含假设完好无缺[例如,可比GDP的计算偏差必须广泛一致],甚至也不是因为中国的银行从未发放过不良贷款(我倒希望他这么说)。他认为你是错的,仅仅是因为中国对GDP的计算遵从了其会计规则,如果你开始质疑这些规则,那经济学家就没办法开展统计了。
你知道他是对的。假如你仅仅出于对准确性的苛求而开始着手否定(GDP的)精确性,那么没有人能再发表文章了。或许如果中国记录下了不良贷款,那它的GDP可能会完全不一样。假如他们真的这么做了,那你就能拥有一组完全不同的GDP数据,并且大家都会对此感到开心。但是他们没有。所以着手于这方面的工作。
这很有趣,但我认为Smith实际上并没有理解我的观点。我并没有发表任何他认为是“异端”的言论。我也没有声称因为GDP是“错误的”,它就是无用的并且应该被彻底抛弃。我只是从数学角度上提出一个显而易见的观点,即在分析清楚整个经济结构前,我们照样能辨别那些数字是无效的,并且我们应该理解对中国来说,进行购买力平价调整是无效的。从他在文章第一段所阐述的内容来看,Smith认可对购买力平价调整的一些质疑。
他认为这些质疑是合理的,当然它们显然是合理的。但它们不是影响甚小,就是充满争议。在比较中美GDP时,对我们造成限制的最重要的区别迫使购买力平价的调整变得无效。而我认为这既非影响颇微,也无可争议。数学家、工程师和股票交易员一般认为我的阐述过于显然,但我怀疑我的一些忠实读者可能只是假装理解我的论述(或者说盲目崇拜?)。这就是我写那个关于不正确度量标准的小故事的原因。这个故事并不是说我们要抛弃度量标准,而是说有时这些标准是有用的而有时不然。这看起来有些愚蠢,但对中国GDP的购买力平价调整就是如此。
国家的市盈率
我在文章的最开始讲到我想给出一些理由,来说明为何美国经济相较中国有一个更高的“乘数”,同时虽然美国经济无疑确实有这个更高的乘数(我下面会讲到一些原因),我不认为Scissors引用的这个高乘数是精准的。这个高乘数由两部分组成,即“价格”和“盈利”。显然假如“盈利”的计算方法不一样,正如中美GDP计算方式不同,这就能解释为何乘数应该更高。但我还想指出一些其他方面的原因。
1.折现率的差异显然关系重大。在金融领域,美国经济更加多样、稳定的事实意味着其收入自然地应该计以更低的折现率。每一单位的美国年财富创造值同比中国应该更有价值。一个大问题是如何确定经济的波动性。在美国,历史波动性可能是一个有效的替代指标,但在中国不行,这是因为以下三个原因:
2.首先,很多分析家对中国GDP数据的真实性有争论,并且认为报道的GDP倾向于抹平其原有的波动。尽管长期来看,并没有证据能证实前者,后者几乎是确定无疑的。我曾通览很多研究,它们试图给出GDP的其他计算方法。尽管它们在GDP是否长期被高估上没有达成一致,所有的研究都认为这些数据已经被处理的更平滑了。与这两个观点一致,人们同样公认过去两季度的增长被夸大了。
3.其次,一国的资产负债表结构可能会系统性地夸大或低估波动性。我在2001年出版的《波动机器》(The Volatility Machine)中提到,出于很多理由(Hausmann所谓的“原罪”是其中最显而易见的),发展中国家倾向于设计倒置的资产负债表。这带来了高度的顺周期性,在增长阶段使得测算的增速大于自然增速,但在调整阶段恰恰相反。
除非经济学家同样是金融专家或历史学家(或大量阅读过Hyman Minsky的著作),否则他们可能很难理解这种机制。从过去的案例来看,当所谓“奇迹”的增长最终被证明是基于过度杠杆化和增长与信贷的反射关系时,经济学家虽然常常在一开始对这种预料之外的强劲增长感到惊讶,他们最后几乎总是把这种现象归因于独特而长存的环境原因。随着时间的推移,经济学家似乎只是简单地调整他们对潜在增长的预期,以使其与高增长率保持一致。然而这种做法可能毫无价值。经济学家用以解释高增长的所谓独特而长存的环境因素不是带来一个新的增长模型,就是引向成分复杂的决策精英(通常隶属于最“灵活”的派系,即所谓“非西方”经济学),发展出的新的高级经济学思考方式。而通常这两者结合在一起。令人惊讶的是,这种模式一次又一次的出现,而这些决策精英往往能快速达成共识(虽然其内部常常仍存在反对意见)。
投资者对增长和信贷的反射关系有更清晰的认知。尽管如此,无论最终对高速增长的解释是新的增长模型,还是大幅提升生产力及股价的技术突破,或是新的有助于消除或控制金融风险的金融机构的设立,“这次是特例”的故事最终会吸引投资者参与这种增长。大多数的泡沫都是源自上述三种观点。Charles.Kindelberger早已指出,解释泡沫的观点初看总是正确的,在早期总是能被印证,且有时这种印证很强力,因而使对这些观点的质疑更加困难。
如果你认为这适用于中国的情况,你可能觉得由日本侵略战争及国共内战带来的破坏,以及随后三十年“实验性”的政策制定,使这个国家在制造业和基础设施上的投资,相对于其制度化吸引的投资明显不足。出于这个原因,20世纪80年代邓小平的改革,及在随后投资驱动的增长模式的早期阶段(我常称之为Gershenkron模式),或许带来了真正的增长和价值。彼时的经济增长相对之前,更少涉及不平和的恶化和对债务扩大的依赖。
4.第三,当然是折现率必须包括对“缺口风险”的溢价,我所指的是一个未预期到的增长急剧下跌的风险。如果投资者相信中国这样的发展中国家比美国这样的发达国家更容易经历经济下行冲击,或者中国的专制政治体制比美国的民主政治体制更容易瓦解,或者中国这样的少数几个主体对经济有着不成比例的掌控力的集中的经济体系,比更加分散的美国经济体系(有许多其他的缺口可能发生)更容易遭遇“系统性故障”,那么即使上述这些情况在过去都未曾发生过,无论如何投资者也必须提高折现率。投资者或许理解中国大量的资本外流,而财富和受教育的中国家庭从中国到美国的流动或许更加重要,这表明见多识广的中国家庭假设中国的缺口风险远大于美国,且风险在逐渐增大。
顺便说,我担忧在我的三个例子的最后,中国或许不会处于我们想象中那样大的相对劣势。美国财力向有限机构的日渐集中不会起作用,反而会增大美国经济的缺口风险。只要投资者坚信中国经济有很大可能出现缺口,对折现率的影响就会相当大,但美国人需要认识到当任何一个重要部门过于集中,特别是当金融部门(是调解经济体内绝大多数部门之间关系的部门)过于集中,尽管效率上有所提升(不过我怀疑这些提升被严重高估),这些集中必将形成更强的制度约束,消除了不平衡以致经济体的自然趋势难以自动调整。
尽管营造了经济更加稳定的假象,这些强有力的制度约束允许不平衡的加剧,而这是非常危险的,因为不平衡越严重,最终的破坏性调整的风险就越大——这是缺口风险的一种形式。美国经济最大的长期优势之一(通常也是高度制度化的民主的优势)是其在危机环境下的快速调整能力。在我看来,我们严重低估了Albert Hirschman的洞悉力:一个经济体的长期成功很大程度取决于制度灵活性(使经济体在早期的快速增长或经济破坏之后,能够成功地进行调整),而不是它在快速增长时期经营得多么成功(往往由体制僵化促成)。如果Hirschman是对的,那么我认为他战胜了一切怀疑,美国金融体系权力的集中将显现出一个弱点,这个弱点比新闻和学术上通常讨论的都要大。
上述所有分析表明,我们核算美国GDP使用的折现率有可能大大低于中国的折现率,但我们不能忘记的是,中国被赋予的更快增长的期望也应当被包含到折现率中,而这对中国有利(例如,降低了中国的折现率)。当然无论美国还是中国的GDP增长率都是不确定的,更不必说两者预期的差异。关于中国预期GDP增长率,分析家之间从一开始就存在严重的分歧,但如果我们试图解释价值的差异,这一分歧必然是需要解释的一部分。
5.最后我认为上述几点都隐含假设GDP是财富创造的一个好的代表。当然事实并非如此。正如我在前文的讨论,GDP的计算中包含了,同时也排除了很多经济活动,这些经济活动对财富创造与对GDP增长的影响并不相同,因此它不能作为财富创造的精确衡量指标。但只要我们认识到任何GDP模型中的隐含假设,GDP或许是足够合理的代表。在这些GDP模型中,对经济学家而言,GDP的实际价值不是报道的数字本身,而是其在进行比较时的有效性。
对于我在前文中讨论的原因,我不认为我们能对从中美两国GDP比较中提取的信息的质量抱有太大信心。我认为至少有两种截然不同的差异可以部分解释美国财富估值更高原因。第一个差异与GDP核算中没有包括的外部性有关。如果美国有更大的正外部性或更小的负外部性,这种差异将表现为更大的财富估值。逐个列出外部性很容易,但我认为在美国的较高的正外部性中,至少有两个是很重要的。第一,教育的价值,特别是在精英阶层,这一阶层不是按知识的分布而是按在变化的环境下处理知识的方式进行划分。第二,美国经过演变的制度框架鼓励商业、科技、文化创造,这在外界看来必然是令人惊讶的。这一框架显得相当牢固,但有的部分并不如此。对移民的态度,以及混乱而高度多样化的金融部门是这一框架中的重要组成部分。我把后者统称为“社会资本”,且已经讨论过几次我对它的解读,应该主要集中在2013年6月10日的文章中。
一些分析家或许认为后者已经包括在美国GDP数据中,但是如果投资者相信美国更有可能从意料之外的提高生产率的技术创造中获益,这等价于在美国财富的总价值中加入一种选择权,而这些选择权是相当有价值的。在另一方面,我认为中国的负外部性事物中,很难不马上联想到环境恶化,它使中国受到损失,这并未在GDP中进行衡量。我还需要提及中国严重的水污染问题,这一问题被广泛认知,隐含着未来巨大的治理成本,将这些成本进行合理的贴现将会降低中国的财富,这没有在当前的GDP数据中表现出来。当然水污染不仅是中国面临的难题,我了解到水污染在加利福利亚州也开始成为对农业部门发展的严重制约,但我认为中国水污染问题的严重程度是空前的。
6.最后,第二个明显而巨大的GDP差异是债务处理方式,它使比较两个GDP数据几乎没有任何意义——尽管这些比较产生了许多令人振奋的结果。这些比较中最愚蠢的是基于购买力平价调整的比较。我已经探讨了为何必须放弃无效的GDP面值比较,不过总的来说,如果投资者相信美国金融系统比中国的更有可能通过贷款为收不抵支的项目进行融资,那么他们也必将相信,即使中美受到同样大小的真实经济损失,这也只会导致美国GDP总量降低,而不会降低中国核算的GDP。如果是这样,美国GDP相对而言被低估,低估值等于在中国未被认知而在美国被认知的不良贷款规模。对此的一些估算相当高,达到了GDP的30%甚至更高。
乘数和增长差异
需要说明的很多,其中显而易见的一点是,中美之间的财富差异远大于两国GDP增长速度的差异。由于本文的目的是解释美国经济增长乘数远大于中国的原因,我忽略了一些可能导致中国有较低的折现率或较高的GDP调整量的因素。当然,这些因素是实际存在的,但我认为无论这样处理的正确率多大,毫无疑问的是,发达国家的经济增长乘数总是比发展中国家的高,这是因为发达国家经济上更加多样化,政治上更加稳定,且发达国家往往有更好的体系,包括更清晰的法律和监管框架,更复杂的资源配置过程,更灵活的金融体系,以及更“小”的政府部门(这使经济调整变得平滑,更有可能是长期经济增长中最有价值同时也是被低估的要素之一)。
对于中美经济增长的研究,在被复制的风险下(一些定期读者知道我一般不会回避这些风险),我会通过以下两点进行概括归纳。第一,尽管两国GDP都不是正确衡量财富创造的指标,但我认为有充分理由论证两国实际财富创造的差距大于GDP的差距——换句话说,美国财富创造对GDP的相对量大于中国的这一量——正是这一反映实际财富创造的调整后的GDP值,需要被贴现并用于计算各国的经济“财富”。然而,因折现率的原因,如果用中美两国调整后的GDP增速来衡量经济增长差异,将得出中国经济增长更快的结论。
实际上,增长差异必然取决于决定相对乘数的几个最重要的指标,即名义增长率,而不是实际增长率。人们的确对中国报道的7%的实际GDP增长率存在许多质疑,但我们需要知道,在第一季度,中国的名义GDP增长只有5.8%,远远低于该数字。更重要的是,过去两天内大量公告表明,中国政府由于非常担忧经济下滑,或许会发起新一波的基础设施建设支出浪潮。果真如此,这将恢复GDP增长,并加大中美之间经济增长差距。遗憾的是,这并不意味着我们计算中国经济增长所用的折现率需要相应地降低。如何调整折现率取决于投资者是否认为额外的基建支出能够提升中国潜在的经济增长速度,或者相反的,只是以更高债务为代价单纯地增加经济活动。如果我们假设中国政府过去不愿意这样做,目前只是出于预期经济增量的下滑才被迫扩大基建支出,那么将引出后一种解释,即中国经济折现率更高而不是更低,经济增长乘数更低而不是更高。
第二,若忽略带来增长差异的因素,则势必不能认为中美两国有相近的折现率。美国调整后的GDP的每一单位的价值都将大于中国的,这是因为美国的财富创造几乎必然是以偏低的折现率计算的。那么,到底有多低呢?无论你怎样计算,美国真正的折现率都要更低,但最重要的两个调整——其中一个我在上文中进行了论述,它包含了相对增长率的差异——有可能是最受争议的。另一个调整是资产负债表倒置对折现率的影响。
如果投资者相信中国GDP增长的很大一部分可以用资产负债表扭曲的顺周期性来解释,或者他们相信资本资产定价模型对基于高杠杆的期望增长进行定价的有效性,那么他们将调高中国的折现率以消除这一额外增长的总价值。
我计划在别的地方更多地写资产负债表这一主题的文章,包括即将发表的对Nick Lardy的优秀新作《后毛泽东时代的市场:中国私营企业的崛起》的评述。我的评述会在2014年7月的《亚洲政策》(国家亚洲研究局主办的杂志)上发表,并将以五至六位专家的简评为特色,之后会给出Lardy的回应。我的评述的要点是解释表面上的悖论为何实际上不是悖论。
对于中国经济的根本性质、中国政治经济制度结构以及中国经济自改革开放以来的演变,我不认为任何人有比Lardy更好的理解。他对自己的研究非常谨慎,没有过度倾向。他的书解释了中国从国家主导经济到私营部门成为就业和生产力增长的引擎的演变过程。这一解释让他理性地得出结论,即中国在习近平主席任期剩余时间内(预计到2023年结束)将会继续保持快速增长。他对平均增长率的预测高达8%。
我读过他的书,并认同他的绝大多数观点,或者至少我不够聪明和知识渊博来表明他为何错。然而同样理性地,我从他的书中总结出风险很大的结论,如果中国有能力以他预测的平均增长率的一半的速度增长,那么习近平主席将值得被广泛承认达成了非凡的成就。
无论主题是什么,我总是看资产负债表
为何同样的事实会带来差别如此巨大的预测?我认为这与我们如何评估经济实体资产负债表两栏对其经济增长的影响有关。我认为Lardy和大多数经济学家一样,他们认为增长很大程度上受资产负债表资产一栏管理的有效度的影响,且这对从商业到国家再到全球经济的所有经济实体都适用。根据他们的观点,债务结构与增长也相关,但它主要是通过过多债务增大债务危机的风险或削弱信心实现的。否则负债结构在功能上将与增长不相关。
这一观点不是全体一致认同的,只是绝大多数金融专家持有的,在我看来,他们对“资产一栏”影响增长的观点只在特定情况下成立。一旦债务水平足够高,或者债务结构以可以精确描述的方式产生足够大的扭曲,债务将向功能中心加大流动。这种流动主要以两种重要方式进行。其一——据我所知,虽然文献中对这一过程有零散的引用,但还没有系统化描述它的尝试——扭曲债务结构,或者我的《波动机器》一书中所称的“资产负债表倒置”,可以形成高度顺周期性和自我强化的机制,尤其是通过金融部门系统地加剧经济体的扩张和紧缩阶段。这将是非常强劲的,特别是在发展经济方面,甚至可以把快速增长变为增长“奇迹”,但也可能造成后续调整,使经济进入非常困难的停滞阶段。
第二种债务向经济增长的功能中心流动的方式来源于非常著名且已有相当多研究的过程,在金融理论中这种过程被称为财务困境。我的博客的定期读者了解,我认为触发机制不是标准的公司财务解释中的违约风险的增大,而是债务问题如何解决的不确定性的增加。当然这一定包括但不局限于违约风险的增大。我重新定义了财务困境的触发机制,因为财务困境几乎总是被假定为只影响商业的因素,而事实上这一理论对所有经济实体都适用,因为有些情况下违约是不相关的。
想说的还很多,我希望在接下来的几年里把这些想法全部表达出来,但目前我认为Scissors的文章引发的讨论可以是一种行之有效的思考中国经济的途径——与其说是因为我们需要一种方法来决定谁是世界上最大的经济体,倒不如是我们对当前和未来增长的价值判断启发我们更多地关注经济增长质量。这也产生了重要的政策建议可供中美两国领导人采纳。