统计是一门科学,但如果统计方法不合理、不科学,统计机构就是“数字制造者”而已。
01 统计结果要支撑它们自身立场
统计学教授克莱默在《统计数据的真相》书中说:“人们常常会使用统计学来支撑自己的立场,而不是反应真实情况。”某高级经济师表示,不少统计机构并非不知道口径、样本的不科学会导致数据失真,但机构所代表的利益不一样,难免带有一定的倾向性。一些所谓研究机构发布数据本质上是一种商业行为,而政府发布数据是宏观调控、辅助决策的工具。“以房地产市场数据为例,政府机构面对的是政绩,数据是政策出台的重要参考之一,发布数据是希望稳定市场;而中介机构面对的是开发商,发布的数据是希望楼市保持交易的活跃。”
很多经济数据的统计过程都必须采用抽样调查的方式。即使是社会消费品零售总额这一统计指标,也分为两部分的数据来源,“对于大中型企业采用全面调查的方法;对于大量的中小微企业就按照行业属性和单位属性采用随机抽样方式来调查样本,根据样本情况结合之前的经验估算,再做汇总处理。”
03 奖品会影响调查样本质量
大部分机构在派发调查样本的时候都会采取一些激励手段。比如官方统计机构进行的住户调查,即抽查一些城乡家庭做居民开支等情况的跟踪统计,会对配合的记账户家庭给予每月几十元的补贴激励。但某一些物品奖励则可能对结果造成影响,比如如果用运动水壶和微波炉餐具吸引来的接受调查者可能是完全不同的两个群体,他们给出的答案会让调查结果呈现不同倾向。
04 普查常常不是由一家机构完成
官方统计机构的调查方法分为普查和抽样调查两种方式。“一般来说经济普查、人口普查这样的大型调查,才会是全样本统计,结果也会相对可靠一些。”北京市一位统计局人士介绍。但对于大型普查的审核也是一个难题,如人口普查,现有的统计站人员是绝对不够的,就会划区分给当地社区工作者或基础公务员来辅助入户调查。“对于这类普查的审核也只能靠随机抽查才能发现问题,这本身相当于另一项专项调查的任务量。”
05 它们会用“特技”吸引眼球
商业报告中常常喜欢用百分比来描述和展示统计结果,很可能是为了掩盖样本容量过小的事实,而达到宣传商品价值、影响读者的作用等。比如广告中常常出现“80%的测试人员”一致认可某种牙膏、某种咖啡的质量,而参加测试的人员可能只有5个人。这一手法被广泛运用到商业报告中。另外改变图表的横纵坐标范围或比例,也会产生惊人的效果,如为了强调某产品成本的上升,改变了横纵坐标范围或比例,实际成本其实上升了10%,就可以使视觉效果看起来像是30%。
06 选择用同比还是环比有讲究
一些房地产网站上统计出的成交量文章和图表,有同比分析的,也有环比分析的,这并不是随机的。它们的数据来源于房产中介企业,商业目的是要保持市场成交的活跃,也会人为选择数据表述方式。如果2月成交量很低,3月就用环比分析,让读者以为成交量是大幅增加的,但有可能同比是负增长。如果3月基数大了,4月就采用同比分析,看起来也是大幅增长,而可能环比只增长了一点。
07 它们的字典与我们日常概念不同
“统计在国内的发展时间还比较短,很多是参考国外成熟的指标进行设计的,一些规范和框架一直在微调之中。”前述统计局人士说。现有的官方统计口径都是由国家统计局明文规定并设置统一的统计报表来规范,听起来都是比较符合学理的概念,但这些指标与我们日常理解的并不相同。
如“社会消费品零售总额”,根据它的统计口径,该指标其实只基本反映实物性商品消费的情况,而不包括我们日常的服务性消费如教育医疗文化等支出。“又比如按照国际标准,国民经济核算口径的居住消费支出与住户调查口径的居住支出均不包括居民购、建房支出,因为这部分支出算作投资而不是消费。”一位统计机构的员工说。
08 它们的最大难点都在于数字审核
不论是样本企业自己上报的统计报表还是调查员访问所得的数据,都面临数据是否失真的问题。“目前官方统计虽然有网络直报系统,企业的原始数据可以直接被国家统计局掌握,但是这过程中仍需要乡、县、市、省统计部门逐级审核这些直报的数据是否真实、基层调查员是否尽职。”按理说,有了数据系统,统计结果可以更快地产生,但是审查核实依然需要大量时间。
“总体感觉是越往下走,统计员或调查员的素质就越有一些问题,对一些统计概念也不甚清楚。”一位接触统计局较频繁的企业统计员说。
09 靠登记得到的统计结果并不靠谱
除了统计局垂直地统计系统,国务院各部门也有相应统计职能,针对各自行业领域监督情况产生统计结果。比起一些咨询公司、数据公司的统计,它们更有调查资源的优势,但不一定是专业调查统计。如靠行业登记等方式得来的数据就不是那么全面,如备受争议的人力资源与社会保障部的失业率数据。“该数据是在公共就业服务机构收集的,而只有一小部分失业者会在这些机构寻找工作、进行登记。”