张学文,2021 05 27
统计学现在广泛用于社会现象与自然现象的的分析中。求随机变量(如x)的平均值是它的简单又重要的项目,而求得x的概率密度分布,也是重要的一环。如果你第1个发现某变量符合统计学中的著名分布函数而写成为论文,显然应当发表。当然你能进一步说明变量x为什么服从某某某分布自然更好了。
在统计学的发展背景下,如上的认识应当是合乎道理,也合乎历史的。它自然也可以用到气象数据分析上。
记得我过去考虑气象统计,也是这样认识问题的。不幸的是我拿新疆的气象资料简单的套用这个思路就发现有些环节必须事先处理好(说清楚),才可能获得某某某气象变量符合某某某概率分布的结论。例如一般认为气温应当符合正态分布,可你具体分析时,必须预先说明我分析的那个月的气温。你把不同月份的气温混在一起分析,情况就不是这样。这说明不同月份或者说节气是什么是气象变量统计分布的重要参数。或者说你如果获得某气象变量服从例如它是正态分布,就必须注明它仅仅局限于某月份是对的。而这又大大降低了我们的研究的价值。
另外,你可以笼统地说天津的气温与北京差不多,但是作为气象统计分析你必须说明此统计分布规律是根据天津数据而求得的还是根据北京数据求得的。这说明气候统计规律性不仅要指明其应用的月份(节气),还要指明其所在的地点。如果换了地点,其公式也就不是这个了。
以上分析说明了什么?这说明你获得的气象统计规律(公式)实际仅仅是对特定的时间与当地是有效的。不同地点,不同节气,以致白天与黑夜的统计规律并不相同!你的研究结果没有普遍适用性(普适性),它是局限性太大!
所以,所以我们揭露(研究)一个气象变量(如气温)的统计分布规律的分析时,最好(应当)是
1. 给出不同节气(月份)的对应的分布函数—这导致分布函数不是一个而是12,或者24个
2. 给出不同时辰(小时)的分布函数--这导致分布函数不是一个而是12,或者24个
3. 给出不同纬度上的对应的分布函数—这导致分布函数不是一个而是例如数十,上百个。
4. 给出不同经度上的对应的分布函数。
5. 给出不同海拔高度上的对应分布函数。
即理论上我们给出的气象变量的统计分布函数(如正态分布)它不能仅是适用于特定的地点,而是全球,不能仅是特定的月份,而是各个月份,不能仅是特定的时辰(黑夜,中午)而是各个时辰(小时)。
如此说来,例如气温等等的统计分布规律(全球各地,各个节气,各个时辰的统计分布规律)的任务反而变成了大的几乎无法完成的任务了。
好了本博客不讨论这种视角下的统计任务如何实现的问题,而仅是提出我们分析气象变量的统计分布需要在时角域的两个方面(节气,时辰)在空间域的三个方面(高度,经度,纬度)合计5个领域展开分析,才是一个完整(全球大气)的分析。
在这个认识下,如果你真的完成了(揭露了)例如地球大气中的气温的统计分布,这就意味着你已经把全球气温(包括从地面到各个高度,从北极到南极的各个地点)各个季节(月份),各个时辰(24小时)的统计规律都揭露清楚了。而这个庞大的任务,在气象统计领域似乎还没有被明确提出(它太大了)。而过去揭露的气象统计规律太渺小了。
如此看来,气象统计距离形成一个学科依然很远。