学文老师的这种观察和分析很有意思,也值得深思(参见“气象统计学私探(51)”)。除了这篇文章,学文老师的许多其他文章都提到发现了各种有规律分布的现象,都是很值得深思和深度挖掘的事物,为学文老师的这种细心观察和学术探索点赞。
在此,请容我抛砖引玉,简要说说我对这类学术问题、学术性数据观察的观点和看法:宏观地来说,许多事物尤其是复杂事物,都具有统计学规律的分布现象很常见,当然也的确都很值得研究,关键在于该如何一步步地进行深入研究和深入剖析。我认为,关键点可能主要有以下两个方面:一方面要找出其符合的究竟是什么样的统计规律;另一方面,要找出其为何会如此有规律分布的根源,尤其是其内在的物理机制(也包括数学机制或定量化数学模型)究竟是什么。把这两方面都做完了,可能就可以得出非常有价值甚至突破性价值的研究成果了,或是至少可以给出某种思想上或应用上的启迪作用。
在这方面有一个环境数学模型领域的很好的例子:大气污染扩散的高斯模型。关于这个模型的来源,不同的教材有不同的推导和讲解方法,其中有一种讲法是这样的:由于大气污染扩散通常符合正态分布,因此其模型应该是这个样子,由此得出高斯模型。这类讲法其实是不对的,因为正态分布的样式有非常多,为何一定就是高斯模型那样的结果且其中的参数正好就是那几个呢。正确的讲法和正确的理解与推导方法,是来自于对于一个大气微单元所建立的微分方程一步步推导而得到的,当然,在这个过程中需要首先做许多假定和简化(在一种尽可能简化同时又基本符合事实的假定条件下,比如大气流场均匀稳定,污染物和环境介质的物理化学属性完全相同等),由此,最终推导和求解得到的解析解就是一个正态分布的模式,即大气污染扩散模型的高斯模型。这个模型的计算结果在许多情况下与实际大气污染物扩散过程的符合性很好,且同样都是基本符合正态分布的(当然,实际中也有许多需要修正的情形),因此,这又可以反过来证明这个模型的推导过程中所做的许多假定是基本靠谱的,只是在许多具体情况下,尤其是精度要求不同和对象不同的情况下需要进行不同的修正。这个例子,就是一个从统计学规律的现象观察,到其内在物理机制和数学模型的推导和归纳,最后理论推导和实际观察互相印证的经典例子,最终的成果(即大气污染扩散高斯模型)由此成为了研究和分析计算大气污染物扩散过程的最为重要的工具了。
后续补充:学文老师在讨论中提到“统计学里介绍的一些分布函数具有广泛的实例。可见它们是站得住脚的。但是它们为什么是这样?是这些?....在我的组成论一书中对此从最大熵,最复杂,概率平均值最大这种角度做了通俗说明。”以下是我对此的进一步评论:最大熵理论我也挺认同,这是一个几乎涉及到对宇宙本质的理解的哲理性的问题。许多学者从不同的角度对最大熵理论做了许多的研究和发挥式的运用,这的确是很值得深入研究的一个方向。唯一的可能也是最大的遗憾是:这个领域的研究给人更多的是思想上或哲理上的启迪和共鸣,却往往难以给出非常具体的有实用价值的结果,对于实践应用的直接指导性价值不太显著或者说太间接了,如果能在这方面做出更加具体和更加直接的运用或运用指引的话,可能会是一个巨大的学术性突破。