华罗庚先生的“早发表、晚评价”,高屋建瓴、意味深长,抓住了问题的关键。为什么“晚评价”很重要呢?因为,对于绝大多数科研成果,在刚发表的时候是无法准确判定其真正价值的。一项科研成果只有在科学共同体中经过长时间的“磨炼”,才能展现并确定其价值。这是客观事实,是由科学发展的自然规律所决定的。
下面以我自己1992年发表的八篇论文为例,分析“本是同根生”的八篇论文,二十八年来在科学共同体中所经历的大相径庭的旅程。
1992年我博士毕业,当年发表了八篇论文(见下面论文[1]至[8],按google scholar被引用次数由高向低排序)。在这八篇论文之中,最具影响力的两篇论文分别被引用3425和2798次,而最没有影响力的两篇论文只有15和7次引用,差距可谓是天壤之别。这里,问题的关键是,我自己在写这八篇论文时,并没有觉得它们有什么特别大的区别。故事是这样的。
当时(1990年左右),神经网络和模糊系统是热门研究领域。神经网络在BP算法和Hopfield神经网络的推动下,出现一波研究热潮。LeCun的卷积神经网络(AlphaGo的核心模型)就是在1989年提出的。模糊系统由于1980年代模糊控制在日本的大量成功应用,也出现一波研究热潮。还有一个相关的热门领域是遗传算法。这三个领域(神经网络,模糊系统,遗传算法)组合在一起,形成“计算智能(Computational Intelligence)”领域。
我是1989年秋季学期到美国开始读博士的,导师就给了我一个大的方向:神经网络和模糊系统。研究过程就是自己找论文、读论文,发现需要解决的问题,然后提出解决方法,写成论文。下面简单介绍这八篇论文所解决的问题。
论文[1]:模糊系统是由模糊规则构建而成的。当时(1990年),模糊规则只能由专家提供,获取速度慢、适用范围窄,极大地限制了模糊系统的广泛应用。因此,如何有效地获取模糊规则就成为当时一个重要的研究课题。为解决这个问题,我提出一个非常简单的五步方法,从数据产生模糊规则,就形成了这篇论文。
[1] L. X. Wang and J. M. Mendel, “Generating fuzzy rules by learning from examples,” IEEE Trans. on Systems, Man, and Cybern., Vol. 22, No. 6, pp. 1414-1427, 1992. (google scholar被引用次数= 3425)
论文[2]:当时(1990年),神经网络已经被证明是万能逼近器,这是掀起当时那一波神经网络研究热潮的一个重要原因。由于模糊系统也是通用模型,一个自然而然的问题就是:模糊系统也是万能逼近器吗?这篇论文从数学上严格证明了模糊系统是万能逼近器。
[2] L. X. Wang and J. M. Mendel, “Fuzzy basis functions, universal approximation, and orthogonal least squares learning,” IEEE Trans. on Neural Networks, Vol. 3, No. 5, pp. 807-814, 1992. (google scholar被引用次数= 2798)
论文[3]:这篇论文是论文[2]的最初版本,是会议论文,和论文[2]的本质内容是一样的。这篇论文和论文[2]一起,开创了后来模糊领域的热门研究课题:模糊逼近理论。
[3] L. X. Wang, “Fuzzy systems are universal approximators,” Proc. 1992 IEEE International Conf. on Fuzzy Systems, pp. 1163-1170, 1992. (google scholar被引用次数= 1435)
论文[4]:用神经网络的BP学习算法设计模糊系统,idea非常straightforward,过程也很trivial,没有什么挑战性。这篇论文和论文[1]一起,开创了后来模糊领域的热门研究方向:模糊神经网络。
[4] L. X. Wang and J. M. Mendel, “Back-propagation fuzzy systems as nonlinear dynamic system identifiers,” Proc. 1992 IEEE International Conf. on Fuzzy Systems, pp. 1409-1418, 1992. (google scholar被引用次数= 628)
论文[5]:石油勘探中的一个重要问题是辨识油砂界面反射系数。由于我的导师Mendel教授当时的主要研究领域是石油勘探信号处理,所以我就以当时热门的Hopfield神经网络为核心,提出一个循环算法,大幅提高了油砂界面反射系数的辨识精度。
[5] L. X. Wang and J. M. Mendel, “Adaptive minimum prediction-error deconvolution and source wavelet estimation using Hopfield neural networks,” Geophysics, Vol. 57, No. 5, pp. 670-679, 1992. (google scholar被引用次数= 83)
论文[6]:在研究多层神经网络的过程中,我注意到如果将每个神经元的非线性函数去掉,神经网络就变成矩阵相乘。如果在神经网络的结构上加入不同的限制,就可以形成各式各样的矩阵分解和矩阵计算的结构。然后,利用神经网络的学习算法,就可以用一个统一的架构和学习算法来解决绝大部分矩阵分解和矩阵计算问题。我把这种特殊的、用于矩阵代数的神经网络叫做结构网structured networks。
[6] L. X. Wang and J. M. Mendel, “Parallel structured networks for solving a wide variety of matrix algebra problems,” Journal of Parallel and Distributed Computing, Vol. 14, pp. 236-247, 1992. (google scholar被引用次数= 46)
论文[7]:手写字母和手写数字的识别是当时神经网络和模糊系统尝试解决的一个重要问题。LeCun在1989年提出的卷积神经网络就是为了解决手写数字的识别问题(支票的计算机自动读取)。我提出用模糊系统辨识手写字母,而且方法不受字母旋转的影响。
[7] L. X. Wang and J. M. Mendel, “A fuzzy approach to hand-written rotation-invariant character recognition,” Proc. ICASSP-92, 1992. (google scholar被引用次数= 15)
论文[8]:论文[5]用Hopfield神经网络解决油砂界面反射系数的辨识问题,这篇论文用BP神经网络解决同样的问题。
[8] L. X. Wang, “A neural detector for seismic reflectivity sequences,” IEEE Trans. on Neural Networks, Vol. 3, No. 2, pp. 338-340, 1992. (google scholar被引用次数= 7)
可以看出,以上八篇论文都是在研究过程中发现问题,然后提出解决方案而形成的。基于当时科学界对问题的认知程度,这八篇论文所解决的问题并没有本质上的区别。经过二十八年的“洗礼”,现在回过头来看,才发现哪些成果具有核心价值、推动了学科的发展,哪些成果只是昙花一现。
下面从“原创性”、“重要性”和“深刻性”三个方面,对这些论文进行分析比较。
从“原创性”的强弱程度来讲,论文[6]应该是这八篇论文中最强的。论文[6]提出的结构网是一个全新的神经网络,用于解决一大类重要的基础计算问题(高维矩阵的分解与计算)。可是,论文[6]二十八年来只有46次引用,说明科学共同体并没有认可这项研究的重要性。反过来,论文[4]的“原创性”程度是最弱的,因为论文[4]就是简单地把热门的BP算法用于训练模糊系统,属于“跟风”式论文。可是,论文[4]却有628次引用,是模糊神经网络领域“从0到1”的核心论文之一,有力地推动了学科的发展。所以,一篇论文对学科发展的贡献与其“原创性”程度并没有直接的关系。
从所解决问题的“重要性”程度来讲,论文[7](手写字母识别)或许是最重要的。当时LeCun刚发表他的卷积神经网络不久,用于识别手写数字。论文[7]和LeCun的论文属于同一类,用两种不同的计算智能方法解决同一大类问题。LeCun的论文引发了当下的人工智能热浪(LeCun的论文发表后的前十几年也基本上无人问津),而论文[7]二十八年只有15次引用。同样情况,论文[8]用先进的智能方法(BP神经网络)解决重要的实际问题(油砂界面反射系数的辨识,也可以推广到其它类似的信号处理问题),并且发表在学科最顶级的IEEE神经网络汇刊上,可论文[8]二十八年却只有7次引用,属于“垃圾”论文。所以,一篇论文的“重要性”在其刚发表的时候是无法准确判定的,必须经过时间的洗礼。
从论文的“深刻性”来讲,论文[1]是最“肤浅”的。论文[1]提出一个非常简单直接的五步方法,由数据产生模糊规则。论文[1]源于Kosko教授神经网络与模糊系统课程的课程设计,当时课程的助教(Kosko的学生,一个韩国人)提醒我,说我的这个课程设计太简单了,可能通不过,吓得我把为数学系高级泛函分析课程所做的万能逼近定理的一部分“抄袭”过来,才过了助教这一关。论文[1]至今被引用3425次,是模糊领域最经典的论文之一,其方法被称作Wang-Mendel(WM)方法,开辟了模糊神经网络领域,是后续方法性能比较的标杆。所以,不能用“简单”、trivial来判定一篇论文的好坏,只有交给时间来决定其价值。
以上分析清楚地表明,一篇论文在刚发表的时候无法准确判定其真正价值。就像面对一个刚出生的婴儿,你无法判定这是将来的爱因斯坦、还是一位普通工人。所以,每篇论文都应该有发表的机会,就像每位婴儿都应该被赋予生存的权利。至于其价值如何,只有交给时间,通过科学共同体集体智慧的反复考证才能确定。
“晚评价”原理告诉我们:每位科学工作者都是平等的,不管你是世界名校的大牛,还是三本高校的普通教师。大家都在同一个科学战线上刻苦钻研、奋力拼搏,提出解决问题的各种方法,发表为各式各样的论文。至于发表的论文是金子还是沙子,只有通过科学共同体、在时间的漫漫长河中大浪淘沙才能区分开来。
金子有金子的华贵,沙子有沙子的用途。国王有化装舞会,平民有篝火狂欢。在人生的旅途上,生老病死、人人平等。
每篇论文都应该拥有被发表的权利。
相关博文:
《“早发表、晚评价”:如何晚评价?》:http://blog.sciencenet.cn/blog-2999994-1223873.html
《应用“晚评价”原理解决短期评价问题》:http://blog.sciencenet.cn/blog-2999994-1224193.html