按:李宏翰老师的“这样也算数据造假吗?”一文中提到并论述了有关如何对待科学研究中的异常数据的问题,这个问题虽然是老生常谈,但的确非常重要,在任何时候任何层次上科学工作者都应始终对这个问题保持高度的重视,以下是笔者对这个问题的详细评论。
首先,‘科学研究中的异常数据和异常现象什么时候可以剔除、什么时候不能剔除,什么情形下的剔除是科学合理的,什么情形下的剔除是不科学合理的’存在非常容易陷入的思维陷阱和心理陷阱,不论是新入门的学生还是已经功成名就的学者,都需要始终保持对这个问题的高度重视和自我警醒,因为一旦陷入了这个陷阱(不应该剔除的被轻易剔除了)且无法自查和自我修正,要么意味着(1)当事人自己在科学研究上没有真正入门,要么意味着(2)自己正开始形成严重的思维定式和思维僵化(或是已经过于自大而不自知)因此在科学研究能力上已经在走下坡路了。上述两种情形不论是哪一种,都是需要自我警醒和尽可能地进行自我修正的。
其次,有异常数据原本应该是完善科学理论乃至做出科学发现的巨大机会,而如果是故意有挑选地寻找证据来证明自己的观点的话,那就不仅是错误的研究方法,而且是一种学术不端甚至学术造假(如果的确是无科学依据地故意剔除异常数据异常案例的话)的行为了。真正科学的做法,应该是深究异常数据、异常案例的根源,尽可能全集地保留所有的正常数据和异常数据,同时深究到底是的确有些样本或有些情形下的数据结果就是异常的(这种情形是机会,应该珍惜,因为这可能就是做出科学发现的极好机会),还是那些异常数据是由于实验操作或实验设计的失误和错误导致的(这种情形是自我检验自我提高的机会,说明自己的实验技能和科学素养方面有缺漏之处,需要完善提高自己的科学技能和科学素养)。简言之,不论是否有异常数据和异常案例,在实验的过程中,都必须要有平行样和对比实验,要有重复检验的实验过程,要尽可能全集地(至少是有足够代表性地)进行实验设计、实验操作和数据收集,不对研究数据进行这种反复的重复试验和重复检验,轻易剔除异常的实验数据和异常案例,都是不规范的和错误的研究方法。