科学家很容易自欺欺人
文/ 孙学军 第二军医大学教授
2013年,纽约哥伦比亚大学统计学家安德鲁,发现他2008年发表的论文存在一个数据分析错误,该论文认为美国民主党候选人通过经济政策能得到更多选票。在试图重复该研究论文时,本科生杨杨胡发现安德鲁的一个变量错误。安德鲁立刻发表了一个三句话的修正,声明论文的基本观点应是错误的。安德鲁反思这一错误形成的原因,认为是人类大脑的天然缺陷导致:人类自然相信似乎是完全合理的结果。如果发现结论有悖常识,我们会反复核查,直到发现错误。如果发现结论符合常识,一般会放弃对研究过程的检查。
这是科学研究过程中存在的一个大问题,几乎没有人会认真讨论这一问题:诚实的人同时是一个自欺欺人的人。人类大脑的进化主要发生在远古非洲大草原上,当时判断失误的代价可能是死亡,但是今天的科学家并不是这样,科学发展到今天,大量结论必须依赖计算机对海量多维度研究数据进行分析,但随机性决定了任何结论都有可能发生,这意味着科学家可以随时获得“合理的”“符合逻辑”的结论。这将会导致科学家不断让自己误入歧途,而自己毫不知情。当今科学领域,科学家很容易因数据和数据分析发生自欺欺人的现象。
斯坦福大学统计学家约翰·埃尼迪斯认为,由于不理解人类自身的偏见,会导致学术论文信任危机的发生。年初发表的对100项心理学研究进行重复研究发现,有60%多的研究论文可以被重复。2012年,安进公司科学家对53项肿瘤和血液病方面的重要研究进行重复,结果只有6种被重复出来。2009年,埃尼迪斯等对18项基因表达芯片结果进行重复,结果只有2项可以重复。这些研究说明,科学研究,尤其是生物医学领域的研究,错误发生的比例已经相当恐怖。在这一问题面前,科学家到底是故意为之,还是因为人类大脑缺陷导致的失误。
虽然不可能准确分析到底有多少科学家受到自己数据的期望,但是重复性研究能给出一个大概的判断。埃尼迪斯认为,100项心理学重复性研究的案例得出的结论可以这样说,如果假定所有这些科学家都是诚实的,那么可以说大多数科学家都会受到无意识偏见的干扰。科学的大规模发展时期,随着大量研究结果出现,必然出现大量错误和偏见的研究。这也要求科学领域去寻找解决这一科学本身错误的解决办法。
斯坦福大学社会学家Robert MacCoun说,科学研究重复性问题给我们提供了一个很好的寻找优化科学工具的机会。类似的情况历史上也曾经发生过,20世纪中叶,科学家意识到,理论经常无意识地改变他们无意识地匹配实验结果。根据这个问题,科学领域诞生了双盲实验标准。加州大学伯克利分校天体物理学家Saul Perlmutter说,时刻不要忘记,当我们谈到科学方法时,从来不是说一个最完善的方案。科学的发展就是用假说欺骗自己和努力避免被自己欺骗的过程。
导致科学家自欺欺人的情况有许多,比较公认的有这些。
假说近视。这是研究早期容易发生的陷阱,研究人员在收集证据时,更重视和喜欢那些能支持假说的数据,忽视或厌恶那些否定假说的数据。人们倾向于问问题给出肯定的答案,都希望自己青睐的假说是正确的。这方面最典型的是一件真实的故事,Sally Clark杀婴案,根据概率计算判断Sally Clark杀婴成立,结果后来被翻案,证明是乌龙或者说,人类利用和盲目相信统计学的可笑。
德克萨斯神枪手。一位老德克萨斯神枪手曾用诡计来欺骗他的朋友,让他对枪手的枪法产生深刻印象。德克萨斯神枪手在牛棚的门上打出一串枪眼后,围着这些枪眼画出靶子。“看见了吗?伙计。每次我都正中靶心!”他说这些枪眼是他自始至终瞄准的结果。这显然是笑话,但是现在许多科学家就是这么干的。科学家大多数都是p值的粉丝,他们只相信p,不考虑其他。结果出现了p值黑客现象。
不确认偏见。进行数据分析时,如果结果与假说不匹配,科学家非常容易将责任归于实验过程,而不认为假说本身存在问题。
凑故事。自欺欺人的故事一旦形成,可能变成一套顽固的思想,不仅自己相信,也可能会影响到他人。
解决科学偏差是科学研究的重要责任。首先是用科学历史曾经使用的学说竞争,并设计实验区分不同学说的可靠性。其次是提倡学术开放和透明化,学术研究应鼓励大家分享研究数据、研究思路和研究方法,只有这样,才能有效减少发生不必要的判断失误。■