论文撤回越来越多,然而文献库依然充斥着大量有缺陷的科研论文。是时候改革论文出版方式了么?
来源 The Scientist
作者 Bob Grant
翻译 李可人
审校 谭坤
这种令人遗憾的事已经变得太常见了:科研人员被怀疑篡改数据,引发调查,论文被期刊撤回,违规的科学家受到处罚。虽然不当行为和随后的论文撤回引发了科学界对研究可重复性的更多关注,但这些其实只是有缺陷的研究中的少数。多数涉及结果不准确、细胞培养含有杂质、使用了错误抗体或分析了污染的 DNA 等问题的文章都是无心之过。大量类似的论文还留在科学文献中,无人更正。
“我认为造假和错误并非迥然不同,而是一个连续体的两端,而人们对不涉及造假的错误太过容忍。” 哥伦比亚大学的统计学家安德鲁·格尔曼( Andrew Gelman) 表示。他撰写过有关科学文献中的论文撤回和可重复性问题的博客。
这些“僵尸论文”(Zombie Papers,化用学术出版界看门人雷昂尼·施耐德,Leonid Schneider 发明的术语)是无害的,是过时的方法论的遗迹,是一种存于历史记录中的、不太好用的试剂?还是像那些蓄意伪造的报告一样令人担忧,需要被追查并从科学文献中彻底清除?
许多研究人员赞同第二种做法。有缺陷的论文,尤其是被大量引用的那些,可能会持续传播错误的方法或结论,将资金和人力引向徒劳无功的方向,让科学家在摇摇欲坠的概念基础上搭建理论高楼。这样一来,僵尸论文将催生更多僵尸论文,危害会像传染病一样传播扩散。
“这是一个严重问题,而且无处不在,”弗吉尼亚大学心理学家,开放科学中心(Center for Open Science)的创始人布莱恩·诺塞克(Brian Nosek)表示。虽然还不清楚问题有多严重,但格尔曼估计,有缺陷的论文可能比没缺陷的还多。他说,“我觉得某些年、一些期刊超过半数的论文都有重大错误。”
随着期刊上如法制炮的论文大量增加,这支僵尸大军只会变得愈发壮大。诺塞克和格尔曼对于几百年来本质上毫无改进的科学出版传统持批判态度。他们以及其他一些人表示,是时候让出版流程的开始现代化了。过去几年中,科研人员开始使用新的机制和方法评论、标注、更正和注释科学文献。有些人希望未来科研人员和出版机构的互动方式以及出版成果都能发生重大转变。
“人们对于这些问题有了新的看法,”诺塞克表示,“出版也可做巨大变革:对新证据的积累作出响应,而不是仅仅静态记录人们在每个特定时刻的观点。”
一具僵尸木乃伊
19 世纪 80 年代初期,斯万特·帕博(Svante Pääbo)是瑞典乌普萨拉大学的博士生,研究腺病毒如何阻断人类的组织相容性抗原,从而不被宿主的免疫系统察觉。然而年轻的帕博、现任德国莱比锡的马克斯·普朗克进化人类学研究所主任,有一个诡秘的副业。“我上医学院之前学过埃及学,所以知道博物馆里有成百上千的木乃伊,” 他说,“我想试试看里面是否残留了 DNA。”帕博从 23 个木乃伊中取样,擦拭样品以寻找痕量的可用基因材料。他在其中几个样本中找到了一些。他将木乃伊细胞染色,定位细胞核,选取了一个来自 2400 年前死去的儿童的样本,用当时的默认的 DNA 测序方法——质粒载体克隆了样本的 DNA。在 1985 年写给期刊《自然》的信中,帕博宣布他对千年遗迹中的 DNA 进行了提取和测序。
这篇论文促成了目前热门的古代 DNA 研究领域。帕博成为了该学科的先锋,并继续从各种早已死去的生物体中提取 DNA,包括已经灭绝的长毛象和尼安德特人。只有一个问题:帕博测序的长毛象 DNA 根本不是长毛象的。帕博本人在近十年后,借助自 1986 年以来广泛采用的聚合酶链式反应这一新方法,发现他分离的基因材料实际上来自现代人类,很可能来自于当时同时进行的抗原研究。“事后看来,当时的材料肯定被污染了,”帕博说道。
1994 年,帕博重新检查了原始的木乃伊数据并发现了这一错误,他和同事在一篇《自然》论文中简短地承认了错误,并介绍了他们使用的保证避免污染的方法,对古代长毛象进行的 DNA 测序。我们“相信"污染是分子考古学领域的重大问题,”帕博和他的共同作者写道,并指出通过分子克隆获取的序列格外容易受到污染,因此“只有有限的科学价值。”然而,20 多年后,帕博仍然没有对 1985 年的木乃伊 DNA 论文作任何更正或勘误。
虽然帕博坦承自己博士阶段的错误,但他认为那篇论文不需要正式的修正,更不必撤回,原因有三。首先,论文中的方法论已经完全被更先进的技术取代,如聚合酶链式反应,以及之后的靶向性测序文库制备和 DNA 直接捕获,没有人会继续采用质粒克隆方法,并得出类似的错误结论。其次,他在那篇论文中给出的细胞染色结果是正确的。“总的来说,我不认为 1985 年那篇论文算是‘僵尸论文’。如果现在有人引用那篇论文,就是为了说明古代组织样本中的 DNA 是可以提取和研究的,”他在写给《科学家》(The Scientist)的邮件中说道,“即使具体的 DNA 测序结果有误,这个结论依然成立。”第三,1985 年那篇论文更是一个概念验证,而无意成为未来研究的基础,他说,“我们并未根据基因测序得出有关埃及历史或任何事情的结论或推测。”
《自然》似乎也认为,这篇根据 Google Scholar 统计共被引用 560 次的论文,应该被当做历史遗迹,而不是科学文献的污点。“技术改进以后,科学也随之改革。而新的技术,方法和证据会引发对原有发现的重新诠释或提炼,”《自然》的编辑政策总监索娅·斯万米娜森 (Sowmya Swaminathan)在写给《科学家》的邮件中说道,“研究人员认可这是科学进化的一部分。”
前分子生物学家雷昂尼·施耐德现在是独立科学记者,经常撰写有关科学出版和研究中不当行为的文章。他也同意 1985 年的那篇论文有其价值,但他仍提议帕博应该有所行动,不是为了防范重大科学事故,而是出于学术信仰。“我还是建议帕博随文章发表一篇声明,”他说,“这样每当有人点击了来自原始出版商的论文链接,就能看到一篇声明,明白这篇文章中的哪些内容不再可信。我认为这是他的责任,尽管已经过去了三十年。”
© KRIS MUKAI
出版业现状
在当今的数字出版时代,相比帕博 1985 年的木乃伊 DNA 论文,有缺陷的研究更易迅速引来批评。比如在 2010 年 12 月,当时 NASA 的研究员费丽莎·乌尔夫-西蒙(Felisa Wolfe-Simon)和同事合作发表了一篇论文,证明从加州莫诺湖采集到的 γ-变形菌能够用砷代替必需元素磷,从而在缺乏磷但富含砷的环境中生长。但在 NASA 召开新闻发布会,并将文稿发表在《科学》的网站后,对这篇论文的批评随之而来。
数十名研究人员通过博客、论坛或直接联系《科学》期刊,表示他们发现这项研究存在实验设计和实验结果诠释上的问题。期刊刊登了大部分的辩论内容,包括作者的回复,以及一篇详细描述相关争议的科学故事。用户在网站上浏览这篇论文时,就会看到这些资料的链接列表。“这篇论文的相关学术记录经过了大量更正,反映了科学界引发疑问的数量和严肃性,”《科学》期刊主编玛西亚·麦纳特表示,“《科学》此次打包刊登的专业回复和评论的数量前所未有。”不过,这篇论文依然未被更正或撤回,主要因为作者坚持结果准确。
科学文献中到底还有多少论文像这篇砷基生物研究一样存在缺陷,谁也不知道。不过很可能是个极大的数字,尤其是如果不仅考虑有明显错误的论文,而是把所有方法或结论已经过时的论文也计算在内的话。“每篇论文都有错误。科学就是这样,不是吗?”诺塞克说,“我们不理解某个现象,所以做了点研究,得到了一些发现,于是我们多了一些知识,向远离错误的方向迈进了一步。”
当然,修正和撤回这么多有缺陷的论文并不实际。亚拉巴马州大学伯明翰分校的肥胖症研究人员戴維·艾里森(David Allison)最近刚刚体验过对抗僵尸论文大军的挑战:去年,他和几个同行开始寻找并更正已发表论文中的错误。他们花了18个月,钻研了肥胖症、动能学和营养学等各自研究领域内的论文,共找到了几十处确定需要改正的错误。同时,他们也发现想要改正错误或撤回论文是件难事。“在尝试过和作者或期刊沟通至少 25 处错误以后,我们不得不放弃,因为太费时间了。”艾里森和共同作者在《自然》今年二月的一篇评论文章中写道。
艾里森表示,当他和共同作者指出论文中的错误时(典型的为统计分析或者实验设计上的问题),往往会遭到原作者的抗拒。“没有人愿意被当众指出错误,”艾里森告诉《科学家》,“我们都知道这些错误必须得到更正,但这是件苦差事。我们也真的不想看到严重的错误。”艾里森和同事随后把他们发现的问题告诉各期刊编辑,但多数编辑早已被新的、待发表的稿件淹没,没有精力去复审已经出版的论文。“编辑解决这个问题也很花时间,”艾里森说,“对谁来说这都是吃力不讨好的工作,我觉得这是那么多错误没被更正的重要原因。”
勇敢新世界
根除可疑论文的一个办法是发表后同行评议和线上评论,这在 Faculty of 1000 (F1000)、 PubMed Commons 和 PubPeer 等网站上已经很普遍了,一些传统出版商的官方网站也有评论功能。然而这种做法面临着各种挑战。“有几家期刊曾经开放过网上评论,后来又关闭了这项功能,”《科学》主编麦纳特在邮件中写道,“大多数期刊并没有足够的人力来监控评论区,维持文明、建设性的讨论。”
匿名性也是一个问题。PubPeer 去年因为允许用户匿名发表评论而受到猛烈批评。PubPeer 的创始人保留了他们的可匿名性,但站出来回应了批评。他们反驳道,匿名评论并不比注册用户的评论要低一等,并在十月的一篇博文中写道,允许用户发表匿名评论是“对法律攻击和网站安全问题的唯一有效防卫。”
一些研究人员指出,在现有基础上搭建新系统是不够的,为达到审查文献的目的,需要一个全新的,能保罗万象的科学出版方式。“我们目前的出版体系为将就而成,却统治了整个科学界而从未被评估,”诺塞克说。他理想中的系统,应该能够帮助人们根据所有现有的证据,评估一项研究的价值。正如帕博在 1985 年错误地鉴定了木乃伊 DNA,并在九年后发表的另一篇论文中承认自己的错误,“任何两篇科学文献之间几乎没有任何直接关联,”诺塞克说,“要解决这个问题,必须更好地展示真正的科学进程,也就是知识的积累过程。”
为了创造这种科学文献间的关联,诺塞克在过去的两年中,协助搭建了名为“共享研究生态系统”( SHared Access Research Ecosystem, SHARE )的通知服务,这项服务的合作方包括诺塞克自己的开放科学中心、研究图书馆协会、美国学院与大学协会,以及美国公立与赠地大学协会。“我们在尝试建立统一的、开源的研究事件数据库,不仅包含已发表的论文,还包括科研经费、临床试验、论文撤回以及其它一切科研事件,”诺塞克表示。这个庞大的数据库建成之后,他补充道,“下一步是要找到漂亮的展示方法,将不同的研究文献联系起来。这样,搜索和发现论文更正等信息就容易多了。”
在诺塞克预见的未来,科学论文不再是一幅当前知识的静物画,而是作者可以不断根据新知识更新的动态实体。“现在一篇论文就是一篇论文,而且永远不变,”诺塞克说,“然而当新研究出现时,我们应该能够修订过去的论文,创造出新的版本。论文永远不会‘完成’,因为我们对特定现象的理解还处于某个阶段。所以你可以想象,人们的职业生涯就是不断修正关于特定现象的同一篇论文。”
SHARE 项目,以及它在欧洲的关联项目 OpenAIRE 是可行的,诺塞克说。关键是要发展出相关技术,把与所有论文相关的海量信息转化为一条可供检索的通道,让科学家能够搜索、排序和过滤与某篇论文相关的信息。诺塞克承认,把所有科学文献,连同围绕出版论文的其它讨论集中起来,会是个大工程。但这可以做到,因为已经有了一个先例。“在互联网的新闻和媒体信息方面中,这个问题已经被有效解决了,”他说。谷歌等搜索引擎为用户提供了在海量信息中搜索的工具,人们从而能够融会大量信息,并寻找到所需的部分。
至少开放获取的《F1000-研究》期刊已经允许作者在提交论文后,根据其他用户的评论,进行发表后更正,并同时发布修改后的和过往版本,来创造“活着的”的科学研究。“我很高兴看到 F1000 和其它团队尝试新的模式,”诺塞克说。但真正的挑战是让科学界广泛认同并采用这种新的系统。科研人员和编辑都必须能够自由提交稿件、评论、数据以及论文评议。“要把这种基础体系应用到出版流程中,我们必须改变自己对出版的认识,”诺塞克说。
“我们都知道不能轻信论文的预印版,” 哥伦比亚大学的格尔曼补充道,“我觉得我们对已发表的论文也应该持同样的态度。”
不仅如此,艾里森说,科学界应该更新对数据和研究结果所有权的认识。“研究人员在一段时间内会负责这些数据,但它们归根结底是属于公众的。” 他说,“而这种认识不会在一夕之间改变。”
因此帕博的木乃伊 DNA、砷基生命和其它数不胜数的僵尸论文很可能将继续存于科学文献中,但还有一线希望,科学界会采纳更现代的出版和结果修正方式,论文会变得更加动态,僵尸大军的增速将有所减缓。
僵尸论文污染学术圈,研究者如何应对? |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?注册新账号
x
|