摘要 署名发表论文时,作者的排位需要遵守一定的规则。这个排位不一定能真实反映每位作者的贡献。大神Barabási利用论文之间的共被引关系测算论文中各位作者的贡献,这似乎能在一定程度上查出论文中的挂名作者。
闵超 / 南京大学与美国印第安那大学联合培养博士生 如果能查出论文中挂名……,细思极恐。一篇论文有两位作者,如图中论文A里的小红人和小绿人,我们可能会认为第一作者的贡献更大,也可能认为通讯作者(或末位作者)的贡献更大,还可能认为各位作者的贡献相同。我们判断贡献大小的依据只有一个——作者的排位。大神Barabási与常人的思维方式迥异,提供了一套无视作者排位的作者贡献测度方案。正因为与作者排位无关,该方案能在一定程度上查出论文中的挂名作者。 科学家之间的合作是现代科学系统的关键组成部分,尤其在跨领域、跨学科的研究中起到非常重要的作用。然而,对于那些由多个作者署名的科学作品,作者会根据各种各样的标准自行排名,不同作者的相对贡献究竟应该是多大,仍然是一个棘手的问题。
衡量作者贡献的方式多种多样 每个学位领域都遵循一定的作者排位规则,例如,按姓氏首字母排序,按作者的贡献从大到小排序等。目前,衡量合著文献中作者贡献的方式有三种:(1)将作品的所有作者都视为第一作者;(2)将所有作者视为同等重要;(3)根据作者的次序或者角色分配科学贡献。 Barabási的操作方案 Barabási认为,科学文献的引文模式中蕴藏着有价值的信息,可以从中挖掘出科学界对一篇文献中所有作者的相对贡献。他们据此设计出一种算法,可以客观呈现作者的科学贡献。这种算法不依赖于具体的学科领域,也不依赖于作者的排位。
注:图片来源于参考文献中的论文(在具备矩阵运算、共被引原理等知识后,看懂此图大约需要10分钟) 算法的思路是:(1)假设p是一篇待评价的目标论文;(2)找出引用了p的所有论文集合D;(3)找出D中的论文所引用的所有论文集合P;(4)计算p与P中所有论文的共被引强度s;(5)计算信誉分配矩阵A;(6)最后根据A与s计算论文p的每位作者分得的科学信誉。 Barabási等人利用数十位诺奖得主和他们获奖论文的引文数据,对上述算法进行了验证。实验发现,如果将算法得到的作者贡献分数作为标准,假设得分最高的作者将获得诺奖,那么实验结果的准确率将达到86%。需要注意的是,所有的实验数据都截止到论文获奖之前。 这项研究中提出的算法,基于科学共同体中最基本也是最可见的认可方式——引文,能够相对客观地作者的科学贡献,可以在人才招聘、基金资助和职称评定等方面提供建议。
编者注 或许在Barabási的眼里根本没有作者挂名,因此,这项研究的本意是撇开作者排位来推断每位作者的贡献,而不是检测作者是否挂名。意外的是,这项研究为我们打开了一扇门,让我们从此开启挂名检测之旅。 中国的作者排位比较复杂。当我们看到论文买卖的年交易额超过10亿的新闻时,我们或许只是看到了冰山一角,大量论文交易并非通过金钱完成。若干年前,写论文出专著或许可以东抄抄西抄抄,并可以逍遥法外。自从有了抄袭检测系统,没人敢赤裸裸地这么干了。当然,我们在挂名检测的旅程中,也可能遭遇道高一尺魔高一丈的尴尬。 Barabási的算法即便检测出某位作者的贡献极小,也只能认为疑似挂名,而难以断定。回到图中的左侧部分,论文A里小红人与小绿人的贡献分别为75%与25%,而如果小红人在共被引论文集合P中出现的频次更高,则小绿人的贡献将变得更小,甚至趋近于0。在这种情况下,我们有理由认为,贡献极小的小绿人并不足以被列为作者,有挂名嫌疑。但是,导致这一结果的原因很可能是小红人在该研究领域发文更多,而小绿人只发一篇论文,我们因此断定小绿人是挂名似乎并不合适。这一点与期刊互引检测非常相似,我们认为过高的互引有学术不端嫌疑,但不能因此断定这就是学术不端。 另外,我们还需要用大量的中国作者发表的论文来测试Barabási的算法,以评判效果并改进。无论如何,我们有信心认为,作者挂名只是中国学术发展特定阶段的产物,若干年后会消失在日新月异的检测技术中。
参考文献 Shen,H. W., & Barabási, A. L. (2014). Collective credit allocation in science.Proceedings of the National Academy of Sciences of the United States ofAmerica, 111(34), 12325-30. 文字编辑:李江 / 浙江大学
如果能查出论文中的挂名作者 |