摘要
研商,是一种度量学术天赋的指标,我们将其理解为科学家的科研能力的得分。Barabási的团队在Science上发表的论文发现,重要的科学发现严重依赖于研商和运气,而不是学术积累,不是后天努力。
文稿:李江 屈天鹏
论文推荐人:史冬波 / 上海交通大学
注:图片来源于参考文献中的论文
从事学术学习需要天赋吗?
Barabási的团队在Science上发表论文证明,想做出出色的学习是需要天赋(某种学术能力)的,这种天赋就像人的智商一样,并不依赖于个人努力。在整个职业生涯中,科学家的这种学术能力不会发生大的变化。因此,我们不妨称其为“研商”。
根据某大型搜索引擎的百科的定义,智商是通过一系列标准测试测量人在其年龄段的认知能力(“智力”)的得分,主要包括短期记忆力、推理能力和语言能力。“研商”可以理解为科学家的科研能力的得分。
做出出色学习成果的科学家只占一小局部,对于多数人而言,无论多么努力,终其毕生也没有重要的科学发现。研商高就够了吗?不是,要想有重要的科学发现,还需要一些运气。这种运气是选对学习领域与学习主题。
Barabási的团队发现,出色的学习成果(高影响力成果)取决于两个因素:研商和运气。模型表述为:C=p×Q,其中,C表示影响力,p 表示运气,Q表示研商。该模型的含义为,科学家随机选择了一个学习主题,该主题的潜力为p,科学家以天赋Q去深入学习,最后得到学习成果的影响力为C。更通俗地解释,科学家随机选择地方挖坑,挖到金矿的概率为p,科学家凭某种能力能更快找到金矿的准确位置。因此,要快速找到金矿,既需要运气,也需要科学家的某种能力。
学术积累重要吗?
按照传统的理解,在学术职业生涯中,经验积累非常重要,学术泰斗中年轻人极少。我们不怀疑对于单个个体而言学术积累的重要性,但在不同个体之间比较时,Barabási的团队发现,学术积累似乎没有那么重要,重要的科学发现可以出现在学术生涯中的任何时候,可以是第一年,可以是最后一年,也可以是中间的某一年。Frank A. Wilczek(2004年诺贝尔物理学奖获得者)的影响力最大的科学发现,是其学术生涯发表的第一篇论文。John B.Fenn(2002年诺贝尔化学奖获得者)的影响力最大的科学发现出现在其退休之后。
上图中清晰地显示,不同天赋的科学家从事学术学习工作之后,其成果的影响力分布不同。对于研商Q=9.99的科学家而言,其学习成果的影响力介于0至300;对于研商Q=3.31的科学家而言,其学习成果的影响力介于0至100;对于研商Q=1.49的科学家而言,其学习成果的影响力介于0至30。三位不同科学家的学术成就的差异,严重依赖于研商,而不是年龄,不是学术积累。
后天努力重要吗?
我们不应该否定我们的价值观,任何时候,对任何个体而言,后天努力都非常重要,笨鸟可以先飞。但谈到重要科学发现,对于不同的个体而言,研商似乎更重要。
对于研商高(Q=10)的科学家而言,努力发论文,产量翻一番,其影响力的最大值可以提升50次;而对于天赋低(Q=1.2)的科学家而言,努力发论文,产量翻一番,其影响力的最大值仅能提升7次。这种学术成就的差异严重依赖于研商,而不是后天努力。
“研商”的预测功能
当前所有关于科学家的定量测度指标都存在缺陷,即这些指标都不稳定,例如,发文量、被引次数、h指数等。这些指标值都会随时间增长,因此,无法比较处于不同发展阶段科学家。相比而言,研商Q值相对稳定,并不会随时间发生大的变化,因此,与科学家的发展阶段无关。比较两个年龄不同、学术积累不同的科学家时,用发文量、被引次数、h指数都难以发现差异,但用研商Q值,足以说明两者的差距,并预测未来的发展趋势。所以,预测诺贝尔奖得主,不必再依赖发文量、被引次数、h指数等指标,而可以直接用研商Q值。
研商Q值的优点是它对76%的科学家来说都是恒定的,而其它指标都随时间变化。研商Q值的稳定性使其能够预测科学家职业生涯的演化。低Q值科学家即使增加了发文量,也不能从本质上提高发表高影响力论文的几率。一个科学家的h指数(即至少有h篇高被引论文被引用至少h次)由其研商Q值和总发文量共同决定,Q模型可以准确地预测h指数的演变。例如,利用一个科学家职业生涯早期的数据(如前20-50篇论文)算出的Q值可以预测其后来的影响力(如h指数)的演化,早期h指数相同而Q值不同的两个科学家,在后期他们的h指数会拉开差距。
Q模型理清了科学成就、研商和运气在学术生涯中的作用,揭示了科学成就产生的统一模式,能够准确地预测科学家影响力的演化。
学术天赋受什么因素影响?
根据表达式C=p×Q,转化后可得Q值的表达式为Qi=e(logc10,i)-μp。Q不由单独的某一篇高水平论文决定,不由运气决定,也不由某一合著者决定,而是由贯穿学术生涯的高水平的学术能力决定,也就是说,可以根据科学家学术生涯前若干年的发表情况计算出科学家的Q值。
Q值与受教育背景、工作机构平台、学科领域规模、性别、学习方向、发表习惯等之间的关系现在尚不清楚。
数据与处理方法
一个科学家的生产力由发文量体现,而论文的影响力可以由被引次数体现,例如一篇论文发表后10年内的被引次数,以下简称“c10”,并将该科学家的c10值最高的论文简称“c10*”。
为了量化科学家影响力的演化,作者学习了2887位有20年以上发表论文经验并且至少发文10篇(每5年至少1篇)的物理学家于1893-2010年间在Physical Review系列期刊发表的论文。论文和被引次数来源于两个数据集:APS数据集和Google Scholar与Web ofScience结合的数据集。
基于被引次数的学习需要解决三个问题:(1)不同论文的被引曲线不同;(2)论文的平均被引次数随时间变化;(3)被引次数受学科领域影响。为了解决第一个问题,作者采用论文发表后10年的累计被引次数c10,消减被引曲线形态的影响;采用将c10值标准化的方法消减问题2和3的影响。
研商,一个判断你学术前途的指标 |
|