


期刊影响因子(IF)是用于衡量科技期刊影响力的一项定量指标,科学家们对它是又爱又恨。科研人员会根据IF决定将自己的研究论文投稿到哪一份期刊,并以此判断同行的影响力,同时还对就业、职位和资助产生影响。所有这些都来自于一个简单的数字。
然而许多人认为IF对科学界无用甚至是毁灭性的。基于此,一个研究人员和期刊编辑组成的小组公布了一组数据,并使用这个神奇的数字对引用数进行了分析。他们的结论可能会令批评者高兴。
计算影响因子可能看起来简单,其实就是某刊平均每篇论文的被引用数,实际上是某刊在某年被全部源刊物引证该刊前两年发表论文的次数,与该刊前两年所发表的全部源论文数之比。例如Nature当前IF为41.456,通常解释为在过去2年中Nature上刊登的每篇文章被引用41次。
但这个数字很容易让人误解。例如,如果将文章的引用数比喻为人的身高,那么平均引用数则信息量很大。平均而言,男人通常比女人高,事实上,除了通过性别预测一个人的身高之外,并无其他方法。但对于发表在任何给定杂志的文章,引文的分布是高度倾斜的,也就是说,只有一小部分有影响力的论文获得大量引用,而绝大多数论文很少或根本没有被引用。所以引用的平均数经常会误导用户。
特别是IF有“两个问题,”西班牙巴塞罗那庞裴法布拉大学细胞生物学家Lucas Carey说,他并没有参与这项研究。一是“作为预测指标是无意义的”他说,也就是说在高影响力杂志上发表了一篇论文并不意味着它更有可能被引用。另一个问题,他说,“IF计算方式是不透明的。”
IF是由汤姆森路透(Thomson Reuters)这家私人公司计算的。只有付费后才能访问科学网络中的期刊数据库详情,同时引用数据并未公开。要想获得引文数据就必须从论文的参考文献部分收集信息。一般来说,不同期刊使用的文献著录格式均不相同,有些期刊还要求必须使用缩写格式,这样就会导致很难确定某篇文章是否被引用。另外,排版错误和失误也会增加数据清理的挑战。
那么为什么杂志出版商不相互合作,而使用汤姆森路透的数据库来计算他们自己的影响因子呢?去年在英国皇家学会的一次会议上,伦敦帝国理工学院细胞生物学家Stephen Curry提出了这一想法,“这不是很难说服人们,”他说,“在那之后的几个月已经有一些出版社进行了合作。”目前已有11份期刊参与了这项研究分析,这11份期刊分别是Science、eLife、EMBO杂志、Journal of Informetrics、Proceedings of the Royal Society B,Nature及其两份姐妹期刊。2013年和2014年两年期间,这些期刊共发表了366000多篇研究论文和13000评论文章。研究小组通过汤姆森路透数据库梳理统计了2015年这些文章的所有引用数。加拿大蒙特利尔大学期刊引文专家Vincent Larivière领导了这次数据分析。

▲11份期刊中,多达75%的文章的引用数低于期刊平均引用数
“研究小组就手头的分析数据与汤姆森路透取得联系,”共同作者、德国海德堡EMBO杂志总编Bernd Pulverer说。“这次讨论相当有建设性,而且汤姆森路透想继续对话”,“尽管实质上他们同意所有要点,但他们并不想做任何会使杂志排名崩塌的改变,因为这是他们的核心业务。”
“作者指出IF只能作为了解杂志影响力的辅助工具,”宾夕法尼亚州费城汤姆森路透产业发展与创新、知识产权&科学部门负责人James Pringle说。“IF是对期刊整体引文表现的反映,并不是各种出版指标的权力机构。”至于数据库中的错误,“汤姆森路透的编辑团队会不断与出版商合作,提高匹配程度、为作者提供简单的流程来纠正他们的记录、促进跨行业倡议,并鼓励标准标识符的使用。”