注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

东边日出西边雨——江晓原的网易博客

 
 
 

日志

 
 

影响因子:学术江湖的《葵花宝典》   

2016-03-27 12:35:00|  分类: sci,jcr,影响因子 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

载《新发现》杂志2016年第3期

科学外史(117)

 

影响因子:学术江湖的《葵花宝典》

 

江晓原

 

影响因子:学术江湖的《葵花宝典》 - 江晓原 - 东边日出西边雨——江晓原的网易博客

为什么“影响因子”是《葵花宝典》?

  读过金庸《笑傲江湖》的人都知道,《葵花宝典》是江湖中神秘的武学秘籍,练成之后威力极大,所以人人争夺,闹得江湖上腥风血雨。但《葵花宝典》有个致命特点——“欲练神功,引刀自宫”!小说中所有练此“神功”的人一个个身心变异,全都没有好下场。

  正是在这个意义上,“影响因子”可以比作《葵花宝典》:发起这个游戏的西方人和少数西方杂志,已经在这个风靡全球的游戏中大获其利,但中国学术界如果跟着玩这个游戏,其结果必将是“引刀自宫”!

  从这一期“科学外史”开始,笔者将持续数期,为读者讲述这个当今学术江湖中还远远不为人所知的隐秘故事。这个故事包括如下要点:

  ▲“影响因子”是用来赚大钱的;

  ▲用“影响因子”赚大钱的人,如何让世人将他的私人商业公司误认为“国际权威科学机构”?

  ▲当初是哪些人和杂志发起了“影响因子”游戏,他们又如何从中大获其利?

  ▲“影响因子”可以如何使用“合法”手段操弄?

  ▲为何中国学术界跟着玩这个游戏就会“引刀自宫”?

  这次第一期,我们先窥看一些《葵花宝典》中的具体内容——暂不包括“引刀自宫”的骇人场景。

 

影响因子计算公式的第一个问题:两年期限

  “影响因子”作为一个专门术语,1955年首次出现在“影响因子教父”尤金·加菲尔德(Eugene Garfield)发表在《科学》(Science)杂志上的一篇文章中:

  通过该系统(指“科学引用索引”SCI),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

  加菲尔德最初将一篇文章的被引用次数作为“影响因子”,但8年后的另一篇文章中他把“影响因子”定义修正为“期刊文章的平均被引用次数”。而汤森路透(Thomson Reuters,加菲尔德当初创建的出售SCI和“影响因子”的私人商业公司ISI如今被它收购在旗下)现今逐年发布的“期刊引证报告”JCR)上,影响因子算法的标准定义是:

  期刊X在前面两年发表的源刊文本(source items)在当年度的总被引用数,除以期刊X在前面两年发表的文章(article)总数量,即为期刊X当年度影响因子的得数。其中“源刊文本”,指的是SCI(后来包括SSCI 和 A & HCI)任一收录期刊上发表的所有文本。 

  这个公式中的第一个问题是:源刊文本的“引用窗口”为什么设定为两年?为什么SCI期刊文本只在发表后第二、三年度发生的引用,才对期刊“影响因子”产生有效贡献?常识告诉我们此后引用肯定还会持续发生的。

  加菲尔德1972年发表在《科学》杂志上的文章,对这一设定作了解释,他逐年统计1964至1970年SCI收录期刊的参考文献,其中发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%。明明两年内的引用只占两三成,但不知何故他却就此得出了“论文被引用主要发生在发表当年后的两年内”的论断。照理说“两年期限”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要单独撰文、或至少也应该在文章中详细说明理由,但他却只用一条注释(该文注释29)糊弄过去。难怪一些西方学者感到无从知晓“两年”标准是依据什么得来的。

  针对这一问题,格兰采尔(W. Glanzel)和莫伊德(H. Moed)2002年发表的论文已经提供了一个非常有力的反驳案例。他们考察了医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(American Sociological Review),对两刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在头三年,《柳叶刀》论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,到第十年《美国社会学评论》的引用率就大大高于《柳叶刀》了。

  这一结果表明,对医学期刊和社会学期刊采用同样的“引用窗口”年限就不合理。医学作为最活跃的研究领域,新旧理论频繁更迭,其中某些成果发表后引发的关注甚至是爆发式的。但在人文领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。

  这就表明,汤森路透逐年公布的“影响因子”很难说是客观的。然而,在“影响因子”被捧上神坛的今天,学界即使意识到了这一点,也已经别无选择。2003年加菲尔德对这一问题的回应,就完全是一副“木已成舟能奈我何”的架势:“我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子,我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。”

  在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道。“它们需要单独订阅”,你想知道更多情况,另外再掏钱啊!——别忘了,SCI和JCR数据也都是要花钱向ISI购买的。

 

影响因子计算公式的第二个问题:分母变化

  第二个问题出现在“影响因子”计算公式的分母中。作为分母的“文章”(article)究竟指什么呢?按照加菲尔德最后的定义,“文章”只包括“原创研究论文”(original research paper)和“评论”(review)。

  我们中国人特别老实,办学术刊物就只登research paper,至多偶尔登一两篇review;办普及刊物那就根本不会登任何research paper和review。所以对中国人来说,计算公式分母中的“文章”不会有任何问题——它就是一本学术刊物所刊登全部文章的数量。

  可是到了洋人那里,情况却完全不同了!许多刊物除了刊登原创论文和评论,还要发表杂志社论、技术通信、通告、读者来信、科学讯息、观察报告、书评、影评乃至科幻小说!如今“影响因子”遥遥领先的几家最知名科学刊物——《自然》(Nature)、《科学》、《柳叶刀》、《美国医学会杂志》(The Journal of the American Medical Association),《新英格兰医学杂志》(The New England Journal of Medicine)等等,无不如此。

  在1972年发表于《科学》杂志的文章中,加菲尔德将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是“全部计入”不失为较为便捷的处理手段;况且“这些期刊上的非学术文本也是潜在的被引用文本”(见该文注释28)。但这种做法对《自然》、《科学》之类的期刊非常不利,他们的排名全都在40名之后。

  针对这一情况,1975年的JCR报告中,加菲尔德对规则作了调整,规定分母项只包括三类“学术文本”:原创研究论文、评论和技术报告(technical notes)。1995年度的JCR报告中分母规则再次调整,“技术报告”也被剔除,只保留“原创研究论文”和“评论文章”两项,这一做法保持至今。“非学术文本”不再计入的理由,已经变成“它们很难获得引用”——后文将表明这并非事实。

  分母大幅减小对《自然》、《科学》这类期刊的“影响因子”产生了神奇的效果,它们的“影响因子”排名全部大幅上升,其中《美国医学会杂志》竟惊人地提升了100位。对此加菲尔德只委婉承认“部分归结于这个原因”。

  请注意《自然》杂志——笔者已经在本专栏谈过它刊登的那些科幻小说了,它和“影响因子”之间有着极为微妙的关系,且待后文慢慢道来。

 

 

  评论这张
 
阅读(1198)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017