學術文章的引用率在西方一直是一個評價一篇文章影響的重要依據。在中國,引用率引起大家的注意並成了評價一個研究者成就的一個指標是上個世紀末的事情。一方面,這代表了進步:一個研究工作如果沒有什麼影響,當然就不會很重要。另一方面,過分強調引用率也不行,會帶來許多負作用,例如,年輕的研究者會特別注意流行的研究方向和問題,完全為了多掙引用率。加之,不同領域中同行的多寡不同,同行引用習慣不同,引用率很難作橫向比較。文小剛說過一句話,引用率只反映了一般研究者對該項工作的評價,而一般研究者平均說來並沒有太多的超前意識。中國國家基金委的一些人意識到只強調引用率的負面效果,但到目前為止也沒有更好的辦法。不過,用引用率做參考還是一件好事。我在台灣待過,那裡的許多領域從來不看引用率。
最近幾個作者提出的一個新的評價學術刊物的方法可以用來取代普通的引用率,避免文小剛說的缺點。他們的方法叫做Google PageRank Algorithm,在他們之前就有人提出。主要想法是,評價一個演員在演藝界的地位不但要計及有多少演員認可她,還要看認可人自身的地位。這樣,演員們的地位指數形成一個線性系統,必須解聯立方程才能準確確定所有演員的地位(具體做法是迭代)。例如,喜歡超女李宇春的粉絲們中有很多既沒有影響也沒有品味的人,他們自身的影響因子等於0,他們欣賞李宇春不能用來計算李宇春的影響因子。
李宇春的粉絲數是流行度(popularity),不同於流行度的是聲望(prestige)。好萊塢一部電影的票房是流行度,能否獲得奧斯卡的提名就要看聲望了。同樣,引用率是流行度,而Google數是聲望。我們現在經常宣傳的Science,Nature這些刊物的影響因子大,也不過是流行度高而已。政府有關部門在過去數年不遺餘力地強調這些雜誌已經在年輕人中造成不好的影響。如果你去各大學BBS的科學版看看,經常看到宣傳這些雜誌上發表文章的帖子,不是去祝賀誰誰完成了一篇高水準的文章,而是去祝賀誰誰又在Science上發表了一篇文章。可喜的是,我昨天去參加一個973答辯的預演,當答辯人提到這些雜誌時,一個人站出來說,現在再強調這些會引起專家們的反感。
說到Science和Nature,我想起我們這行的Nuclear Physics B。這刊物在我做學生的時候是粒子物理中影響最大的,那時不論是老師還是學生,如果能在Nucl. Phys. 發文章就牛大發了,如果能發表幾篇文章,就成大師了。現在的情況是,如果在Science或者Nature上發表幾篇文章,也成大師了。不知道這樣的枯木大師遇到黃藥師的時候,還談不談Science和Nature?
剛剛有一篇研究工作將Google數用到Physical Review系統,他們的樣品是這個系統在1893年-2003年之間發表的35萬餘篇文章。他們發現,排名第一的是Cabbibo的關於Cabbibo角的文章,這篇文章的引用僅僅是是第54名。而引用率最高的Kohn和Sham的文章排名第3。Google數前10名是
1. 1963, Unitary symmetry and leptonic…, N. Cabibbo.
2. 1957, Theory of superconductivity, J. Bardeen, L. Cooper, J. Schrieffer.
3. 1965, Self consistent theory…, W. Kohn, L. J. Sham.
4. 1964, Inhomogeneous eletron gas, P. Hohenberg, W. Kohn.
5. 1967, A theory of leptons, S. Weinberg.
6. 1944, Crystal statistics, L. Onsager.
7. 1943, Stochastic porblems in …, S. Chandrasekhar.
8. 1958, Theory of Fermi interaction, R. Feynman, M. Gell-Mann.
9. 1958, Absense of diffusion in …, P. Anderson.
10. 1929, The theory of complex spectra, J. C. Slater.
第10篇文章在Physical Review系統中的引用率只有100多次。在這篇文章中,Slater引進了Slater行列式來描寫費米子波函數。這10篇文章的作者除了Cabibbo和Slater(還有Kohn的合作者),都獲得過諾貝爾獎。
現在,按中國的許多部門規定,必須以SCI統計的引用率為準,只有大圖書館才能得到這些統計,而且得到的統計肯定不准。Google數雖然更加客觀,但不切實際,誰來為你做這個繁瑣的計算呢?