科學研究領域有很多頂尖的科學家,研究成績各有特色,一般是不好排名的。但是,也有很多機構和網站試圖對科學家量化排名。既然是排名,就要有一種衡量的標準,不同的標準,排名的結果會有不同。
對科學家的研究成果進行量化排名,大多是基於論文的被引用次數。一篇論文被引用的次數多,通常表示這篇論文的影響力比較大。如果一個科學家的論文比較多,而且,多篇論文被引用的次數都比較高,則該科學家的“被引用總次數”就很高。那麼,最簡單的排名就是按“被引用總次數”來排名。
是,也不是。每個學科的引用文化和方法不太一樣。不同學科的兩個科學家,他/她們的“總被引用次數”的比較,就好比蘋果對香蕉,不好說。於是乎,一般是按學科分開排名的。大家熟知的 SCI (Web of Science) 就按照這種方式,對每一個學科排出了一批所謂 “高被引用率作者”(highly cited authors) 。
後來,大家覺得“總被引用次數”有些不完善的地方,不能完全反映一位科學家的研究活力。比如,一位科學家也許僅僅發表了一篇影響力高的文章,被引用了五千次,但後來他/她的文章就沒有什麼被引用;而另一位科學家發表了七十篇文章,每一篇都被引用了至少 七十次,“總被引用次數”也是五千次,同樣的五千次,一般來說,後一位科學家被認為更有科學研究活力。
所以,所謂的 H- index 就被提出。這個 H-index 是啥東東呢?舉一個例子:如果一個人發表的文章中,有 七十篇文章,其中每一篇文章至少都被引用了七十次,則他/她的 H-index 為 70。
不管按哪種排名,它依賴的數據庫是很重要的。比如 SCI ,它的數據庫只包含了一部分 SCI 認可的雜誌,如果文章發表在其它非 SCI 雜誌上,或者被其它非 SCI 雜誌上的文章引用,這個就不會被 SCI 的排名計算在內。而且,SCI 不是免費產品,學校必須出錢訂購該產品,老師和學生才可以查閱,這裡有一些局限性。
現在網絡非常發達,有不少機構利用網絡的龐大數據庫,出爐了一系列排名榜,而且是免費產品,Googlescholar 就是其中之一。我們 每個人都可免費查閱,所以,有一些排名就是基於 Googlescholar 的數據。我對數學界比較熟悉,下面就用數學來舉例。比如,research.com ,給出的世界數學家排名榜,它是基於Googlescholar 上的 H-index 的數據來排的,見下表:
這裡有必要提醒一下,有些排名數據也可能被人為操縱後提高了,這種舞弊曾經發生過,比如我以前的博客文章 《學術雜誌的影響因子》中講到的例子,但這種情況是極少數的。總的來說,排名還是反應了實際的數學水平,比如,research.com ,按照頂尖數學家的人數的學校排名,見下表:
排在前面的都是頂級學校,這和我們一般的直覺是相符合的。
註明:ETH Zurich ,德文名稱:Eidgenössische Technische Hochschule Zürich (瑞士聯邦理工學院),愛因斯坦 ,開普勒 ,倫琴 都來自該學校。