SCI作為評價標準存在的問題-教育學術-萬維論壇-萬維讀者網（電腦版）

送交者: 397 2004年06月13日15:47:23 於 [教育學術] 發送悄悄話

SCI作為評價標準存在的問題

目前，我國不少科研評審機構往往根據論文被SCI收錄的數量，以及發表論文刊物影響因子的大小或論文的引用率，做出論文質量高低的判斷，從而給各個研究團體或個人做出評判。刊物的影響因子是指：某刊物前兩年所發論文在第三年被引用的總次數，與該刊物前兩年發表的可被引用的論文總數之比。在發表論文總數一定的情況下,影響因子直接決定於總體論文被引頻次的高和低，因此，採用影響因子來說明論文質量的高和低，實際上還是以引用率的大小決定論文質量。我們將在本文分析，由於SCI引用率統計數字存在諸多不確定因素，導致利用SCI作評價標準並不完全可靠。

1. 引用行為動機的複雜性，使SCI的引用率統計數字不能絕對可靠

引文概念是建立在這樣的前提之下的，即論文作者吸收利用了參考文獻（被引用文獻），引文分析法通過統計、加工和分析，得出具體某一篇論文作為參考文獻的被引用率，以此作為這篇論文質量高低的衡量標準，但對引文活動中不可計量因素則無法體現。從實際的科學活動看，人們在使用引文索引的過程中，常常不難發現其獲取的被引文獻有些與正文關係不大，有些甚至風馬牛不相及，存在着可靠性差的特點。儘管這可能與索引編制中的技術因素以及人們的檢索技巧有關，但很重要的原因還在於文獻作者引用行為的不規範。實際上，人們發現，論文作者的引用行為具有複雜性和多樣性。諸如以下幾種引用行為：轉引，對自己沒有親自查閱過的文獻從別人論文的引文中加以引用；崇引，不從實際需要出發，為了裝點門面,盲目搬用“權威名著”，或故意使用一些時髦的術語名詞；不恰當的自引，著者引用自己的文獻表明研究工作的連續性，但有的著者喜歡引用自己已經發表的與著文主題關聯不大或毫不相關的文章，以此擴大自己的學術影響；除以上所說的崇引和自引之外，人們還發現這樣一種現象，有些論文作者故意引用多種語言的文獻，或者故意在參考文獻中列出一些根本沒有引用過的文獻，甚至抄襲別人的引文。荷蘭科學家曾無意中發現，一篇論文在第一次被引用時出現錯誤，後來就能發現相同的錯誤會重複出現在另外數篇論文中。

以上幾種引用行為的共同特點是：論文的作者在參考文獻中列出了一些與論文內容無關的引文，我們把這些引文行為稱為偽引。有人對結構工程領域的21位傑出科學家的最近發表的42篇論文（每人兩篇）進行過統計，這些論文總共引用344篇文獻，人們發現以上所說的偽引的參考文獻竟占50%。這足以說明偽引現象的普遍性，在這種情況下，我們對引文索引的統計數字，不加分析地拿來使用，甚至作為科研成果的重要評價標準，就很難保證引用率數字的可靠性。

2. 漏引現象的存在，也影響引文統計的準確性

同偽引相反，科學界還存在這樣一種引文行為，有些論文作者實際上引用了別人的文章，但他們在自己的論文中，只列出曾經引用過的部分參考文獻，這種現象就是漏引。論文作者沒有列出的另一部分參考文獻，我們稱之為漏引文獻。研究表明，漏引現象相當普遍和嚴重，有人研究過在15篇遺傳學發展史方面的論文中，全部漏引文獻竟占應引文獻的70% 。

造成漏引現象，既有主觀原因、也有客觀原因。減少漏引，需要論文作者和刊物編輯部門的共同重視和努力。偽引和漏引現象的存在，都反映一篇論文的被引用率，和其客觀真實的科學影響還存在一定的偏差。儘管根據人們的統計分析，論文的引用率一般都能較準確地反映論文的質量，但偽引和漏引現象存在的廣泛性和嚴重性，使我們不能確保根據SCI統計所得的引用率數字絕對真實客觀，而當我們把SCI作為普遍的評價標準時，大量的質量和引用率較相近的論文，因這方面原因造成的誤差干擾就會更加明顯。

3. 引用率在不同學科之間也存在不可比性

SCI的引用率被人們用作為評價論文質量高低的一個重要指數，按照引用率的觀點，一篇論文的引用率越高，涉及的學科越廣泛，表明這篇論文的價值和影響就越大。然而，實際上人們發現，由於統計源的學科結構差別，以及各個學科自身發展的特點和特有引文行為的不同，如科學家研究行為的社會性，學科間交叉滲透的程度，學科發展所處的階段等，引用率在各個學科之間具有較大的差異性，由此產生了不同學科論文之間引用率的不可比較性。如物理、生化研究方面的任何發現，都會被國際同行重視和引證，研究論文被上百次引用的情況也不少見。而地學、植物學等，由於研究對象具有很強的地域性，研究論文被同行引用的情況相對就少許多，這與論文的實際水平並沒有根本的關係。

對於引用率在不同學科之間存在差異性，SCI的出版物中也有較多的說明，“（在ISI索引體系中）某些領域，例如天文學和數學，始終如一地是（處於）低被描繪（情況）。你可能認為其‘明顯’原因是數學家人數比，譬如說，生物化學家為數少些，或者你也可能想這是因為生化文獻量比數學的文獻量大。但在關於生化雜誌的一份詳細研究中我指出，原因（不只一個）而且並非如此明顯。”“生物化學家平均比數學家更多地被引述是因為生物化學的論文（所列出）的參考文獻一般約為數學論文中列出的參考文獻的3倍。此外，雖然文獻總量的多寡不影響各篇論文本身的影響力，但卻影響了引述的出現頻率的範圍。”“生物化學中的一個重要的方法，可能每年在各種生命科學的數千篇文章中被引用。但對純粹數學而言，被引用最多的文章也絕對達不到這個數字，因為每年總共才只有約40 000篇純粹數學論文被發表。”

需要指出的是，即使是同一學科，不同專業方向的論文和作者，他們論文的被引用情況，也有很大差別。如1965年—1978年被引用最多的1000名科學家中，理論化學的作者人均被引5227次，分析化學的作者人均被引2822次，物理化學、有機金屬化學、無機化學和有機化學的作者人均被引次數在3600—3800次左右。由此可見,學科間的SCI數據不具有簡單的可比性。

4. 某些論文獲得較高引用率在時間上的特殊性，也使引用率統計結果不盡準確

包括普賴斯在內的一些學者在對大量引文數據進行分析的基礎上，認為“文章被引用的峰值是在該文章發表以後的第二年”，從普遍的意義上，這與論文的實際被引用情況相符合。根據何榮利等對40種學報在3年內發表的9592篇論文的統計，基礎學科、生物學科、農業學科和應用學科不同種類文獻被引用率隨時間變化情況（稱為文獻使用壽命）也不同，基礎學科文獻使用壽命長，而應用學科文獻使用壽命短。加菲爾德曾把被大量引用的論文的被引用情況分成5種類型：高速飛彈型、流星型、遲開之花型、雙峰型和持久型。

由於不同學科發展歷史狀況不同，以及事物發展和人們認識的差別，儘管整體上論文的最大引文年限一般在論文發表後的第二年，但實際上存在着很多特殊情況，而科學論文的評審時間總有一定的界限，因而必然存在一些論文，可能因為內容的深邃性或學科發展的不完備，在人們評審的時間段內引用率並不高，但在某個時間段之後卻會獲得較高引用率。科學史上不乏這樣的例子，若一味地以引用率大小來論成敗，就難免有失偏頗。

5. 僅僅依據引用率一項指標，不能說明真實情況，也難以令人信服

按照目前的科學評價趨勢，SCI是以論文的引用率來衡量論文質量高低的，通常情況下，論文的引用率越高，則論文的質量被認為越好。然而，人們發現，有一些論文具有較高的價值，但它們卻並沒有較高的引用率，相反，有些因觀點錯誤而被批評的文章被引頻次卻相當高。例如，有這樣一些研究論文，起着結束某些研究領域的總結性作用，它們在以後可能將很少被引用，但不能說他們的論文和研究工作並不重要。也有這樣一些論文，因觀點已被廣泛傳播，並為眾人所熟知而不加引用；或者一些重要的論文在發表不久後即被他人類似的重要論文所代替，而很少再被引用，按照SCI引用率統計，這些論文的引用率也許並不高。在科學史上，不難發現這樣的事實，愛因斯坦(Albert Einstein,1879-1955)發現了相對論，並發表了關於相對論的重要論文，沃森（James Dewey Waston,1928--）和克里克（Francis Harry Compton Crick,1916-）發表的關於DNA雙螺旋結構的論文，都是劃時代的偉大發現，卻都因為發表以後不久便被認為是普遍承認的常識，而並未能得到應有的高引用率。另一方面，科學史上也發生過這樣的事情，有一些科學論文，在它們發表以後，得到了很高的引用率，但過後卻發現這些論文並沒有什麼價值，甚至這些引用率很高的論文，原來都是錯誤的。1903年，在陰極射線、X射線、貝克勒爾射線發現之後不久，關於射線的研究風行一時，這時著名的法國物理學家伯勞得老宣稱自己也發現了一種新射線，為了紀念他家鄉的城市Nancy, 他把它命名為“N射線”。在數年中，在最著名的科學雜誌上，發表了超過100位科學家的300多篇關於這一發現的論文。而且，還有許多科學家致力於重複伯勞得老的試驗（因伯勞得老宣稱缺乏所需的實驗器材），甚至，有超過40位的物理學家聲稱檢測到這種射線，但後來這一發現卻被證明僅僅是人的錯覺。由此可見，如果僅僅根據引用率來評定科技成果，就很難完全評定出經受起歷史考驗的研究成果，有時甚至會評出錯誤的結果。

對引用率高的論文的看法，有一些被引科學家，其中也包括相當一批諾貝爾獎獲得者，就認為引用率高，並不一定就表示論文很重要，海涅·富蘭克·卡潤特（Heine Fraenkel-Conrat）及其合作者都認為，每人至少可推出比被引最多的那篇更重要的另外10篇論文。往往一篇論文被大量引用，並不是出於它內容的精闢，而是由於它裡面所談方法的新穎。相當普遍的看法認為，被大量引用的論文中，方法方面的論文占很大優勢。例如，一位名叫Oluver Lowry 的人在1951年所寫的一篇關於方法方面的論文，到1990年被引用已經超過了20萬次。

6. 因文獻收錄不全而導致較大的漏檢率，限制了SCI評價的全面性和公允性

引文索引不僅以文獻的引文條數決定文獻在索引中重複著錄的次數，而且該文獻有多少次被引證就得著錄多少次，造成整個索引體系極其龐大，編制工作量大、價格也昂貴。這造成它不便於被收藏和普及，儘管有這樣龐大的體系，但SCI 僅收3300種期刊反映全部自然科學研究的引文情況，而目前全世界科技期刊總數約10萬種，每年發表論文不下300-400萬篇。由此可知，無論怎樣選擇期刊，也難免收錄內容的疏漏，使相關文獻的查全率較低，從而影響引文檢索的效果。因此作為面向全部科技領域的綜合性索引體系，SCI實際上並沒有覆蓋世界上所有的學科領域，而只能覆蓋重要的、公認的、主流的學科，對一些局部的研究領域就無法反映，因此也無可避免地會導致漏檢的存在，既然存在漏檢，也就使其評價的全面和公允性受到限制。

7. SCI來源期刊地域分布不平衡及語言障礙等因素，使SCI不適於作為我國通用的評價標準

SCI來源期刊的地域分布存在着明顯的不平衡性，與各個國家或地區的科技水平與綜合實力並不完全成正比。在來源期刊的收錄上，ISI側重於美國及母語為英語的地區及英文科技期刊，一些高水平的科技刊物往往由於出版地或語言因素而沒有被選收。對我國來說，近幾年所使用的SCI數據中我國期刊的採用一直很少，1997年SCI印刷版收錄中國期刊僅有9種，我國出版的數十種數學專業雜誌竟都未被選收，這直接導致了SCI對中國學者的報道偏少，很難設想用這樣一個評價標準可以涵蓋多數中國數學學者的工作。因此，以SCI為參照，鼓勵部分科技人員向世界最高水平衝刺，和用SCI為標準，評價所有科技工作者的日常科研成果，是兩件相互聯繫又不盡相同的工作，混淆二者的區別，就可能導致將SCI標準的濫用，非但不能充分調動多數科學工作者的積極性，反而可能導致群體科研信心的散失。

被SCI收錄的科技論文，一般都用英語書寫或至少要用英語規範書寫文摘，對1997年SCI收錄我國科學家的論文情況進行統計：收錄總數為10，033篇，其中8，325篇發表在國外刊物上，占發表總數的83%，國內發表僅有1，708篇，占17%；而從語種分布上看，以英語撰寫的論文有10，011篇，占論文總數的99.78%，以中文撰寫的僅有10篇，占0.09%，以法、德、俄、日文撰寫的論文為12篇，占0.12%。可見，東西方語言差異，不利於我國科技成果走向世界。在這裡，我們該思考另一個問題：儘管我國近幾年來一直重視英語教育，但對我國學者總體來說，像用漢語一樣流利準確地用英語書寫論文，還是有一定難度的，而英文書寫不規範，也是我國科技期刊難以入選SCI的一個重要原因。那麼，如果僅用SCI一個標準，就難以評價以中文發表在國內期刊上並且沒有被SCI收錄的高質量論文。例如，1991年-1995年間，我國著名神經外科專家王忠誠院士在腦外科研究上取得了重要的科學成就，他工作的單位被聯合國列為世界三大基地之一。王忠誠院士在這段時間裡發表了14篇論文，其中13篇發表在《中華神經外科雜誌》上，一篇在《天津醫藥》上，但SCI上只有他的一篇論文，還是發表在SCI所收錄的我國英文版期刊《Chin. Med. J.》上。又如，我國已故著名數學家、北京大學的廖山濤教授前些年關於微分動力系統的研究結果，都是國際第一流的成果，但並沒有在國外發表。

事實表明，地域分布及語言障礙等因素，使我國一些有影響的科技論文，在SCI計量中無法獲得較高的引用率，因此也影響了SCI標準對中國學者評價的準確性。

8. SCI對多作者合作論文的榮譽歸屬方式，不利於實施科研合作

當代科學研究的一個重要特點，就是科學研究的群體化，由於多學科、跨學科研究的迅速發展，多位作者合作的論文大量出現。在SCI索引體系中，可提供來源文獻的前8－9位作者的姓名，如果我們要檢索某人論文被SCI收錄的情況，只能檢索到作為第一作者的全部信息，他與別人合著的並以非第一作者出現的論文則無法反映，這樣就等於一篇論文的榮譽全部被歸於第一作者。關於如何劃分多作者合作論文的貢獻大小問題，爭議一直較多，SCI把全部貢獻看作為第一作者的，操作中我們認為有很多不合理的一面，許多時候，科研論文的作者對論文做出的貢獻可能大體相當，甚至一些論文並不是按照個人貢獻大小來排列作者順序的。現實社會中，科研合作的形式及範圍也是極其廣泛而複雜的，如不同單位間的合作，各國對合作署名順序的習慣安排不盡相同等等，按照SCI，非第一作者的單位，將不能直接檢索到本單位人員在科研合作中的貢獻。因此，如果我們完全以SCI反映的論文數及引用率數字去評價科研成果，而不作具體分析，將極其不利於科研團體及個人之間科研合作的開展，長期下去，將非常不利於科學的正常發展。

9. 使用“SCI標準”，不適合於評價應用研究成果

聯合國教科文組織把科學技術研究工作分成三個層次：基礎研究、應用研究和開發研究。其中只有基礎研究成果主要表現為科學論文、專利等形式，也最適於利用SCI進行評價；而應用研究成果的價值主要體現在應用前景上，開發研究成果的價值則表現在商業價值的實現方面。雖然這些研究工作成果都會以科學論文形式表現出來，但人們發現，技術類研究成果的論文，被引用率要比基礎研究方面論文的被引用率低得多，技術類研究成果的論文，每篇論文的平均引文量也要比基礎研究方面論文的平均引文量低得多。如果採用一刀切的做法，對全國各科研機構、高等院校等，不管他們的具體研究狀況，非要給他們定出SCI中的論文數及引用率指標，由此形成的社會壓力對我國科技的發展顯然是弊大於利，甚至導致基礎研究和應用開發研究比例關係的失衡。

除了以上幾點外，SCI作為評價標準還存在其它一些問題，例如有人指出SCI索引體系編制時間較短，不如一些有着悠久歷史的傳統的分學科的檢索工具優越；當某些刊物在世界上以多種語言出版時，這些刊物上論文的引文會被重複統計，給引用率統計帶來誤差；在某些特殊領域，比如一些涉及國家機密的國防科技研究，由於其控制傳播性，也無法利用SCI引用率作評價標準等。凡此種種都表明，把SCI評價標準絕對化，極可能導致我們對科研成果最終評價的判斷失誤。

0%(0)

	實用資訊

回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐：海航獲五星
海外華人福利！在線看陳建斌《三叉戟》熱血歸回豪情築夢 高清免費看無地區限制

一周點擊熱帖

更多>>

一周回復熱帖

歷史上的今天：回復熱帖

2003:	我所認識的沈校長
2003:	我親見親歷的荒唐工程
2002:	普林斯頓大學數學系的崛起
2002:	2001年的世界科技競爭和發展