| 大學排名的本質——你的母校為何不是“五大名校” |
| 送交者: 南海龍 2002年05月05日17:49:35 於 [教育學術] 發送悄悄話 |
|
作者:南海之子 大學排名的本質——你的母校為何不是“五大名校” 我的這篇文章目的在于澄清一些誤導性的廣告詞,讓大家對各種各樣的大學排名有一個本質上的認識。靈感來源於學習經濟學歷史上最具有顛覆性的理論——Arrow’s Theorem。 要問你的母校為何不是“五大名校”,原因之一、你的母校確實不是;原因之二、你的母校沒有收買“排名學專家”武書連,所以他沒有把你的母校排到TOP5;原因之三、你不知道所謂五大名校是怎麼“綜合”出來的,看了下面我的分析,你自己也可以搞一個排名,設法讓你的母校排入“五大名校”,絕對比武書連的排名更加“權威”。 首先我從收集數據開始,上次我做的“五大名校”調查已經得到了初步的結果,非常感謝接受調查的網友所提供的寶貴意見。以下是簡要的調查結果: 1 2 3 4 5 THU Tsinghua University 一、如何評估這個調查結果: 這個結果似乎並不讓我們滿意,因為復旦和南大的先後次序沒有被區分出來,那麼我們稍微改變一下打分規則:第一名9分;第二名7分;第三名5分;第四名3分;第五名1分。統計結果為: 好了,這個結果區分開了五大名校的先後次序,且慢,如果我們重新制訂打分規則:第一名11分;第二名9分;第三名7分;第四名5分;第五名3分,那麼: 不過南海之子是清華的支持者,當然不會坐看清華排在北大後面,現在南海之子提出:“其實第一名和第二名沒什麼區別的,應該打相同的分數,第三名和第四名也沒什麼區別,也應該打相同的分數”。於是打分規則變成:第一名5分;第二名5分;第三名3分;第四名3分;第五名2分。那麼: 科大的費拉里醫生可能會抗議說,前面幾次評估都是科大〉復旦,怎麼這次變成復旦〉科大,南海之子你太不夠意思了,幫了清華卻忘了理工科的弟兄科大,結果把復旦給弄上去了。於是南海之子做了深刻檢討並且提出:第一名應該得到更多獎勵,就象足球比賽裡面贏球得3分,打平得1分一樣鼓勵勝者。於是規則重新修訂為:第一名6分;第二名4分;第三名3分;第四名2分;第五名1分。這時候: 上海交大的哈哈貳可能很不服氣,會抗議說,科大在合肥,四周都是野草,哪比得上上海交大,中國著名外企從來都只從清華北大復旦交大四所學校要人。南海之子考慮到哈哈貳生氣傷了身子,為了讓他Happy一點,於是顧不上費拉里醫生,重新把打分規則修改如下:第一名15分;第二名14分;第三名13分;第四名12分;第五名11分。結果變成: 總結:到目前為止,通過修改打分規則我們已經得到幾個相互矛盾的結果: 從這裡可以看出,即使是相同的數據,只要採取不同的處理方式,就可以得到不同的排名,大學排名就好象揉麵團可以根據自己的需要隨心所欲。下面我們來看一下一些容易產生誤導的說法: 1、我們的排名搜集的數據最全,所以我們的排名是最權威的。 2、我們不但考慮了理工科成果,還考慮了人文科學的成果,所以我們的綜合排名最權威。 3、我們使用了很多計算公式,而不是簡單的問卷調查,所以我們的結果更加客觀,因而也更加權威。 談到這裡,武漢大學的皇室大仙可能會憤憤不平地為“中國大學排名第一網”的“排名學專家”武書連辯護了:單從排名的指導意義和公正性上來說,武書連的排名就是一個權威版本。我們不妨看一下武書連自己怎麼說的:“方勇同學提出,科學計量學上的加權方法不適於解決大學排名評價這一複雜的系統工程。我不是科學計量學家,對此不敢妄加評判,只是覺得在科學計量學家還沒有研究出更好的方法之前,使用加權方法或其它方法將複雜的問題簡單化不失為大學評價的有效途徑。況且在1949年科學計量學誕生之前,加權方法早已廣泛應用於包括教育科學在內的許多領域”。 請大家看清楚一點,武書連都承認自己不是計量經濟學專家,他憑什麼跑去搞大學排名?連基本的數據處理常識都不懂,難怪弄出把武漢大學排入TOP10的笑話。 武書連的假設是違背常識的:他最重要的假設是預先假設人均產出相同(無論是理工科教授還是文科教授,無論是名校學生還是爛校學生)!(見“薛天祥、侯定凱”:如果兩類大學產出相等或相近,那麼人數越多難度係數越大,人均產出越低;同樣,如果兩類大學人數相等或相近,產出越低,難度係數越大,其結果是要把產出低的一類大學拉到產出高的一類大學一樣,換言之,就是預先設定各類大學的人均產出是一樣的)。如果這樣,武書連只要統計一下各個大學的人數,然後乘以那個“相同的人均產出”就可以了。所以“排名學”專家武書連實際上就是“人口統計學家”。這樣的排名,小學生都會做,難怪UTOP的排名會有這麼多笑話,一言以蔽之——小學生的數學作業而已。 二、如果來個簡單的一對一,結果如何? 既然數據可以任意進行“綜合”,得到的結果也千奇百怪,我們就換個數據處理方法,來個一對一比拚。以下是一對一比拚成績表(假設兩個大學同時出現在排名當中),我們得到矩陣A: T Tsinghua University 說明:假設A(i,j)=a_ij,意味着有a_ij個人認為大學i比大學j好。例如A(P,T)=15,意味着受訪者當中有15人認為PKU(北京大學)比THU(清華大學)好。A(T,F)=23,意味着受訪者當中有23人認為清華大學比復旦大學好。 P T U F N 初步分析,從這個矩陣看,A(P,T)=A(P,T)=15,也就是說認為北大比清華好的人數和認為清華比北大好的人數一樣多!北大清華不分上下。A(U,F)=14>A(F,U)=10,說明科大比復旦好;A(F,N)=14>A(N,F)=11,說明復旦比南大好;A(U,N)=14 >A(N,U)=7,說明科大比南大好。因此正確排名應該是: 且慢,我們再仔細分析一下:從數據當中,有7人認為科大〉北大,5人認為南大〉北大,0人認為復旦〉北大,因此,如果使用北大作為基準,後面三名的排序應該是科大〉南大〉復旦,而不是科大〉復旦〉南大。 可見混亂發生在南大和復旦的相對位置上,如果以科大為基準,我們得到14人認為科大〉南大;14人認為科大〉復旦,所以南大=復旦,但是有10人認為復旦〉科大;7人認為南大〉科大,所以應該是復旦〉南大——這樣得到“復旦=南大”以及“復旦〉南大”相互矛盾的結果。 有意思的是,使用清華作為基準,我們將得到南大〉科大〉復旦。 好象清華=北大應該是共識了,這可未必,因為使用科大為基準,那麼清華〉北大,使用復旦為基準,那麼北大〉清華,使用南大為基準,則北大〉清華。 在這裡,我們明顯看到了學科設置因素對排名的影響。儘管有20人認為清華〉科大,但是只有18人認為北大〉科大。原因可能是認為對清華評價好的人同時也對科大評價好,因為同樣是偏重理工的大學,而對北大文科評價偏低。同樣的,有28人認為北大〉復旦,但是只有24人認為清華〉復旦。原因也可能是對北大評價好的人,對復旦也給出較好的評價。 以上文字,我們忽略了少數派的意見,下面我們看一下支持交大的網友如何評價5大名校的。顯然,如果以交大為基準,我們得到復旦〉南大〉科大,因此科大被“非主流網友”所拋棄,如果這樣的網友足夠多,後三名的結果就變成復旦〉南大〉科大。 科大的網友可能會抗議說,應該以1對1的方式決定勝負,且慢,我們前面的假設是必須兩個學校同時在一個網友的投票當中出現,才對這兩個學校進行比較,現在復旦大學的網友可以提出,即使不同時出現,我們也可以比較,這就是:那個被排除出局的學校肯定比留下來的學校差。 因此支持復旦大學的同學增加了:因為有30人投票,結果14人認為科大〉復旦,10人認為復旦〉科大,還有6張選票沒有同時投給復旦和科大。分析剩下來的6張選票發現:4張投給了復旦而沒有投給科大;1張投給科大而沒有投給復旦;剩下一張兩個都沒有投。所以比拚結果為科大 VS 復旦為15 VS 14,相差極小,如果復旦有能力賄賂剩下那個兩個學校都沒有投的選票,那麼科大 VS 復旦將變成15 VS 15。從這裡我們看到少數派的重要性,他們的意見遠遠不象我們想象的那麼微不足道!想想看布什這個美國歷史上最大的流氓是怎麼當上總統的吧。 三、阿萊悖論 阿萊悖論是經濟學上最具有顛覆性的理論,換成大學排行的語言就是: 如果存在滿足這樣條件的排名: 阿萊悖論告訴我們,任何所謂的“綜合”排名,要麼是不公正的,要麼是有心人的事先設計。我們只要對原始數據進行了人為的處理和加工,就可以得到自己所希望的“綜合排名”。所以最有價值的信息不是“綜合”排名,而是原始數據,例如重點學科數量、各個學科權威專家對本學科的排名、論文數量排名、國家科技獎排名等等。每一個大學都有自己的特色,這些特色就體現在一些原始的數據之上,而不是所謂的“綜合”排名上。所以爭論排名極為無聊、沒有意義,最好的排名應該是單科排名。使用的數據越多並不意味排名越權威,計量經濟學有一個極為重要的結論:如果沒有理論的支持,任何計量統計都有可能是Garbage In, Garbage Out。武書連不是計量經濟學專家,所以就沒有意識到自己的排名就是一個“Garbage In, Garbage Out”。 四、其他引申 |
|
![]() |
![]() |
| 實用資訊 | |




