| 大学排名的本质——你的母校为何不是“五大名校” |
| 送交者: 南海龙 2002年05月05日17:49:35 于 [教育学术] 发送悄悄话 |
|
作者:南海之子 大学排名的本质——你的母校为何不是“五大名校” 我的这篇文章目的在于澄清一些误导性的广告词,让大家对各种各样的大学排名有一个本质上的认识。灵感来源于学习经济学历史上最具有颠覆性的理论——Arrow’s Theorem。 要问你的母校为何不是“五大名校”,原因之一、你的母校确实不是;原因之二、你的母校没有收买“排名学专家”武书连,所以他没有把你的母校排到TOP5;原因之三、你不知道所谓五大名校是怎么“综合”出来的,看了下面我的分析,你自己也可以搞一个排名,设法让你的母校排入“五大名校”,绝对比武书连的排名更加“权威”。 首先我从收集数据开始,上次我做的“五大名校”调查已经得到了初步的结果,非常感谢接受调查的网友所提供的宝贵意见。以下是简要的调查结果: 1 2 3 4 5 THU Tsinghua University 一、如何评估这个调查结果: 这个结果似乎并不让我们满意,因为复旦和南大的先后次序没有被区分出来,那么我们稍微改变一下打分规则:第一名9分;第二名7分;第三名5分;第四名3分;第五名1分。统计结果为: 好了,这个结果区分开了五大名校的先后次序,且慢,如果我们重新制订打分规则:第一名11分;第二名9分;第三名7分;第四名5分;第五名3分,那么: 不过南海之子是清华的支持者,当然不会坐看清华排在北大后面,现在南海之子提出:“其实第一名和第二名没什么区别的,应该打相同的分数,第三名和第四名也没什么区别,也应该打相同的分数”。于是打分规则变成:第一名5分;第二名5分;第三名3分;第四名3分;第五名2分。那么: 科大的费拉里医生可能会抗议说,前面几次评估都是科大〉复旦,怎么这次变成复旦〉科大,南海之子你太不够意思了,帮了清华却忘了理工科的弟兄科大,结果把复旦给弄上去了。于是南海之子做了深刻检讨并且提出:第一名应该得到更多奖励,就象足球比赛里面赢球得3分,打平得1分一样鼓励胜者。于是规则重新修订为:第一名6分;第二名4分;第三名3分;第四名2分;第五名1分。这时候: 上海交大的哈哈贰可能很不服气,会抗议说,科大在合肥,四周都是野草,哪比得上上海交大,中国著名外企从来都只从清华北大复旦交大四所学校要人。南海之子考虑到哈哈贰生气伤了身子,为了让他Happy一点,于是顾不上费拉里医生,重新把打分规则修改如下:第一名15分;第二名14分;第三名13分;第四名12分;第五名11分。结果变成: 总结:到目前为止,通过修改打分规则我们已经得到几个相互矛盾的结果: 从这里可以看出,即使是相同的数据,只要采取不同的处理方式,就可以得到不同的排名,大学排名就好象揉面团可以根据自己的需要随心所欲。下面我们来看一下一些容易产生误导的说法: 1、我们的排名搜集的数据最全,所以我们的排名是最权威的。 2、我们不但考虑了理工科成果,还考虑了人文科学的成果,所以我们的综合排名最权威。 3、我们使用了很多计算公式,而不是简单的问卷调查,所以我们的结果更加客观,因而也更加权威。 谈到这里,武汉大学的皇室大仙可能会愤愤不平地为“中国大学排名第一网”的“排名学专家”武书连辩护了:单从排名的指导意义和公正性上来说,武书连的排名就是一个权威版本。我们不妨看一下武书连自己怎么说的:“方勇同学提出,科学计量学上的加权方法不适于解决大学排名评价这一复杂的系统工程。我不是科学计量学家,对此不敢妄加评判,只是觉得在科学计量学家还没有研究出更好的方法之前,使用加权方法或其它方法将复杂的问题简单化不失为大学评价的有效途径。况且在1949年科学计量学诞生之前,加权方法早已广泛应用于包括教育科学在内的许多领域”。 请大家看清楚一点,武书连都承认自己不是计量经济学专家,他凭什么跑去搞大学排名?连基本的数据处理常识都不懂,难怪弄出把武汉大学排入TOP10的笑话。 武书连的假设是违背常识的:他最重要的假设是预先假设人均产出相同(无论是理工科教授还是文科教授,无论是名校学生还是烂校学生)!(见“薛天祥、侯定凯”:如果两类大学产出相等或相近,那么人数越多难度系数越大,人均产出越低;同样,如果两类大学人数相等或相近,产出越低,难度系数越大,其结果是要把产出低的一类大学拉到产出高的一类大学一样,换言之,就是预先设定各类大学的人均产出是一样的)。如果这样,武书连只要统计一下各个大学的人数,然后乘以那个“相同的人均产出”就可以了。所以“排名学”专家武书连实际上就是“人口统计学家”。这样的排名,小学生都会做,难怪UTOP的排名会有这么多笑话,一言以蔽之——小学生的数学作业而已。 二、如果来个简单的一对一,结果如何? 既然数据可以任意进行“综合”,得到的结果也千奇百怪,我们就换个数据处理方法,来个一对一比拚。以下是一对一比拚成绩表(假设两个大学同时出现在排名当中),我们得到矩阵A: T Tsinghua University 说明:假设A(i,j)=a_ij,意味着有a_ij个人认为大学i比大学j好。例如A(P,T)=15,意味着受访者当中有15人认为PKU(北京大学)比THU(清华大学)好。A(T,F)=23,意味着受访者当中有23人认为清华大学比复旦大学好。 P T U F N 初步分析,从这个矩阵看,A(P,T)=A(P,T)=15,也就是说认为北大比清华好的人数和认为清华比北大好的人数一样多!北大清华不分上下。A(U,F)=14>A(F,U)=10,说明科大比复旦好;A(F,N)=14>A(N,F)=11,说明复旦比南大好;A(U,N)=14 >A(N,U)=7,说明科大比南大好。因此正确排名应该是: 且慢,我们再仔细分析一下:从数据当中,有7人认为科大〉北大,5人认为南大〉北大,0人认为复旦〉北大,因此,如果使用北大作为基准,后面三名的排序应该是科大〉南大〉复旦,而不是科大〉复旦〉南大。 可见混乱发生在南大和复旦的相对位置上,如果以科大为基准,我们得到14人认为科大〉南大;14人认为科大〉复旦,所以南大=复旦,但是有10人认为复旦〉科大;7人认为南大〉科大,所以应该是复旦〉南大——这样得到“复旦=南大”以及“复旦〉南大”相互矛盾的结果。 有意思的是,使用清华作为基准,我们将得到南大〉科大〉复旦。 好象清华=北大应该是共识了,这可未必,因为使用科大为基准,那么清华〉北大,使用复旦为基准,那么北大〉清华,使用南大为基准,则北大〉清华。 在这里,我们明显看到了学科设置因素对排名的影响。尽管有20人认为清华〉科大,但是只有18人认为北大〉科大。原因可能是认为对清华评价好的人同时也对科大评价好,因为同样是偏重理工的大学,而对北大文科评价偏低。同样的,有28人认为北大〉复旦,但是只有24人认为清华〉复旦。原因也可能是对北大评价好的人,对复旦也给出较好的评价。 以上文字,我们忽略了少数派的意见,下面我们看一下支持交大的网友如何评价5大名校的。显然,如果以交大为基准,我们得到复旦〉南大〉科大,因此科大被“非主流网友”所抛弃,如果这样的网友足够多,后三名的结果就变成复旦〉南大〉科大。 科大的网友可能会抗议说,应该以1对1的方式决定胜负,且慢,我们前面的假设是必须两个学校同时在一个网友的投票当中出现,才对这两个学校进行比较,现在复旦大学的网友可以提出,即使不同时出现,我们也可以比较,这就是:那个被排除出局的学校肯定比留下来的学校差。 因此支持复旦大学的同学增加了:因为有30人投票,结果14人认为科大〉复旦,10人认为复旦〉科大,还有6张选票没有同时投给复旦和科大。分析剩下来的6张选票发现:4张投给了复旦而没有投给科大;1张投给科大而没有投给复旦;剩下一张两个都没有投。所以比拚结果为科大 VS 复旦为15 VS 14,相差极小,如果复旦有能力贿赂剩下那个两个学校都没有投的选票,那么科大 VS 复旦将变成15 VS 15。从这里我们看到少数派的重要性,他们的意见远远不象我们想象的那么微不足道!想想看布什这个美国历史上最大的流氓是怎么当上总统的吧。 三、阿莱悖论 阿莱悖论是经济学上最具有颠覆性的理论,换成大学排行的语言就是: 如果存在满足这样条件的排名: 阿莱悖论告诉我们,任何所谓的“综合”排名,要么是不公正的,要么是有心人的事先设计。我们只要对原始数据进行了人为的处理和加工,就可以得到自己所希望的“综合排名”。所以最有价值的信息不是“综合”排名,而是原始数据,例如重点学科数量、各个学科权威专家对本学科的排名、论文数量排名、国家科技奖排名等等。每一个大学都有自己的特色,这些特色就体现在一些原始的数据之上,而不是所谓的“综合”排名上。所以争论排名极为无聊、没有意义,最好的排名应该是单科排名。使用的数据越多并不意味排名越权威,计量经济学有一个极为重要的结论:如果没有理论的支持,任何计量统计都有可能是Garbage In, Garbage Out。武书连不是计量经济学专家,所以就没有意识到自己的排名就是一个“Garbage In, Garbage Out”。 四、其他引申 |
|
![]() |
![]() |
| 实用资讯 | |




