DIS 0 237 0.00% 20 3
ISSTA 0 205 0.00% 18 3
SCM 0 55 0.00% 4 1
SIGDOC 0 607 0.00% 35 13
SSR 0 105 0.00% 8 3
VLDB 0 146 0.00% 15 3
CHI 6 4471 0.13% 595 97
PODS 1 671 0.15% 75 18
ICSE 3 1918 0.16% 129 70
UIST 1 472 0.21% 80 15
ICIS 1 432 0.23% 0 5
HT 2 621 0.32% 57 17
SIGSOFT 3 675 0.44% 50 21
SIGMOD 9 1790 0.50% 223 35
WOSP 1 164 0.61% 10 8
IUI 5 595 0.84% 60 21
SIGIR 28 1352 2.07% 50 36
Total 60 14516 0.41% 1429 369
在这17个会议中,中国在6个会议中尚处空白状态。另外,CHI的6篇文章
有5篇是微软的,另外1篇来自IBM中国研究所。PODS上的文章是17年前的。所以,在
最近17年中,中国实际上在8个软件会议中是空白。其他几个会议,除SIGIR 以外,
论文数量占会议论文总数的百分之一以下。在软件工程这个领域中,中国论文数是
六个发达国家平均数的1/6,是美国加州的1/23。
四。操作系统,网络通讯和分布式计算。
在这个栏目下面我们很勉强地把操作系统会议SOSP,通讯会议COMM和分布是
计算会议PODC放在一起。这几个领域不象其他行业那样有一大批相关的ACM会议。然
而这几个会议历史都很长,率取率也比较低。SOSP会议是一个有将近40年的操作系
统会议,在此会议上中国论文一篇也没有。分布式计算会议PODC上也没有中国的论
文。COMM上有两篇中国论文,一篇来自国防科大,另一篇来自南京通讯工程学院。
国防科大的文章发表在2003年,当年的录取率仅为11%,几乎是10文章中挑选1篇;
南京通讯工程学院Guo Chuanxiong的文章发表在2001年,当时的录取率为9%。
代号 中文简称 起始年 录取率
SOSP 操作系统原理 67 18%
COMM 计算机通讯的应用技术和体系结构 69 11%
PODC 分布式计算原理 82 30%
会议 中国 论文 中国论文 美国 六
个发达国家
代号 论文数 总数 占总数百分比 加州 平
均数
PODC 0 849 0.00% 75 13
SOSP 0 331 0.00% 54 1
COMM 2 817 0.24% 94 14
Total 2 1997 0.10% 223 28
五。图形学与多媒体
在虚拟实体会议VRST和多媒体会议MM上,中国的情况比较好,非常罕见的能
够占到论文总数的4%--6%之间。VRST上的论文都是中国自己独立完成的,MM上虽然
有32篇微软的论文,但中国自己的论文还是占了大多数。图形学本身的论文情况接
近空白。SCG上唯一的一篇论文是明尼苏达大学同北京中科院合写的文章,SIGGRAPH
上有8篇文章出自微软,1篇出自IBM,另一篇是复旦与美国DAVIS大学合作。
会议 中国 论文 中国论文 美国 六
个发达国家
代号 论文数 总数 占总数百分比 加州 平
均数
PVG 0 45 0.00% 5 1
SCCG 0 114 0.00% 1 2
SI3D 0 220 0.00% 13 1
SCG 1 907 0.11% 72 28
SIGGRAPH 10 2165 0.46% 190 44
VRST 12 281 4.27% 13 10
MM 102 1727 5.91% 174 58
Total 125 5459 2.29% 468 144
代号 中文简称 起始年 录取率
PVG 并行和大规模数据可视性 99 无
SCCG 图形学 73 无
SI3D 交互式3D图像 87 27%
SCG 计算几何 85 35%
SIGGRAPH 图像与交互式技术 74 无
MM 多媒体 93 48%
VRST 虚实体软件与技术 97 36%
六。程序语言。
ACM集中了程序设计语言的许多重要会议,在这些会议的有关信息及中国
论文发表情况见下面的两个表。
代号 中文简称 起始年 录取率
POPL 程序语言原理 73 20%
OOPSLA 面向对象程序语言 86 19%
PLDI 程序语言设计与实现 87 22%
PPoPP 并行程序设计原理 90 30%
PPDP 说明式语言与实现 00 46%
ICFP 函数式语言 96 30%
CGO 代码生成与优化 03 32%
PEPM 部分求值和基于语义的程序变换 91 50%
LCTES 嵌入式系统的语言,编译和工具 95 26%
会议 中国 论文 中国论文 美国 六
个发达国家
代号 论文数 总数 占总数百分比 加州 平
均数
LCTES 0 168 0.00% 13 3
POPL 0 860 0.00% 58 16
PPDP 0 142 0.00% 3 8
OOPSLA 1 1205 0.08% 88 24
ICFP 1 310 0.32% 5 9
PLDI 2 495 0.40% 65 6
PEPM 1 166 0.60% 2 6
PPoPP 2 188 1.06% 24 2
CGO 1 89 1.12% 4 0
Total 8 3623 0.22% 262 74
POPL是历史最久,名望最高的会议,在这个会议的33年历史上,全中国没
有一篇论文(包括中国大陆,香港和台湾)。面向对象语言OOPSLA,函数语言ICFP,
语言设计与实现PLDI以及嵌入式系统语言和编译LCTES均属于语言方面有相当规模的
高水平会议。PLDI上仅有的两篇论文来自INTEL中国软件中心,作者是普林斯顿大学
博士毕业。ICFP和OOPSLA两个会议上各有一篇中国大陆论文, ICFP上的论文作者是
软件所Chen Haiming。OOPSLA上唯一的中国论文作者是Yingliang Zhao,他署名的
单位是西安交大和加拿大Regina大学。LCTES则没有中国大陆的论文。PPDP是一个比
较新的语言会议,没有中国论文。并行程序设计PPoPP是一个跨领域的会议,其中的
一部分内容是并行语言。该会上有两篇中国论文,一篇来自INTEL上海软件中心,另
一篇是中国科技大学与INTEL编译组合写。PEPM和CGO是语言领域内比较专门的两个
方向,这两个会各有一篇中国论文。PEPM上的论文是一个在武汉大学(学习/工作?
)的俄罗斯人的论文,CGO上的论文来自INTEL软件中心。
总体而言,在8篇论文中,INTEL占了5篇(包括与科大合作的一篇),外国
人一篇,在中加两个单位同时工作的学者一篇。能够完全算做中国独立完成的论文
只有软件所Chen Haiming在ICFP上的论文。
即使按8篇论文计算,中国在语言方面的论文也只有6个发达国家平均值的1/9,
美国加州论文数的1/32。
总体分析
以上是ACM会议里几个比较大的研究领域中中国论文的分布情况。其他研
究领域不再一一分析。附录中列出了每个会议的情况。
在本次统计的173个ACM会议(包括会议集)中,中国大陆第一作者的论文
总共有713篇,占论文总数83227的0.83%。相比之下,六个发达国家的平均数为1926篇,
美国加州的论文数为7481篇。在713篇中国论文中,大约有90篇是外国研究单位的论
文,其中微软73篇,INTEL有9篇,IBM有6篇,此外还有一部分是中外合作论文,完
全由中国独立完成的论文估计在600篇左右。这个统计过程可能有一些误差,但是基
本上能够反映中国在ACM上论文发表情况。
今年,中国已经超过英国、法国成为世界第四大经济体。本文中特别把中
国的论文发表情况同除美国之外的六个发达国家进行比较。统计显示,中国独立发
表的论文数不到这些发达国家平均水平的1/3,中国的ACM论文发表情况同中国的经
济地位不相称。
根据2005年成都文献情报中心郑颖[3]等人的研究,2003年中国被SCI收
录的论文数已达到世界SCI论文总数的4.48%。但是在ACM会议中,中国论文(包括在
中国的外国公司)仅占0.83%,远远落后于中国的SCI论文平均发表水平。在中国论文
中,有371篇集中在AICPS,ASPDAC和MM三个会议中,剩下的论文只有342篇。这些论
文占剩余的170个会议的75757篇论文中的0.45%,仅为SCI中国论文收录率的十分之
一。这种情况表明,虽然中国的论文总数相当可观,但是较高水平的计算机科学研
究工作依然稀少。
中国科学院自然科学史研究所张利华[2]和成都文献情报中心郑颖[3]等人
的研究显示,自90年以来中国的SCI论文发表量以每年两位数的百分比增长,近年的
增长速度达到每年20%。但是在ACM的核心专业会议中却很难看到这种增长,一些专
业甚至出现倒退的迹象。比如微体系结构的MICRO会议,在10多年前尚有9篇论文,
而近10年内一篇也没有。
最近十年里,一批核心领域的主干会议上没有一篇完全由中国独立完成的
论文。这些会议是:
体系结构方面的ISCA和MICRO会议
程序语言方面的POPL会议
操作系统方面的SOSP会议
数据库方面的PODS会议
MICRO会议和PODS在十年前有中国论文。POPL,SOSP和ISCA则从来没有
中国论文。集成电路方面的DAC会议虽然有9篇论文,但有6篇是同国外合作的论文,
另外3篇是15年前的论文。软件工程的两个重要会议SIGSOFT,ISCE上共有有6篇中国
独立论文。
并非所有重要会议都在ACM之中,但ACM在集成电路,体系结构,软件工程
已及程序语言方面集中的高水平会议比较多。在这几个大的方向上,中国论文发表
的总体情况如下:
会议 会议 中国 论文 中国论文 美国
六个发达
代号 数量 论文数 总数 占总数百分比 加州 国家
平均数
集成电路 11 41 9296 0.44% 1625 235
软件工程 17 60 14516 0.41% 1429 369
体系结构 8 11 4644 0.24% 501 77
程序语言 9 8 3623 0.22% 262 74
集成电路方面另有100多篇论文在南亚地区的ASPDAC会议上,如果加上这些
论文,集成电路方向的论文将达到论文总数的1.32%。体系结构的8个会议中,中国
共10篇文章;在近十年中,在体系结构方面文章数实际上是零。在程序语言方向的
9个会议中,中国共8篇文章,完全由中国独立完成的文章仅一篇。总体而言,中国
在集成电路和软件工程两大方向上情况稍好,体系结构和程序语言方向相当弱。
ACM在其他几个领域中也有一批相当重要的会议,但是并没有象上述几个大
方向那样构成会议群。
这项研究工作只是一个初步的分析,其中对大方向的划分,会议重要性评
价等等难免有误。更准确的分析需要专家评定各领域中会议的重要性程度,并且全
面考察包括ACM在内的各个计算机会议中论文发表情况。在此分析的重点是计算机核
心领域的会议,计算机应用领域众多,对应用领域的分析不是本次统计工作的重点。
几点初步意见
一。科研考核需要参考论文录取率。近年来使用SCI论文数的考核方式明
显提高了中国的论文数量。但是不同会议的录取率情况相差很大。即使在ACM会议之
间,录取率也很不相同,MM会议2篇投稿取1篇,ISCA会议5篇投稿取1篇,把这些不
同录取率的会议论文平等看待显然不公平。如果只考核论文数量,会使科研人员弃
难求易,专注于容易发表论文的领域,从而使许多难以发表论文的重要研究方向成
为空白。科研政策应该对录取率低的会议论文,以及填补国家空白的会议论文给予
更多的鼓励。
二。学术研究需要全面发展。中国是发展中国家,经费有限。发展战略
上一直有集中发展还是全面发展之争。两弹一星是集中资源发展的成功范例,大跃
进则是过分集中力量于钢铁粮食而导致经济全面倒退的例子。这次统计中发现,多
达一半以上的中国论文集中在三个会议中,其余的一半分布在另外170个会议里,发
展情况极不平衡。此外,在超过一半以上的ACM会议中,中国的论文是零。这种情况
表明,填补大量的空白领域是中国计算机科学的当务之急。以往的科研政策把研究
经费大量集中于少数几个重点单位,但是计算机的分支多如牛毛,几个单位的力量
不可能覆盖所有研究分支。国家对龙芯等重点项目的支持肯定是正确的,但是与此
同时也要兼顾其他大学和研究单位的发展。全面发展的一个重要理由是为了商业化。
一个单项成果无论怎样优秀,很难独立成为商品。单项科研成果通常被技术全面的
大公司所吸收,然后转化成生产力。在目前情况下,很多研究工作对中国没有用处,
因为没有配套的技术使之转换成商品。所以从商业化角度看,科研的全面发展是必
须的。
三。提高学术研究人员的待遇。本次研究显示,中国在计算机科学的基
础研究如体系结构和程序语言方面特别薄弱,有些地方甚至出现倒退。比如中国在
10年前有MICRO会议论文,现在反而没有。其中一个重要原因是难以留住研究人才。
比如在MICRO上发表了四篇论文的清华大学Bogong Su先生去了美国。虽然中国近几
年中有大批海龟回流,但是他们的绝大部分去了公司或在大学研究所里从事盈利性
项目。继续做纯学术研究的海龟虽然有,但数量相当少。由此造成计算机行业学术
研究人才入不敷出。这种现象的一个重要原因是以工资收入为主的人群在最近几年
的生活相对贫困化,工资的增长赶不上生活必须开销的增长。仅以住房为例,上海
北京等大城市几年内房价上升二倍到三倍。市区及周边地区房价相当于美国中等城
市的房价。这种情况使科研人员难以安心学术研究,尤其是对青年学者和海龟更是
如此。如果待遇问题得不到妥善解决,中国科研人员即使做出成绩,也会很快跳槽
到国外。
四。增加计算机科学研究的投入。本次统计结果显示,中国在集成电路,
软件工程,体系结构和程序语言几个大领域中,论文数仅为六个发达国家平均水平
的1/6到1/8。同美国相比差得更远,仅为美国加州的1/30到1/50。如果扣除10年前
发表的论文,扣除外国研究单位的论文,这个差距还要大得多。这种状况同中国现
有的经济实力是不相称的,中国至少应该努力使各个会议的论文数达到除美国以外
发达国家的平均水平。集成电路设计和软件设计行业是对环境没有污染,基本不消
耗自然资源的行业,这个行业特别适合象中国这样人均资源稀缺的国家,应该得到
国家的优先支持。在上世纪初,美国重应用轻基础,但是在60年代,由于苏联的挑
战,促使美国对科研政策做了重大改革,成立了NSF,NASA等机构支持基础科学研究,
使得美国的科技发展和经济实力全面领先世界。这一历史经验应该对中国有所启发。
结语
李开复先生在致李岚清副总理的信[1]中指出,中国的“研究水平远远落后
于国外”,“绝大多数的中国的计算机研究项目在美国都无法拿到经费”。张利华
[2],郑颖[3]等人对中国SCI论文的分析显示,中国高质量的论文较少。虽然中国论
文数量在世界排名第8位,然而,平均每篇论文引用率排124位。本文通过对ACM会议
的论文统计,更为具体地分析了中国在一批计算机核心领域同国外的差距。
孙子兵法曰:“知彼知己,百战不殆”。中国要提高计算机科学的水平,
了解中国同世界水平的差距是第一步。ACM 专业会议的论文数就好比澳运体育项目
的奖牌数。在1984 年的奥运会会上,中国金牌总数5块,排名第11位。当时,中国
在许多澳运项目中都是空白。由于举国上下对这些空白点的重视,中国的澳运奖牌
数终于在2004年上升到32块,排名世界第二。期望政府能够象重视澳运那样重视计
算机科学的发展,改变计算机科学研究的落后局面。
[1] 李开复致李岚清副总理谈教育
http://www.sx228.com/news0001/200511/20051128_23712.htm
[2] 张利华 藉由SCI的中国学术研究能量之国际比较,中国科学院自然科学史研究
所
http://www.ihns.ac.cn/zhanlue/wencong/zhanglihua0401.htm
[3] 郑颖 我国科技论文数量和影响力不成比例,成都文献情报中心
http://www.cas.cn/html/Dir/2005/11/23/13/50/99.htm
[4] ACM Proceedings
http://portal.acm.org/browse_dl.cfm?linked=1&part=series&coll=ACM&dl=ACM&CFID=69474979&
CFTOKEN=24508287
[5] 集成电路方面会议列表
http://www.eecs.umich.edu/~brown/conference_list.html
[6] 体系结构方面会议列表
http://www.cs.wisc.edu/arch/www/conferences.html
[7]VLSI Conferences
http://www.eecs.umich.edu/~brown/conference_list.html
附录 中国ACM会议论文分布情况
会议 中国 论文 中国论文 美国 六
个发达国家
代号 论文数 总数 占总数百分比 加州 平
均数
AFRIGRAPH 0 89 0.00% 1 2
ANSS 0 229 0.00% 8 2
AOSD 0 94 0.00% 1 4
APL 0 828 0.00% 34 22
ASPLOS 0 264 0.00% 41 2
ASSETS 0 198 0.00% 14 5
AVI 0 235 0.00% 13 13
C&C 0 125 0.00% 3 6
CASES 0 196 0.00% 28 4
CCSC 0 453 0.00% 2 0
CFP 0 77 0.00% 8 1
CITC 0 189 0.00% 3 0
CODES 0 398 0.00% 51 14
COLT 0 273 0.00% 18 8
CPR 0 631 0.00% 31 5
CQL 0 55 0.00% 5 0
CUU 0 57 0.00% 3 1
CVE 0 59 0.00% 4 1
DIS 0 237 0.00% 20 3
DPDS 0 40 0.00% 2 1
ECLIPSE 0 67 0.00% 5 2
EMSOFT 0 89 0.00% 14 4
ETRA 0 114 0.00% 5 2
EW 0 359 0.00% 19 9
FMSE 0 26 0.00% 2 0
FMSP 0 24 0.00% 5 0
FPCA 0 88 0.00% 6 1
HOPL 0 38 0.00% 2 0
HWWS 0 122 0.00% 11 3
ICAIL 0 283 0.00% 4 8
IOPADS 0 30 0.00% 1 0
IQIS 0 21 0.00% 2 1
IRTAW 0 130 0.00% 3 2
ISCA 0 992 0.00% 116 11
ISMM 0 71 0.00% 4 1
ISPW 0 74 0.00% 7 1
ISSS 0 322 0.00% 53 14
ISSTA 0 205 0.00% 18 3
ITiCSE 0 991 0.00% 15 19
IVME 0 17 0.00% 4 0
IWSSD 0 173 0.00% 8 4
InfoSecCD 0 58 0.00% 3 0
LCTES 0 168 0.00% 13 3
LFP 0 144 0.00% 6 2
MobiCom 0 376 0.00% 53 6
MobiDE 0 54 0.00% 6 0
MobiSYS 0 71 0.00% 8 0
NOSSDAV 0 114 0.00% 15 1
NPAR 0 53 0.00% 2 0
NPIVM 0 45 0.00% 4 2
NSPW 0 169 0.00% 15 3
PACT 0 67 0.00% 3 0
PADS 0 290 0.00% 25 7
PASTE 0 83 0.00% 3 1
PLI 0 38 0.00% 1 0
PODC 0 849 0.00% 75 13
POMC 0 24 0.00% 0 0
POPL 0 860 0.00% 58 16
PPDP 0 142 0.00% 3 8
PRS 0 24 0.00% 3 0
PVG 0 45 0.00% 5 1
RBAC 0 102 0.00% 1 3
SACMAT 0 183 0.00% 4 6
SASN 0 43 0.00% 5 1
SBCCI 0 111 0.00% 6 5
SCC 0 120 0.00% 9 1
SCCG 0 114 0.00% 1 2
SCM 0 55 0.00% 4 1
SESPSDE 0 91 0.00% 9 2
SETA 0 25 0.00% 1 0
SI3D 0 220 0.00% 13 1
SIGCSE 0 2451 0.00% 103 17
SIGDOC 0 607 0.00% 35 13
SIGFORTH 0 22 0.00% 3 0
SIGSMALL_PC0 162 0.00% 4 5
SIGUCCS 0 1507 0.00% 83 5
SLIP 0 110 0.00% 30 1
SOSP 0 331 0.00% 54 1
SPAA 0 559 0.00% 56 18
SPDT 0 41 0.00% 5 0
SRV 0 3 0.00% 0 0
SSR 0 105 0.00% 8 3
TLDI 0 21 0.00% 2 0
VIS 0 1090 0.00% 96 18
VLDB 0 146 0.00% 15 3
VRML 0 127 0.00% 15 6
WADAS 0 210 0.00% 11 1
WMC 0 25 0.00% 0 0
WORM 0 31 0.00% 5 0
WOSS 0 44 0.00% 6 0
WPDD 0 59 0.00% 4 0
WPES 0 62 0.00% 5 1
WS 0 21 0.00% 3 0
WSNA 0 33 0.00% 9 0
Web3D 0 205 0.00% 16 9
WoWMoM 0 64 0.00% 3 2
XMLSEC 0 24 0.00% 3 1
SODA 1 1580 0.06% 168 43
OOPSLA 1 1205 0.08% 88 24
SC 1 1229 0.08% 143 16
SCG 1 907 0.11% 72 28
CHI 6 4471 0.13% 595 97
ICS 1 729 0.14% 46 20
STOC 2 1465 0.14% 170 20
PODS 1 671 0.15% 75 18
ACM-SE 1 624 0.16% 2 1
ICSE 3 1918 0.16% 129 70
WSC 6 3656 0.16% 245 33
DATE 3 1414 0.21% 120 51
UIST 1 472 0.21% 80 15
ICIS 1 432 0.23% 0 5
COMM 2 817 0.24% 94 14
CSCW 1 407 0.25% 66 10
SIGMETRICS 2 798 0.25% 75 12
CCS 1 371 0.27% 37 11
DAC 9 3281 0.27% 673 59
RECOMB 1 355 0.28% 71 8
EDTC 1 342 0.29% 31 14
AGENTS 5 1619 0.31% 113 48
HT 2 621 0.32% 57 17
ICFP 1 310 0.32% 5 9
ICCAD 5 1483 0.34% 342 25
PLDI 2 495 0.40% 65 6
EuroDAC 2 487 0.41% 48 26
SIGSOFT 3 675 0.44% 50 21
SIGGRAPH 10 2165 0.46% 190 44
SIGMOD 9 1790 0.50% 223 35
SIGPLAN 1 201 0.50% 13 6
DL 4 774 0.52% 92 7
GROUP 2 375 0.53% 31 15
ISLPED 4 746 0.54% 116 17
Hypercube 1 178 0.56% 63 0
MobiHoc 1 179 0.56% 22 2
PEPM 1 166 0.60% 2 6
WOSP 1 164 0.61% 10 8
DocEng 1 159 0.63% 7 9
IMW 1 136 0.74% 21 1
IUI 5 595 0.84% 60 21
EC 2 231 0.87% 41 2
SIGAda 6 655 0.92% 48 9
CSC 11 1150 0.96% 37 11
JAVA 1 101 0.99% 11 2
KCAP 1 101 0.99% 12 4
PPoPP 2 188 1.06% 24 2
FPGA 5 459 1.09% 100 15
SAC 23 2117 1.09% 84 76
MSWiM 3 272 1.10% 15 15
CGO 1 89 1.12% 4 0
VolVis 1 84 1.19% 7 1
DIAL_M 1 82 1.22% 3 2
IEA_AEI 7 536 1.31% 26 18
KDD 9 650 1.38% 66 12
NetGames 1 72 1.39% 1 4
MICRO 9 608 1.48% 68 6
CIKM 16 1014 1.58% 68 30
ISPD 6 338 1.78% 88 5
SM 6 336 1.79% 15 10
GIS 5 277 1.81% 21 13
GLVLSI 7 368 1.90% 34 9
SYMSAC 1 51 1.96% 1 2
DOLAP 2 100 2.00% 0 4
SIGIR 28 1352 2.07% 50 36
Middleware 1 47 2.13% 4 1
ISSAC 17 714 2.38% 23 45
ASE 4 162 2.47% 6 6
CF 3 108 2.78% 7 4
WIDM 3 101 2.97% 4 3
GRAPHITE 5 159 3.14% 0 5
AICPS 167 4333 3.85% 136 174
VRST 12 281 4.27% 13 10
WWW 36 731 4.92% 97 25
MM 102 1727 5.91% 174 58
ASPDAC 102 1410 7.23% 161 47