CSRankings: 计算机科学排名
武夷山
计算机科学领域的惯例是,通过学术会议进行交流比通过学术期刊进行交流更重要。CSRankings就是依据计算机科学领域国际顶级学术会议上的论文量进行排名的。网址是http://csrankings.org/。
排行的编制者认为:“我们也许希望有一个不搞排名的世界,但是,愿望是无法让排名退出历史舞台的”。所以,还得搞一个靠谱的排名。
大家可以自己探索一番这个网站,看看这个排名的合理性。该排名的优势是,不仅列出各机构的论文数,还列出该机构从事相关主题研究的faculty人员数。Faculty的定义是:全职工作(指每年至少75%的时间投入本单位的工作)、进入长聘教职序列且能够独立指导博士生的教师。
2020年1月27日,我选择了计算机科学的两个子领域(人工智能和计算机理论),采用2010至2020年间的论文总量,看看排行结果。N人合著的论文,每人算发表了1/N篇论文,故以下的论文数带小数点。
该网站将广义的人工智能(AI)分为5个主题(狭义的AI;计算机视觉;机器学习与数据挖掘;自然语言处理;Web与信息检索)。在广义的AI领域,世界前10位机构如下。我国出现人工智能热已有好几年,故在这个领域的表现尚可。
#
Institution
Count
Faculty
1
► Carnegie Mellon University
卡内基梅隆大学
61.2
84:
2
► Tsinghua University清华大学
49.1
85:
3
► Peking University
北京大学
37.6
92:
4
► Cornell University
康奈尔大学
35.0
43:
5
► Stanford University
斯坦福大学
32.8
42:
6
► Chinese Academy of Sciences
中科院
31.9
40:
7
► Univ. of Illinois at Urbana-Champaign
伊利诺伊大学厄尔巴拿-香槟分校
25.6
45:
8
► Technion
以色列理工学院
24.0
47:
9
► Massachusetts Institute of Technology
麻省理工学院
22.5
61:
9
► Nanyang Technological University
新加坡南洋理工大学
22.5
38:
总体上说,我国在基础学科领域的理论研究方面均较弱。于是,我看了一下计算机理论子领域(包含三个主题:算法与复杂性;密码学;逻辑与验证)的排行,前10名中8所是美国机构,无一中国机构。该领域中,中国表现最好的机构是清华大学,排名世界第35位。
#
Institution
Count
Faculty
1
► Carnegie Mellon University,卡内基梅隆大学
19.0
24:
2
► Tel Aviv University,以色列特拉维夫大学
15.9
25:
3
► Massachusetts Institute of Technology,麻省理工学院
15.4
25:
4
► University of Warsaw 波兰华沙大学
13.1
24:
5
► Stanford University,斯坦福大学
12.7
18:
6
► Princeton University,普林斯顿大学
12.6
14:
7
► Cornell University,康奈尔大学
12.4
19:
8
► University of Texas at Austin,得克萨斯大学奥斯丁分校
11.9
11:
9
► University of California - Berkeley,加大伯克利分校
11.8
17:
10
► University of Washington,华盛顿大学
11.4
15:
该排行没有考察论文的被引用状况。为什么呢?编制者认为,引文是可以操纵的。比如,2017年,马来西亚的马来亚大学工学院公然出台了这样的硬性考核规定:教职员工每发一篇论文,至少要引用3篇同事们的相关论文。
该规定相关内容的英文版如下:
All Academic Staff
Faculty of Engineering
Sir/Madam,
Key Performance Indicators (KPI) Confirmation for 2017
Please refer to the subject-matter stated above.
2. As had been informed earlier, the KPI Confirmation for all University of Malaya staff has been opened and the final date for the KPI Confirmation is 9 August 2017.
3. For the Academic Staff at the Faculty of Engineering, the First Appraisal Officer (PPP) has determined the KPI for each departmental staff (please refer to the KPI). Under Section 6, Faculty Specific Duties you are required to type:
(1) “Citation: To cite at least 3 relevant papers of colleagues in each of your publication”
4. Other additional tasks are subject to the PPP of each PYD.
I would be pleased if you could take necessary action before 9 August 2017.
人们一般认为,论文数量只表示数量,论文被引用才反映论文的影响或质量。而计算机科学排行的编制者认为,引用状况是可操纵的,而在计算机科学国际顶级学术会议上发表论文很难,故该指标难以操纵。
奇怪的是,CSRankings网站并没有披露该排行的编制者是谁。有一则中文报道(https://yicaiglobal.com/news/six-chinese-colleges-place-in-csrankings-top-ten-ai-list)说,该排行是清华大学AMiner团队编制的。而百度百科的AMiner词条说,AMiner的含义是“科技情报大数据挖掘与服务系统平台”,但该词条未提及CSRankings。另一条中文消息(https://baijiahao.baidu.com/s?id=1621719437919078579&wfr=spider&for=pc)说,CSrankings由美国马萨诸塞大学安姆斯特分校的Emery Berger教授发起。也有英文信息源(https://github.com/emeryberger/CSRankings)说,CSRankings网站当初的主要开发者和目前的维护者是Emery Berger教授。我倾向于相信后一说法。
博主:1月28日下午5:50,补充一点内容。
魏瑞斌博主在评论中告知,清华AMiner团队确实也有一个排行,名称与美国的那个一模一样,都叫CSRankings。我没有去刻意纠错,但很容易就发现了两个排行均有明显错误,或至少无法解释的地方。
例如,在美国的排行榜中,2010-2020,按照广义AI统计,清华有49.1篇论文,按照狭义AI统计,清华反而有117.5篇论文,讲不通吧。
在清华的排行榜中,2009-2019,按照广义AI统计,清华有41.8篇论文,按照狭义AI统计,清华反而有107.4篇论文,同样讲不通吧。