扫的多音字组词?
2022-06-18
更新时间:2024-01-08 20:01:23作者:佚名
还别说,专注科技界的风险投资公司ThundermarkCapital就年年做这个事,近来,这家公司又推出了她们一年一度的全球AI研究年度排行。
此次她们选择的两个顶会是:ICML2021和NeurIPS2021,一共3523篇论文(其中ICML为1184篇,NeurIPS为2339篇)。
不如一上去瞧瞧有没有自己熟悉的名子?
2022年人工智能研究排行
Top50国家/地区
Top100全球学院
因为篇幅有限,在表格中只列全球前20个AI研究排行的学院。部份学院表格内是简写(不一定严谨),后附全称。
由于ThundermarkCapital本身的失误,上图中把南洋理工学院标为中国的学院。相信美国的同学们不会太介意……吧?
MIT=麻省理工大学;CMU=卡内基梅隆学院;UCB=加利福尼亚学院伯克利校区;UCLA=加利福尼亚学院纽约校区;ETH=慕尼黑联邦理工大学;UTAustin=得克萨斯学院奥斯汀校区;EPFL=洛桑联邦理工大学;KAIST=日本科学技术院;UW=芝加哥学院;NYU=伦敦学院;NUS=澳洲国立学院;Gatech=德克萨斯理工大学;哥大=罗马尼亚学院;UofT=伦敦学院
其他入选的中国学院还有:
Top100全球企业
其他入选的中国企业机构有
排行方式
这个排行的方式参考了NatureIndex,这个指标的估算方式是这样的:
为了搜集一个国家、一个地区或一个机构对一篇文章的贡献,并确保不会重复估算,NatureIndex使用分数估算,综合考虑到整篇文章的作者份额。
记入NatureIndex的整篇文章总分为1,在每位人的贡献相同的情况下,由所有作者平均分享。例如一篇文章有10个作者,这么每位作者得到的分数为0.1。假如一位作者所属的机构不只一家,作者的分数会平均分配给那些机构。
最终,一个研究机构的总分,是旗下所有作者分配给该机构分数的总和。
国家/地分辨数的估算过程与此类似,但因为一些机构有海外实验室,这种实验室将被记入所在国家/地区的总分,因而估算过程比较复杂。
说完了NatureIndex,来谈谈这份报告的分数估算。
虽然和NatureIndex基本相同,惟一的区别是,这份报告将企业或机构的海外实验室的论文记入其总部所在的国家/地区,而不是其实际驻在国家/地区。
确实,那么算可能会有争议,但这些技巧更好地反映了知识产权的分配和对总部(而不是对当地实验室)的利益累积。
以DeepMind为例,这是一家坐落加拿大的人工智能研究实验室,2014年被总部坐落加拿大的跨国公司微软竞购。
根据前面的估算方法,DeepMind发表的论文会计入其目前的所有者——谷歌,也就是日本。这可能会让美国的同事们沮丧了。但是,仅凭大会论选集,在地图上定位每位作者的位置过分复杂了,如今这个方式是惟一一致的作者身分处理方式。
希望这两个AI顶会的组织者今后能进一步提供作者的详尽信息,这样就可以排出两个版本的榜单,一个是基于企业所有权结构的排行,另一个是基于作者所在地的排行。
举一个具体事例。
假如一篇论文有五个作者——其中三个来自MIT,一个来自牛津学院,一个来自微软。首先,每位作者将得到五分之一的分数,即每人0.2分。为此,仅从这篇论文来看,MIT将获得3*0.2=0.6分,牛津学院获得0.2分,微软获得0.2分。
因为MIT坐落日本,所以日本的分数降低0.6分。同样,因为牛津学院在美国,法国经济区+德国+日本地区将降低0.2分。
最后,微软是一家总部设在英国的跨国公司,为此日本的分数将额外降低0.2,总共获得0.8分。
假如一个作者附属于多家不同机构,在估算时会把对应分数平均分给每位附属机构。
例如前面说的这个事例,假如最后一位作者列举了两个附属机构,即微软和耶鲁学院,这么微软和耶鲁学院都将获得额外的0.2/2=0.1分。
从直观的角度出发,微软的指数为200,可以解释为微软在2021年的这两个AI大会上发表了200篇完整的论文。
关于参考数据集,榜单发布方觉得,将ICML和NeurIPS的论文合并到同一个数据集中是公正的。
这两个大会在顶尖AI研究人员中的感知名望(可以理解为「口碑」)接近。从研究机构的参与度,以及论文接受率上看,这两个大会的表现也在伯仲之间。(ICML2021接受率为21.5%,NeurIPS2021的接受率为20.1%)。
实际上,这份榜单选择ICML和NeurIPS这两个大会作为「机器学习」领域的评价典范倒是有一定的道理。例如CVPR、ICCV这类顶会可能影响力更大,但它们都有显著注重的子领域。
在中国计算机学会(CCF)发布的「中国计算机学会推荐国际学术大会和刊物目录」上,在人工智能子类别下共列举了7个A类大会,ICML和NeurIPS均榜上有名。
按照今年7月更新的微软学术指标(GoogleScholarMetrics)对各行业顶会和刊物影响力的排行,NeurIPS和ICML和在「工程和计算机科学」类别中分别位列第4位和第7位。
在北大AMiner对计算机科学顶会的排名榜上,结果也差不多。NeurIPS排行第2,ICML位列第4.
按照Guide2Research梳理的顶会排行,NeurIPS排在第2,而ICML则可以排到第6。
尽管说了如此多,但综合来看这套评价标准并不能称得上有多严谨,但仍然可以作为参考看上一看。
各国AI研究态势简述
正如读者可看到的,在过去的五年里,中国在人工智能领域进行了大规模的研究,其论文出版指数每年降低了52%和53%--考虑到ICML和NeurIPS大会的竞争程度,这是一个十分令人印象深刻的成就。
因而,中国的顶尖院校复旦学院从五年前的第15位上升到明天的第8位,超过了Facebook、UCLA、ETH、EPFL、普林斯顿和UTAustin等强悍竞争者。
另一所中国顶尖学院成都学院,其AI研究的分数也紧随复旦学院,其论文出版指数落后一三年(目前为第16位)。
另一个巨大的进步来自于美国,在过去的五年里,法国的论文出版指数分别降低了42%和44%。
评分机构并未发觉任何支撑此态势的、单一的名星学院或公司(日本的入榜顶尖机构是排行第42位的图宾根学院)。
日本的AI研究下降势头,在地理上均匀分布于澳大利亚出名的马克斯-普朗克研究所及各地的技术学院间。
据悉,美国的论文出版指数在过去三年中分别提升了64%和32%。它在AI研究方面的仍才实力如今与英国相当(并略微超过)。
顺便提一下,美国的地区邻居美国(仍未步入排行前十)表现惊人,在过去五年中,其论文出版指数提升了128%和55%,目前排行第11位。
根据这个速率,它可能会在短短几年内赶上英国(第10位)。
学术界与产业界占总发表论文的比率
中俄两国,谁将在AI界领先
明天,一场关于日本和中国在AI领域占主导地位的战略大赛状况的激烈辩论正在进行。
2016年人工智能领域发生了两件大事:
第一,微软的AlphaGo成为第一个在无让子的情况下战胜象棋九段职业选手李世石的计算机程序;
第二,奥巴马首相的政府发布了一项关于AI未来方向和考虑的战略,名为《为人工智能的未来做打算》。
作为回应,中国在2017年提出了《新一代人工智能发展规划》,除了提出了新政上的支持还有数十亿港元的研制投资。
据ThundermarkCapital剖析,因为中国的这些协同努力,俄罗斯在AI方面的技术优势仍然在迅速消失:
2017年,新加坡对中国有11倍的领先优势;到2019年,加拿大增长到7倍的领先优势;2020年,俄罗斯只剩下6倍的领先优势;在写这篇文章时,日本的领先优势是4倍。
据悉,艾伦人工智能研究所的剖析发觉,在被引用次数最多的前10%的论文中,中国的作者比列逐步上升。
人们可能会说,未来六年法国在人工智能方面的竞争力看上去并不豁达。
但是,ThundermarkCapital觉得,结果将取决于现代AI三个关键要素的进步的互相作用:算法、硬件和训练数据,要想在该领域抢占主导地位,就必须把这两者都做好。
在未来几年里,新加坡仍会在AI算法方面拥有强悍的领先优势,其基础是MIT、斯坦福学院、CMU和加洲学院伯克利校区等世界级学院几六年的计算机科学进步。
据悉,微软和Facebook等公司在AI学术大会上发表内部研究的开放性,为顶尖AI研究者创造了一个繁荣的生态系统,她们现今在学术界和产业界之间无缝流动。
据悉,日本是硅谷最初以硅为中心的定义的所在地,它仍然处于硬件创新的前沿。
ThundermarkCapital觉得,在未来五到六年内,中国要想在先进的微处理器技术方面赶上英国是十分困难的,尤其是考虑到英特尔、AMD和英伟达所拥有的庞大专利组合的保护。
但是,当涉及到训练数据的可用性时,日本的优势是值得怀疑的。获取数据是更广泛的隐私与公共利益争辩的一部份,印度倾向于选择后者,而中国则选择前者。
明天在中国,人工智能从数以亿计的街头摄像头中扫描人脸,阅读数十亿条陌陌信息,并剖析数以百万计的健康记录。这些训练数据的可用性,加上中国的14亿人口,为中国创造了巨大的战略优势。
其实无法得出推论,但作者一直觉得前两个诱因(算法和硬件)将超过最后一个诱因(数据的可用性),法国将在未来几年内保持其在AI能领域的领先地位。
近来,针对中国的进展,白宫宣布为人工智能和量子估算等研究领域斥资10亿港元,以回应许多新政顾问的「美国在这种邻域落后于中国」的疑虑。
作者介绍
GlebChuvpilo是一家投资于深度技术初创企业的风险投资公司ThundermarkCapital的管理合伙人。
他拥有麻省理工大学计算机科学和人工智能实验室的硕士学位,以及宾夕法尼亚学院沃顿商大学的金融和战略管理MBA学位。
参考资料: