8月份,总部位于美国华盛顿的智库 “数据创新中心” 发布了一份超过100页的报告,分析了AI在中国、美国和欧盟发展的现状,并给出了相应的建议。
报告认为,在这波AI竞赛中,落后的一方将蒙受经济、国家安全、影响力方面的损失。报告也强调,除了竞争,AI的很多成果,比如公开发表的论文,涉及到公共健康、环境和教育的,原则上可以普惠地球上各个角落的人们,而就AI本身的发展应用,国家间的合作也必不可少。
报告选取了人才、研究、开发、应用、数据、硬件等六个方面进行比较,得出的结论总体上符合一般业内的认知——
尽管中国取得了快速的进步,但美国依然在AI领域处于领先地位,而欧盟则进一步落后;未来随着中国的进一步发展,这一排名可能会有变化。不过,如果考虑到人均,美国的优势进一步扩大,中国则掉到了第三。
具体来说,美国的优势表现在:AI初创企业最多,得到的投资也最多;在芯片方面全面领先,优势明显;AI方面的论文数量比欧盟和中国少,但平均质量要高。此外,美国依然吸引了全球大量的AI人才,且精英更多。
比较而言,中国优势的表现在数据和商业化应用方面,高质量的人才和研究方面依然欠缺,初创企业得到的资金有所减少,在芯片领域尽管有所追赶,但差距依然明显。而欧盟,尽管其论文最多,人才也不少,但在商业落地和资金方面却很不相称。
我们从报告中截取一些重要、有意思的点分享给您,详细内容请参考报告全文。
中国AI人才依然缺乏
报告用了AI研究者数量、顶尖AI研究者数量,AI顶级会议的参会者数量等指标来评估人才领域的竞争。 AI研究者的统计依据的是过往十年发表的AI方面的论文和专利,而所谓顶尖AI研究者选取的是H指数排名前10%的研究者。
从这张图看,中国在AI人才方面全面落后于美国和欧盟,不管是在绝对数量还是质量上。 报告也引用了另外一些指标,佐证了这一结论。比如,2018年7月清华大学中国科学技术政策研究中心发布的《中国人工智能发展报告2018》显示,全球拥有顶尖AI人才最多的前20所大学,中国只有清华,排在第15名。
全球拥有顶尖AI人才最多的前20所大学,清华排在第15名。(《中国人工智能发展报告2018》截图)
清华的这份报告还指出,AI研究者排名前20的公司,唯一入选的中国公司是华为,排第10名,有73名;在顶尖AI研究者排名前20公司中,唯一入选的中国公司华为排第20名,拥有7位顶尖AI学者,而美国公司有232位,欧盟公司有85位。
AI研究者前20名的公司,唯一入选的中国公司是华为,排第10名,有73名;拥有最多顶尖AI研究者的前20名公司中,美国公司有232名,欧盟公司有85名,中国只有7名,且都属于华为公司,排名是第20名。(《中国人工智能发展报告2018》截图)
报告认为,中国缺乏顶尖AI人才可能是由于中国最近才对AI感兴趣,中国大概只有四分之一的AI研究者的经验超过10年,而美国有一半。 该报告还引用了李开复(创新工场董事长兼首席执行官)的观点:缺乏顶尖AI人才不会对中国在AI领先世界方面造成障碍,理由是,尽管中国不见得有多少优中选优的佼佼者,但有大量高技能的AI研究者和实践者,不会影响AI的商业化落地。 有意思的是,报告还引入了 Educating top AI Researchers 这一新颖的指标,2018年在21个AI顶级学术会议发论文的研究者,他们的博士学位有44%是在美国取得,21%在欧盟,在中国的只有11%。 这说明,美国依然是AI人才培养的最重要的基地。此外,在美国获得数学和计算机博士学位的人里,79%计划留在美国;从1998年到2017年,1283名外国的AI研究者迁移到了美国,同期的欧盟则是834名,而中国只吸引了58名AI研究者。
中国AI研究质量有待提高
为了衡量研究的质量,报告采用了 FWCI 这一指标。该指标全称是 Field-Weighted Citation Impact,指的是总的引用量和该学科期望的平均总引用量的一个比值。 该报告发现,2016年,美国的 FWCI 是1.83,欧盟是1.20,中国是0.94,也就是说,美国研究者被引用的次数要比全球平均水平高出83%,中国作者的被引数则低于全球平均水平。从2013至2017年,出版最多AI论文前5所机构的 FWCI 值——美国(卡耐基梅隆大学、麻省理工学院、微软、IBM和斯坦福大学)达到了4.0,比欧盟的1.9以及中国的1.4要高很多。 当然,中国这些年的进步非常明显。 中国的 FWCI 值从2009年的0.59上升至2016年的0.94。最近,The Allen Institutefor Artificial Intelligence (AI2)还发现,引用最高的前10%的论文中,美国的份额由1982年的47%下降到了2018年的29%,与此同时中国则由几乎零引用上升到了26.5%。该报告的发现与别的AI研究报告,如斯坦福的《2018人工智能指数报告》的结论大体相符,2016年,中国的AI作者被引用率比2000年高出44%。
AI 商业化,欧盟落后
要想让AI发挥其潜力,造福社会,AI就必须从学界走向工业界,进行技术的应用开发和商业化落地。 从私募股权投资和风险投资来看,2017至2018年,美国以约169亿美元领先,中国是135亿美元,欧盟才只有28亿美元。2018年的私募股权投资和风险投资70%是种子和天使轮,针对的都是新的小型公司;而到通常至少千万级的C轮融资,中国和美国的占比分别为6%和5%,而欧盟只有1%,金额也偏少。 AI领域的收购反映了市场的活跃度,一些大公司也通过收购加强其市场地位。从2000年1月至2019年的5月,美国完成了526笔收购,欧盟139笔,中国更少,为9笔。收购前十名均为美国的公司,其中谷歌的母公司Alphabet收购了19家公司,苹果收购了16家公司,微软收购了10家公司,亚马逊和脸书也都收购了7家公司。 AI初创公司是整个生态链中的生力军,据咨询公司 Roland Berger 和柏林的投资公司 Asgard 统计,2017年美国共有1393家AI初创公司,欧盟有726家,中国有383家。2019年得到至少百万美元的AI公司数量,美国有1727家,欧盟有762家,中国有224家。2018年,美国初创公司得到107亿美元,比2017年的62亿美元有所增长;而中国的初创公司则从2017年的81亿美元缩减到了54亿美元。 在AI专利方面,作者指出,各个国家很难比较。值得注意的是,在中国申请的专利只有4%同时在其他辖区申请,而在美国专利和商标办公室(Trademark Office, USPTO)申请的32%的AI专利同时也在其他辖区申请。不过,从《专利合作条约》(Patent Cooperation Treaty, PCT)专利,也就是通常说的国际专利看,三个地区差别不大,美国为1863件,欧盟和中国相当,均为1000出头。
对AI的态度影响其应用
按照普华永道的预测,到2030年,AI的应用会创造13万亿美元的 GDP。 政府部门和企业等应用AI的程度在报告中也是一个非常重要的比较维度。 该报告参考了之前的调研,如波士顿咨询(Boston Consulting Group,BCG)在2018年调查了来自奥地利、中国、德国、法国、日本、瑞士和美国的超过2700名经理,得出的结论是,中国32%的公司应用了AI,美国是22%,欧盟大概18%。这表明,中国公司在AI应用方面要更为普遍。 不过,有意思的是,不像美国或者欧盟,中国各个商业部门应用AI的分布比较统一,美国不同部门之间会有32%的差异,但中国应用AI高的部门和低应用AI的部门只有6%的差别。 报告也对中国为什么会较为广泛地应用AI进行了分析,认为与中国各级政府的支持有关,比如加大投资,创造用户场景演示AI的好处,鼓励私营企业应用AI等。 中国能广泛应用AI还可能与中国人对AI的态度有关。波士顿咨询2018年的调研表明,76%的中国人认为AI对整个经济是有影响的,相比之下,美法德英西只有一半人这样认为。报告还引用李开复的观点,认为中国技术实用主义的文化更愿意去应用AI,尽管有人认为存在与AI相关的伦理问题,但如果能给社会带来好处的话,问题不大。 波士顿咨询2018年的调研表明,超过一半的中国人认为,未来10年他们的工作将因AI消失;而美国、法国、德国、英国则不超过三成。中国人也多认为,AI会加重阶层间、不同教育程度群体间的不平等。不过,另一方面,九成的中国人认为AI会创造新的工作,而美国只有不到一半的人这么认为,法国、德国、西班牙、英国更低,大概只有四成。 欧盟对AI的态度最为负面,英德法西有超过一半的调查对象认为,AI会给工作带来负面影响;美国的比例是约一半,中国是24%。另外,也有调查表明,40%的欧洲的企业管理者认为AI是新的、未充分证明的,而在北美和亚太区,这一比例要低,不到三成。
中国在数据方面占据优势
这一波以深度学习为主的AI的发展,离不开数据,尤其是高质量的标注的数据。报告承认,没有直接的指标来衡量AI方面的数据量和价值,所以用了一些间接的指标,比如固定宽带订阅数、手机支付的数量、物联网数据、生产力数据(productivity data,比如大数据分析)、电子健康记录,高精度地图数据(mappping data)、遗传数据等,同时也分析了监管方面的影响。 总的来说,中国在数据方面是领先的。比如2018年,中国大约45%的人使用手机支付,美国是20%,英国是13%,德国是8%。中国的物联网数据量也遥遥领先。 电子病历方面,2012年中国医院使用电子记录的比例增长到超过90%。2017年,96%的美国医院使用认证的电子健康记录系统,不过2015年的数据显示,只有30%的美国医院可以和其它第三方机构分享这些数据。一些定性的研究显示,欧盟和中国在健康数据分享方面甚至更低,中国病人经常带着病历到不同的医院看病,而欧盟在不同国家数据出境方面存在很大的差异。 基因数据方面,2017年有1500万美国消费者购买了基因检测的盒子,中国只有30万。此外,美国的公司,如Gene, Veritas Genetics,和 Full Genomes Corporation 对整个的人类基因组进行测试,不像其它公司只分析1%的基因组。这说明,美国可能更容易获取基因数据。欧盟国家,如德国和法国,直接面向消费者的基因检测是禁止的,而这两个国家的人口占到了欧盟人口的三成。 在高精度地图开发使用方面,美国较为领先。中国的法律规定,从事地图服务必须有相关的许可证,截止2018年1月,有14家企业获得了导航电子地图的资质。 在数据的监管方面,欧盟去年已经出台了迄今为止最为严格的数据保护规定GDPR,在数据的收集和使用方面有了诸多的限制。美国有些州的限制也很严格,比如加州有超过25项的隐私和数据安全的法律,包括最近通过的加州消费者隐私法案,2020年1月生效的时候将对收集和使用数据造成很大的限制。中国近年来也在立法加紧用户的数据隐私保护。有一些报道认为,目前中国公司相比美国和欧盟,在使用用户数据,保护隐私方面有更大的自由度,该报告也因此认为,中国未来在数据方面的优势会更加明显。 另外,中国获取数据的类型要广泛的多。美国的服务很多是分散的,由不同的公司和APP提供,但中国有超级APP,可以打车、订饭、订宾馆、缴费等等,数据是相互打通的。中国的互联网公司,很多业务线上和线下也是打通的。 但与一些国际公司相比,中国公司的不足在于主要还是拥有中国用户的数据;中国在促进不同平台之间分享数据的标准方面也需要提升。
硬件与芯片,道阻且长
某种程度上,图形处理器、AI芯片这样用来加速AI计算的硬件决定了企业在AI领域的竞争力。2018年,美国禁止企业向中兴提供零部件,使得中兴瞬间处于倒闭边缘。最近,美国还把华为及其子公司加入禁运名单。虽然中国加大了在这一领域的投入,但并非短时期可以赶上美国。 2019年第一季度,全球半导体销售前15名的公司中,美国有6家,欧盟有2家,而中国只有1家。2017年,芯片研究和开发支出前10位的公司中,美国公司有5家,欧盟0家,中国0家,而5家美国公司的研发费用达到了240亿美元。 依据多个来源的统计显示,从事AI芯片开发的公司中,美国有55家,中国有26家,欧盟有12家。在过去两年,几家中国的AI芯片初创公司收到了至少1亿美元的资金,而百度、腾讯、阿里巴巴、华为也在开发AI芯片。不过,中国毕竟是芯片这一领域的新手,在人才、技术积累和市场占有方面均存在差距。而欧盟在这一领域也比较落后。 在超级计算机方面,2019年6月,中国有219台,美国有116台,欧盟有92台。美国在超算领域的实力依然十分强劲,目前最快的两台超级计算机 Summit 和Sierra 属于美国能源部。此外,值得注意的是,前500名超级计算机使用的芯片,96%来自英特尔公司;133个超级计算机用到的加速器和协处理器,98%来自英伟达和英特尔。
中国AI,需要努力之处还很多
纵观整个报告,毫无疑问,美国在AI方面依然强劲,但中国正逐渐追赶上来,欧盟却进一步落后,尤其是在研究成果转化成商业应用方面。欧盟缺少像中美这样的大型公司,其过于严苛的数据监管对于行业发展来说可能并非好事。 报告提出,中国虽然有较丰富的人力资源,但面临着人才流失的困境,应该加大力度培植留住本土人才。 此外,报告建议,应该鼓励中国公司在海外人才集聚的国家发展研究机构,很多中国公司,比如华为、百度已经在这么做,好处是就地吸引人才而不必一定在中国居住。 在人才培养方面,报告建议应该鼓励学生修类似双学位的项目,同时修AI和其它科目,增强学生的创造力。中国教育部已经批准了35所大学开设AI本科专业,应该尽快批准更多的学校。但对于这方面的建议,目前中国学界存在一定的争议,笔者曾了解到,部分学者持谨慎态度,认为盲目的扩张不一定会带来相应的收益。 针对中国论文、专利数量都有所增长但质量存在差距的现状,报告建议中国应该改变激励机制,重视质量。 在研究开发方面,报告建议中国应建立更多的AI研究中心和实验室;应该特别鼓励大学和工业界的AI合作研究,提高资助,在评价大学表现时强调与工业界的合作研发程度。另外,报告认为中国应该鼓励与国外机构合作开展研究和开发。 数据方面,报告建议进一步开放公共数据,数据格式方面进一步统一,以利于机构间的分享。另外在数据跨境流动方面,建议减少相应的限制,这样有利于国际间的互惠合作。在芯片研发面临人才短缺方面,报告建议中国教育部应该和大学合作开发AI工程课程和学位,聚焦AI芯片的设计。
参考资料:
1. Daniel Castro, Michael McLaughlin, and Eline Chivot, Who Is Winning the AI Race:China, the EU or the United States?
2. 国务院关于印发新一代人工智能发展规划的通知,http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
3. “Artificial Intelligence: Have No Fear,” BCG Gamma, June 2018, https://de.slideshare.net/TheBostonConsultingGroup/artificial-intelligence-have-no-fear.
4. China AI Development Report 2018 (China Institute for Science and Technology Policy at Tsinghua University, July 2018),http://www.sppm.tsinghua.edu.cn/eWebEditor/UploadFile/China_AI_development_report_2018.pdf
5. Elsevier, Artificial Intelligence: How Knowledge is Created, Transferred, and Used (Elsevier,2018), https://www.elsevier.com/research-intelligence/resource-library/ai-report.
6. KAI-FuLee and Matt Sheehan, “China’s Rise in Artificial Intelligence: Ingredients and Economic Implications,” Hoover Institution,October 29, 2018,https://www.hoover.org/research/chinas-rise-artificial-intelligence-ingredients-and-economic-implications.
7. KAI-Fu Lee, AI Superpowers (Boston: Houghton Mifflin Harcourt, 2018)