本文围绕阿里达摩院的十大科技趋势预测,多维度分析了感知智能与认知智能这两个概念。
日前,阿里巴巴达摩院对外发布2020年十大科技趋势,“人工智能从感知智能向认知智能演进”这一趋势位列榜首。
业内普遍认为,人工智能的主要发展方向包括运算智能、感知智能、认知智能:
运算智能,主要指快速计算和记忆存储能力。
感知智能,即视觉、听觉、触觉等感知能力。人和动物都具备,能够通过各种智能感知能力与自然界进行交互。
例如,自动驾驶是通过激光雷达等感知设备和人工智能算法进行驾驶信息计算,人脸支付是设备通过感知人脸数据信息进行身份确认。机器在感知世界方面的优势在于主动感知,因为机器可以充分利用DNN和大数据的成果。
认知智能,即“能理解会思考”,拥有处理复杂的事实和情形的能力。认知智能的发展分为三个层次:
第一层是语言理解
第二层是分析、推理
第三层是人格和情感
达摩院发布的趋势报告指出,人工智能已经在“听、说、看”等感知智能领域达到或超越了人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。而认知智能,则是未来人工智能热潮能否进一步打开天花板,形成更大产业规模的关键因素。
以公安行业为例,人脸识别只是让机器能够识别出身份,但是涉及到侦查、破案,就需要梳理大量的线索,推断出可能的结果,这仅靠感知智能是无法完成的。
认知智能的出现,使得人工智能系统不再只是简单的数据统计拟合,而是主动了解事物发展的背后规律和因果关系。认知智能可以帮助机器跨越模态理解数据,学习到最接近人脑认知的“一般表达”,获取类似于人脑的多模感知能力,进而带来颠覆性的产业价值。
达摩院认为,认知智能将结合自然语言处理、跨领域知识图谱、因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,进而实现感知智能到认知智能的关键突破。
自然语言处理技术和知识图谱是认知智能阶段技术发展的基石。在这个大趋势下,率先布局自然语言处理和知识图谱的企业将在认知智能时代具备强大的竞争力。
机器的学习需要基于文本进行,但机器对文字的理解存在巨大的技术难度,文本在不同场景中的处理方式也不尽相同,文本中蕴含的价值一直难以得到有效利用。
自然语言处理技术的作用,通俗地说,就是把自然语言转化成机器能够理解的符号,构建机器理解知识的基础。
当攻克的自然语言识别后,才可以将不同行业的数据连接起来,甚至将线上和线下的数据打通,为人工智能构建知识库做准备。
认知智能的发展离不开自然语言处理和知识图谱,因此掌握这两项核心技术的企业,自然能获得更大的价值。
国内认知智能布局情况及发展现状
目前市场上,认知智能技术的公司更多是基于自身业务转型,主要可以分为两大类别,一类是从大数据分析公司转型,如明略科技、百分点等;另一类是语音或者语言声学的公司,如科大讯飞、思必驰、云知声、快商通等,这类公司大多以语音识别、声纹识别为主。
其感知智能的目标是,实现高可用的感知智能,让机器有更多感知能力;任务包括语音识别、手写识别、图像识别等。
认知智能的目标是,实现认知智能的突破,部分取代人类的脑力劳动;其任务包括智能客服、自动阅卷、人机交互等。
另一家中国AI企业快商通,以声纹识别等智能生物识别技术建立感知智能“智能生物识别大脑”,以自然语言处理等技术建立认知智能“艾赋能大脑”,其目标是希望机器能够以语音和语言为入口,通过认知智能训练出不同领域的专家系统,进而赋能到整个社会。
当感知智能出现乏力时,认知智能的出现可以将产业升级拉到快车道。如今技术壁垒还在攻克,通用的认知智能技术尚不可应用在各行各业,但在细分领域,认知智能已经能够商用落地。
在公安领域,认知智能通过对犯罪者行为特征进行提取和模式分析,并可以开发出一套犯罪预测的AI模型,一定程度上提高社会安全事件的预警能力和对风险态势的感知。落地案例可参考快商通声纹综合作战平台、明略数据大数据研判系统等。