人类对跟机器进行智能语音交互的痴迷从来就没有消减过。
在好莱坞的科幻片中,导演们经常为观众们勾勒出未来社会中智能语音操控一切硬件设备和软件系统的场景:人们用语音打开门禁和电梯,用语音对电脑和打印机发出指令,甚至用语音指挥烹饪器械自动制作美食。
但是请别误会:这不是“90后”一代人出生后的十几年里人们才冒出这种“新鲜”念头。实际上,早在30多年前,人类就梦想着与汽车进行对话。美国NBC在1982年至1986年播出过一部4季共84集的热门连续剧《Knight Rider》(中译名《霹雳游侠》,曾被央视和地方台引入国内),主人公Michael Knight驾驶着一辆具有高度AI(人工智能)的跑车KITT,它不仅能实现语音导航、无人驾驶,还能给主人公出主意、逗闷子……除了不会飞,KITT会满足你在陆上的一切行驶需求。
现在(对,不是你经常听到耳朵生茧的所谓“不久的将来”),人车语音智能交互已经能够部分实现此前科幻场景中对未来生活的描绘。
5月11日-13日,全球最大消费电子展CES在亚洲举办的分展--CES Asia 2016落地上海,包括宝马、华为和搜狗等多家公司都是第一次参加CES Asia。在这次展会上,搜狗旗下产品搜狗地图发布了车联网领域的最新产品——搜狗智能导航。
简单地说,这是一款全语音交互的车载导航产品APP,同时接入了第三方服务实时信息,车内所有操作仅靠语音就能控制。
搜狗智能导航特别强调了“Hands-free & Eyes-free”,即在行车导航操作过程中,彻底解放对双手和双眼的依赖,全部通过语音就可以直接操作所有导航和查询需求。
在一辆处于行驶中的汽车中,语音是实现车内安全交互的最佳方式,但目前车内用户使用语音交互的体验还比较糟糕,这是搜狗开发这款全语音交互产品的初衷。
与同类产品相比,搜狗智能导航对语义的理解更加深入,使人机交互对话更加智能化。
一次典型的使用场景是这样的:当你对着搜狗智能导航说出“汪仔你好”,即进入语音导航识别系统。你说要去北京大学北门时,导航会快速识别语音内容和意义,并提示说:“北京大学北门现在较为拥堵,建议从西门进入”;接近西门时,你向导航询问:“一个月前去过的韩式铁板烧是不是离这儿不远?”导航在查询第三方商家数据后迅速回复:“韩式铁板烧距离北大西门600米,需要等位半小时”,然后发出提示:“旁边有家中式烧烤,无需排队,人均消费100元,您要不要试试?”在得到主人肯定的回复后,导航自动将这家店放入收藏夹,并告诉你“到达北大西门后,步行10分钟即可到达”。
作为一款独立产品,搜狗智能导航既可以运行在手机上,也可以通过互联协议连接到车机,或直接运行在车机操作系统上。搜狗也可以提供语音或导航的sdk,用于满足合作伙伴的定制化需求。
全语音交互的基础是语音的高识别率及语义的准确理解。为了打磨这款智能导航,搜狗积累了3000万POI数据(Point of Interest,每个POI包含名称、类别、经纬度、附近的商铺等信息)、4000小时车载语音训练和支持超过10万级节点的语义网络。在如此庞大的数据基础上,搜狗针对POI专门优化后的识别正确率达99%,能实现抑制风噪、回声消除、儿化音过滤、语音纠错等功能,解决了在嘈杂环境下不能准确识别的问题。当语义理解存疑时,也会有人工坐席迅速介入。
随着语音识别和深度意图理解取得的长足进步,高度智能化的语音交互将成为车联网的入口。语音交互之于车联网,类似PC时代的浏览器之于互联网。谁能为用户提供更好的语音交互体验,谁就有可能在千亿级规模的车联网市场占据一席之地。在这方面,搜狗的核心竞争力是基于移动互联网的智能技术。
搜狗在2016财年第一季度的财报中披露,最近一年来,日均语音搜索次数增长超过1倍,搜狗手机输入法日均语音输入调用次数增加1倍以上,达到1.2亿次,是中国语音输入功能使用率最高的手机应用。
语音交互不再是简单地为用户抓取信息,而是向个人智能助理的角色转变。搜狗CEO王小川不久前就曾明确表示,搜狗产品未来进化的方向是“既提供答案,也提供服务”。在机器已逐渐参与判断真实生活的情境之下,搜狗未来的定位是要成为人类聪明的好助手。
那么,不妨从成为一个聪明的副驾开始吧。
版权:本作品由作者首发于经理人分享(managershare.com)。若非授权,转发时切勿删除版权信息,否则追究相应责任。