在美国数字营销专家查克·马丁看来,随着第二屏幕和第三屏幕即个人电脑和智能手机将第一个家庭成员从客厅拉走的那一刻开始,由电视媒介的繁荣所造就的客厅娱乐文化就已经注定了成为被互联网瓦解的第一道传统防线。
然而随着科技的进步,客厅娱乐的防守反击也愈发花样频出,从被寄予厚望的智能家居系统,到智能电视、智能音箱这样的关键角色,互联网分支力量与传统习惯的融合造就了新时代的客厅娱乐经济。
这其中,智能音箱成为了最为受人关注的一环。究其原因,在语音交互技术发展的大背景下,智能音箱产品不仅可以提供音乐、有声读物、信息查询等娱乐内容与生活服务,其兼具的语音交互功能在接入家庭生活场景后,更使其成为了在物联网时代智能家居控制中心的存在。
而早在2016年,有着「互联网女皇」之称的玛丽·米克尔在其发布的互联网趋势报告中,就将语音定义为新一代的「计算界面平台」,即将语音视为人机交互的下一个未来入口。
6月26日,国内人工智能交互科技公司Rokid在Rokid Jungle 2018发布会上发布了三款新品:便携智能音箱Rokid Me,AI芯片KAMINO18以及AR眼镜Rokid Glass,再度引发业界关注。
值得一提的是,喜马拉雅副总裁李海波为Rokid站台,宣布不久前上市当天即创下一系列堪称爆棚销售记录的晓雅mini智能音箱,背后技术提供商正是Rokid。
而在Rokid本次所发布的三款产品中,又尤以其自主研发的AI芯片KAMINO18所受到的关注度最高,这款大小与1元硬币相接近的芯片有别于当前主流的通用芯片,其内部集成了ARM、NPU、DSP、DDR、DAC等多个核心元件,实现了芯片模组的高集成度。同时结合了Rokid的相控阵技术、CTC模型、自定义唤醒词、离线语音指令、低功耗唤醒等语音算法而成,基于此,搭载KAMINO18的产品在整机工作状态下功耗则可降低30%-50%。
此外,结合了Rokid最新算法的这款芯片还将使智能音箱在复杂场景下的性能表现大大提升,并支持更多的离线功能。
简单地说,KAMINO18与当今市面主流芯片相比,在同等性能的情况下具有高集成度、低功耗、低成本三大优势。
更重要的是KAMINO18的问世标志着Rokid将AI芯片在语音交互领域的技术推进到了一个前所未有的地步——可以为不同需求的企业级用户定制语音解决方案。
这在很大程度上,将成为推动国内智能音箱行业步入质变发展阶段的关键。
其实,作为人工智能新时代家庭娱乐场景的重要入口,智能音箱市场近年来的火爆程度自不必多说,但却始终有着诸多痛点存在,如技术整合难度大、开发周期长成本高、欠缺深度定制TTS方案等。
在这之中,作为产品底层基础设施存在的技术推进与结合应用的落后则是根本原因,举个简单的例子,如果将语音交互拆解为前端的精确识别和后端的智能学习两个组织,目前的绝大多数公司都强于前者而弱于后者,因为二者的工作量级不啻天渊之别。
纵观当前业内主流厂商,包括思必驰、科大讯飞在内都使用的是通用芯片,而非一套完整的语音技术解决方案,这就意味着,智能音箱企业需要自行开发或整合后端解决方案,如小爱同学用的是声智科技的前端,天猫精灵用的则是思必驰的前端和ASR。
这就直接导致了智能音响产品开发耗时长,成本高的痛点。如小爱同学的开发用了接近9个月,天猫精灵前后经历近一年时间试水,腾讯听听花了两年时间打磨等。
而在正式发布KAMINO18之前,Rokid就已经为喜马拉雅的晓雅 mini 就已经提供了一套非常完整的定制化语音解决方案,根据用户群体使用习惯和喜好数据分析,进行精准调试以匹配内容与产品功能,而搭载了Rokid前端算法CTC的晓雅 Mini 在安静环境与AEC噪声环境中的唤醒率均领先行业水平。
另一方面,使用了Rokid提供的定制化解决方案后,喜马拉雅无需再承担核心技术和算法的研发、整合与应用成本,开发成本与时间均实现了大幅度降低缩短。最为直观的表现是,产品价格从999元直降到299元。
在这背后,是Rokid作为业内少有的能够提供包括前端、ASR、NLP、TTS 在内的完整全链路语音解决方案的公司,更在诸多技术层面有所领先。这体现在相较于其他友商的通用解决方案,其可以为不同需求产品提供定制化方案,包括儿童故事机、智能电视、智能家居等。
不难看出,相较于芯片生产公司,Rokid实质上更像是一家技术输出企业,其更注重通过芯片来提供足够的算力,实现芯片与算法更好的匹配,并降低成本,核心在于输出解决方案。
事实上,在Rokid本次推出KAMINO18这款AI芯片产品之前,其是以多款自主研发的智能音箱闻名于行业内外,如智能家庭机器人Rokid Alien,智能音箱Rokid Pebble以及智能家居语音遥控器Rokid Mini。
而从产品生产者变成芯片研发者,亦或者说从行业竞争者转向技术赋能者,Rokid的转变正在讲述一个新的故事。
正如美国淘金热时期,淘金客或许有一夜暴富者,但更多的则是得不偿失乃至血本无归,反而是那些转而卖水服务淘金客的人赚了个盆满钵满,并被写入彼时的商学院教材。
Rokid在推出多款成功的智能音箱产品之外,同时走上技术赋能行业之路,堪称成为智能音箱行业淘金热潮中的卖水人。
八十多年前,刘易斯·芒福德就忧心忡忡的告诫社会,警惕这种臣服于精密机器的可能性。
「当教徒可以经由《圣经》的印刷品感知上帝的时候,他也就被削弱了前往教堂亲历神父传道的欲望,当电话铃声不受主人约束的随时可以在书房里响起,工作和生活的连贯也就从此变得昂贵起来。」
但正如爱因斯坦所说,「我从不去想未来,因为它来的够快。」
人工智能与物联网作为下一个时代的到来几乎是板上钉钉,对于Rokid而言,其做的不仅仅是一门关于AI技术的生意,更是一桩新时代产业分工,多方利益最大化的生意。