智能手表、智能后视镜、智能音箱、智能耳机 ...... 在中国,很少有像出门问问这样的 AI 公司,能将智能语音助手布局在从室内到室外,从车内到家庭等多种场景,并形成自己独有的语音助手生态系统,这件事,出门问问花 6 年时间做到了。
但观察出门问问这 6 年的变化你会发现,以 2012 年出门问问成立作为起点,其后的时间,无论产品朝何种方向,何种形态研发,实际都集中于消费电子领域,都集中于智能语音交互,对于这样一家专注于 C 端的公司而言,用户体验、产品设计和服务日渐形成其重要竞争力。
不过,在今年 5 月的新品发布会上,除了带来多款 AI 智能硬件新品,出门问问还正式发布了国内首款已量产,并可立即采购的 AI 语音芯片模组「问芯」,这时很多人发现,这家擅长 C 端产品研发的人工智能公司接下来要走的路,明显更加宽广了。
7 月 21 日,在极客公园 Rebuild 2018 科技商业峰会上,出门问问创始人 &CEO 李志飞在演讲中,对外展示了公司从 C 端起步,今年将向 B 端发力的诸多战略布局。
在李志飞看来,在语音交互从前沿技术转变为基石技术后,从智能语音起步的出门问问,下一步的商业化场景是向上游和下游两端打通。他认为出门问问要做好「赋能者」的角色,一方面是连接上游的芯片厂商,进行芯片模组的合作开发,一方面则是向下游纵深,开拓出更多适用于智能语音交互的垂直领域。
当天的现场演讲中,李志飞还带来了出门问问在 B 端的三款新产品问真 1.0、问保 1.0 和问家 1.0,通过智能语音交互方案,出门问问切入到 AI 金融反欺诈系统、AI 保险解决方案以及 AI 智能家居解决方案的更深层,从而在金融、保险等垂直领域找到了新的方向。
而发力 B 端之外,出门问问也开始尝试在 C 端触达更多消费者。据介绍,出门问问今年计划在全国开设 20 家线下智能体验店,尝试用更直观的、更个性的方式为用户带来智能体验。
同时,出门问问 CEO 李志飞还表示,对新的一轮融资持开放态度,但今年公司尚未有上市计划。
从集中 C 端到多端全面布局,2018 年的出门问问何以迎来如此巨大的转变,在 C 端积累经验之后,如今的出门问问又想和大家带来怎样的新故事,极客公园专访李志飞,为大家带来关于这些疑问的答案。
让线下门店作为 AI 新零售的实验场
Q:听说出门问问这个月会在成都开一个新的店,那么在成都未来还有什么发展计划?你觉得市场处于一个什么样的情况?
A:我们本月 26 日在成都 IFS 国际金融中心会开一个新的智能体验店。因为目前我们最多的还是 AI 消费电子产品,而像智能手表、音箱、耳机这类新型的智能产品,很重要的一点是用户能够在线下看得见、摸得着,否则他很难理解这个东西是干嘛的,长什么样的,体验好不好。所以我们今年有一个大的策略,会在全国范围内的重点城市开 20 家线下智能体验店,这个智能体验店在成都你们马上也能看到,成都是商业环境很不错的地方。
线下体验店有几个目标。第一个,是品牌展示和建设。因为我们的产品是新的品类、新的品牌、新的用户使用场景,没有这种品牌的体验是比较难的。
第二个,规则的建立。是去学习了解该怎么做,知道线下是怎么玩的。只有我们自己开了店以后,我们才知道展陈该怎么做,包括培训店员怎么做,管理这些店员怎么做,这样可以了解得更清楚。这样假设我们在利用第三方渠道销售的时候,也会了解如何把这个产品真正卖出去,做得更好。这是一个规范,包括展陈、培训、话术、服装都要统一。
第三个,把它作为一个渠道,未来希望线下销售能占据总体销售的 20%。我们的店目前来说还在投入期。
第四个,我们想探索 AI 新零售的做法,市场有很多做新零售的科技创业公司,有一个很大的问题就是他们不知道怎么开店。所以我们开了自己的店,卖自己的产品,这是一个做 AI 新零售的实验场。
Q:新零售的方式具体会有哪些措施?
A:其实现在很多都是基于这种偏视觉的,比如说首先我们有装摄像头,我们希望有不同的产品,过来是一个男的,这个屏幕显示的是智能手表,但是过来是一个妈妈带着一个小孩,会显示儿童的音箱。线上其实是千人千面,这个非常普遍。线下没有这个东西。因为我们有无线智能耳机,我们的店员可以佩戴这个耳机,当你第二次进来的时候系统就会提示,如果你是我们的 VIP,未来在我们的手机 App 里面,你可以主动把你的照片放进去,下一次你进来,我们店员就知道了你是谁。之前有做很多的尝试,在我们的零售店里集成 AI 的技术。
Q:我们对线下零售的营收会有要求吗?
A:我们肯定要去优化,但是我们不一定要赚到多少钱,或者做多少规模,20 家店是我们今年的规模,跟整个线下的店面比还是少很多。进第三方店面一、两千家。所以线下整个零售是一整套体系,我们自己的自有体系。但总体来说,我们希望线下有更高的比例,以前 5% 不到,现在想做到 20%。
把 C 端经验变成 B 端优势
Q:你今天说要将 B 端作为一个重点来做,重点在哪几个区域?
A:主要是两大类行业,一个是 IoT 的设备场景,比如跟我们合作的是做智能电视、机器人、智能家居的厂商,主要是用到 AI 语音芯片模组的地方。To B 场景服务主要是金融和保险。
AI 有 To C,有 To B,也有 To G。To G 是比如医疗、教育、政法方面。我们还是偏向于 To B,因为 To C 和 To B 无论是在最终面对的消费者用户上,还是在用户体验上都有很多关联。
Q:出门问问的芯片是和杭州国芯合作,这和现在其它厂商做的事情有什么差异性?
A:我们做了两件事情,芯片是其中这一块,我们第一个做了一个模组,这个芯片以外,还有连接器,这首先是一个模组。
第二件事情,我们把我们最核心的算法整合到这里面去,把它整合成 DSP 的代码,还有神经网络单元计算的 NPU,我们做了整个的电路板整合,做了整个软件算法的集成,因为我们有一整套的语音交互,所以我们在电视上有 SDK 可以连到云端,这个是我们做的事情。
跟市场上有什么不一样的话,比如讯飞也有模组,但他们不是基于这种 AI 芯片做的,他们的芯片模组特别大,而且价格很贵,区别就是首先我们有先发优势,而且我们有软硬结合的能力,另外厂商以前磨合需要很长的时间,我们是外接模组,所以没有需要磨合的过程,有些合作厂商花三个星期就可以完成。
Q:我们今年推出了语音芯片模组,您刚才也介绍了其实我们已经在一些电视厂商和一些电视机顶盒的方向,那这个语音模组还有别的产品吗?
A:第一,我们要考虑它的应用场景是什么,像机器人也好,电视机也好,是有内容交互的场景。第二个,你要看它的 CPU,我们这个 AI 芯片模组跟它的主 CPU 的关系是什么,如果它的主 CPU 是做一些基本工作,然后需要有一些辅助 CPU,专门做降噪、唤醒的这些东西,这个时候符合场景的模组才能使用。
比如说智能电视,就是一个典型的场景,如果要把算法做到智能电视的主 CPU 上,电视厂商需要调试、磨合很久,才能把降噪、算法、唤醒做好。另外,如果把语音唤醒做到主 CPU 上,如果运算或内存不够,会导致播放视频有时候会卡顿。所以,需要有一个辅助性的处理器专门做这个事情,这是语音芯片模组的使用场景,它不需要改变硬件本身形态,集成方便,调试周期短。
Q:今天讲到的切入保险行业的智能语音服务,我理解它还是一个语音客服,但为什么要直接找到这样一个比较垂直的行业?
A:保险、金融在某种程度上,它自己是 B to C,直接面对用户,用户体验是很重要的。对我们来说,这些行业无论是交互设备也好,或者交互的 AI 技术也好,比如对话、视觉等,都是围绕人跟机器,进行一个对话式的沟通,所以对我们来说,不管是保险还是金融,只要是交互性的这种任务,我们就有优势,而且我们很有兴趣。
下一代的人机交互,不一定要到 to C 上去。比如说未来所有的酒店都会有语音交互,如果酒店机器人都是由我们提供的语音交互,我觉得挺好的。所以我觉得最核心的还是交互,不管是保险行业,还是金融行业,还是一个机场的询问台,还是酒店的询问台,这些都是可以去参与的。
Q:金融和保险客服这些也涉及方言,我们现在有解决吗?
A:我们不做这个。但是未来在车里我们会做粤语。我觉得科大讯飞在语音识别的方言方面确实做得比较好。但是我觉得方言,即使识别了,后面的理解工作、内容对接工作做不好,还是不行。
Q:然后在汽车领域里面,目前的进展是怎样的?
A:去年一年我们百分之七八十的技术研发精力都花在 AI 上。在汽车 AI 的研发上,我们投入了大量的精力,达到了大众的标准。目前来说,跟所有的竞争对手相比,在车里面我们自己非常有信心,在技术上一定是一流的。具体已经落地的是汽车前装的语音装置。比如在今年刚面世的江淮大众 SOL(思皓)品牌车中,搭载的语音系统和车内互联系统,就是由我们和我们与大众汽车的合资公司合作提供的。通过一年的时间我们就能够进入前装,在大众汽车历史上是没有的,也可以看出来,无论是大众汽车还是我们都是非常专业的。
Q:你们跟其他车厂合作会不会有一些阻碍呢?
A:现在我们还没有看其他的车厂,如果是品牌直接跟大众汽车竞争的,肯定是有一些阻碍。另外还有一些或者是比较常规一点的国产汽车品牌,对他来说哪个技术好,价格又不贵,就用他。我们希望把大众汽车的标准达到,因为他们的标准达到了,其他的基本上就没什么问题了。
Q:今天提到的一些新业务,现在的客户主要是谁?
A:智能音箱是像台湾远传电信这样的电信运营商。台湾远传电信是台湾三大运营商之一,在台湾地区市场我们还是有先发优势的。保险公司的话,我们现在还不能透露是哪一家,不过我们正在跟保险公司做深入合作。反欺诈的话是一些金融类公司。
Q:你刚才也做了一个调查,有一半的人还没有用语音交互,这部分人没有养成这样的习惯,未来有什么方式能吸引这些人去培养这个习惯?
A:要体验更好,或者是挖掘出痛点。就跟手机一样,早期智能手机也不是所有人都能用的,现在在北欧经济发达国家,也有人只用功能机。他们天天跑步,用户习惯不一样。如果你拿着一个智能手机到北欧一些国家,可能还是打动不了他,但是智能手表这种在运动时很有用的设备,他反而会用起来。
A:我还要唤醒,说「嗨,小问」,「开灯」、「关灯」,还是让我不爽,因为每次唤醒音箱,心里就有那种负担,我希望如果我直接说开灯,就开了,这是一个感知问题,我觉得这才是未来的语音交互。
Q:今年在智能手表上有一个比较大的创新的地方,就是双层屏的设计,解决了一个大家比较困扰的续航问题,那智能手表你觉得还有哪些探索的地方?
A:智能手表可探索的地方很多,2016 年的时候我就讲了三个大的趋势,独立性、健康运动、支付,这三个东西我认为都还没有完美,包括各种体验。
健康运动的话,各种传感器,GPS、心率这些,应该进一步提升。支付和公交,现在由于各种地方都不太一样,所以还有很多事情可以做。基本的比如说功耗,也有进一步提升的空间,能不能做到更小功耗、更轻、更漂亮,同时功耗甚至续航时间有进一步的提升,这也是需要做的。还有对我们自己来说很重要的点,我觉得未来当智能手表有独立性以后,跟智能耳机的配合,耳机跟手表连接,这个也是未来我们想要去探索的。
Q:智能音箱 + 屏幕的组合是今年的一个趋势,你觉得这会是智能音箱的终极形态吗?
A:加了屏幕,首先成本会贵很多,便携性可能也不方便,很容易碎,防水也很难。未来一定还是会有无屏的智能音箱。比例是多少我不知道,这取决于(厂商)到底愿意花多少钱补贴。我们也在调研,这类产品会贵不少,未来究竟是它主导还是另外的产品主导还不好说。
Q:你说还要做带屏幕的智能音箱吗?
A:我们在做研发。
Q:智能耳机我们今年也推出了不同的系列,大家对于这个产品的接受度还蛮高的,您觉得这种产品的未来趋势是什么样的?
A:智能耳机和智能手表有很多东西可以做,有两个原因,第一是它是一个个人设备,个人设备大家对它的美观度、功耗、重量等要求都很高,如果是智能音箱,高一点低一点,没有那么多人在意。但是耳机,大一点就戴着很不舒服。
交互方式上,耳机未来的趋势跟智能手表比较类似,会更小,功耗更低,里面有一个电池,低功耗,不发热。现在最重要的就是解决断连问题。之后这种设备也有可能会独立,里面内置 eSIM 卡,我自己对 eSIM 很看好,它对智能手机会有所颠覆。再包括未来心率等功能。还有语音交互会做得更好,或者是直接能够唤醒。
Q:你们今年一下发了那么多产品,为什么想发那么多?会不会显得不够专注?
A:我们首先是为语音交互寻找各种业务场景,包括在家、在路上、在车上的场景。如果我只做一个智能手表,这个事情其实是不成立的,如果只做智能手表,就不应该做 AI。包括今天的芯片模组,我们的出发点是要把语音交互推广到市场去。
肯定会有一些影响,六、七百号人如果只干一件事情,这件事是可以做得更好的。但是,这是一个综合的平衡,从大的公司,综合的发展。总体来说,我们的专注点是语音交互本身,这个是我们无比关注的。包括现在做的 To B 业务的尝试,也是语音交互的价值释放。所以我觉得到一定程度,所有的公司都是这样的,一定要把你的价值释放出来。
来源:极客公园