人工智能会如何影响我们的未来?
不知是从何时起,互联网的圈子里流行起了风口这么一说。有的人在努力的追着风口跑,而有的人站在那里等风来,还有的人已经在你的不知不觉中站在了风口上。其实,互联网圈里大家无时无刻不在讨论着下一个风口是什么,因为只要站在风口上,猪都可以飞起来。作为一个产品经理,那就从用户场景这个角度,来说说人工智能这个风口。
要说它是一个风口一点都不为过。在2017年的5月份,柯洁和阿法狗的人机大战,吸引了世界无数的目光,甚至是那些根本不懂围棋的吃瓜群众。于是乎在比赛结束后很多人就开始感叹,人工智能的时代是不是就要到来了?我们人类是不是就要被机器所控制了?当时笔主的内心是抗拒的,要知道“人工智能”这个名词已经存在了将近60年了。
其实,这场大战背后的营销意义要远远大于其所展示的人工智能的发展成果。大多数人追的并不是人工智能,只不过是搭载在人工智能这个科技名词上的一个社会热点罢了。毕竟,日常生活中能够有这种展现自己关注人工智能发展的机会并不多,好不容易遇到怎会放过呢!
在这场大战后,马云很快便在公开场合演讲时表示:“研究阿法狗没有意义,围棋本来是多有乐趣的事情,它把我们最快乐的东西剥夺掉了,还侮辱了我们一把,你是永远搞不过人家。”我个人很支持马云的态度,如果人工智能的目的仅仅就是为了和人类下一场围棋的话,那么你对它的理解就也只能到围棋了。但这件事情换个角度来思考的话,其实还有另外一层韵味在其中。就目前而言,人工智能技术的发展进入到了一个飞速期,但是我们对于它的使用需求的研究却远未跟上技术的发展。与其说柯洁和阿法狗的人机大战是一场比赛,更不如说这是一个人工智能的发布会。因为就目前而言,人工智能并没有一个更好的落地产品和用户场景能够吸引到公众如此多的眼球,同时又能够告诉大家人工智能是什么样的,所以最终阿尔法狗便在这个时间点成为了人工智能的一个标志。
其实作为一个互联网人,每天你都会看到身边有许多的人在聊人工智能,同时还有许多人每天在乐此不疲的参加各种人工智能的峰会。他们会到处的囔囔,AI如何如何的牛逼,AI如何如何代表了未来,但是却从来没有人真正的告诉过你人工智能究竟该是什么样的,因为他们自己根本不知道。(大部分的时候,他们只是为了彰显他们并没有被互联网这个大熔炉所淘汰掉)
其实这和当年互联网刚刚面世的时候很相像。那个年代的人基本上都不知道互联网是什么样的,有些人也只是通过报纸和新闻了解了一些,但是在实际的生活中,互联网对于他们来说还是一个很遥远的东西。但后来,随着电脑的普及,很多人都用上了IE,QQ等各类互联网应用时,人们这个时候才明白,原来互联网就是这个样子的。当人们使用过后,发现它给我们的生活和工作带来了非常多的便利,于是乎互联网开始走入到了我们每个人的生活中。
就像今天的人工智能一样,人们知道它代表着未来。但是在生活中,除了在某些特定的用户场景使用到外,人们还无法感受到它的存在和意义。目前人工智能还远没有达到一个被公众所大范围接受的地步,因为它真正缺失的也是最核心的东西,正是用户场景。更准确的来说是接地气的用户场景。
那么真正的从用户需求的角度来分析,用户需要的究竟是什么呢?下面我们就先了解一下已经存在的关于人工智能的应用。
一、智能音箱
从目前市场上的各类产品来看,智能音箱可以算是离我们生活最近的一款涉及到人工智能的产品。而这其中,最典型的产品就是亚马逊的Echo。
它于2014年面世,一上市便收到了市场的热捧,紧接着大批的市场追随者便陆续的进入到这个市场中来。从而最终形成了智能音箱今天群雄涿鹿的场面。
回过头来仔细的分析Echo,它具备了人工智能发展的很多技术特性:机器学习、语音识别和语音交互等这一系列技术的应用,让Echo成为了最先将这些技术应用在实际生活中的产品,为用户提供了一个具有良好用户体验的使用场景。这也是为什么Echo在2015年占据了音箱市场销量的 25%。
从一个音箱的角度来看Echo,它一定是非常的成功的。因为它在传统蓝牙音箱的基础上,所额外增加的功能,让人们对这个产品产生了好奇感。当人们真正的使用到这款产品时,人们又会因为他独特的功能和良好的体验深深的爱上这款产品。而它的环形6+1麦克风阵列,又为其提供了强大的硬件支持。
但如果从人工智能的角度来看待Echo,它才仅仅是一个开始。对于Echo来说,它最大的特色就在于它的语音交互。那么在实际的用户场景中的体验又如何呢?
Echo 智能音箱中内置了 Alexa 语音助手,它是亚马逊平台研发的基于语音指令驱动,无需屏幕的AI语音助理软件。你只要对着Echo,说出“Alexa”,然后就可以与它对话了。相比其他同类型的竞争对手来说,它没有像Siri那样,把所有东西都涵盖在内,同时它又比谷歌的语音助手更加突出核心功能。这里并不是对语音技术本身的比较,只是根据Alexa本身的特性,说明当它使用在蓝牙音箱上时,具有相对较好的特性。因为从用户的角度来设想,我获得了一款可以对话的音箱,我势必会想尝试各种各样的问题与其对话,看它是否能够满足我的好奇心。从这一点上来说,对语音识别的准确性以及背后所涉及到的机器学习的知识库来说是一个不小的挑战。从目前的技术发展来看,要实现澳门风云里的机器人管家那样自由的对话,还是一件比较困难的事情。
而对于语音交互来说,准确性与及时性又十分的重要,如果一个产品提供了100%内容带给用户的是60%的体验,远不如提供60%的内容带给用户100%的体验更让用户觉得更满意。在这方面Alexa选择了缩小范围,放弃了那些它目前还不够完善的部分,转而选择了将它的核心内容做到极致。
对于Echo来说,它的核心功能包括:播放音乐、设定闹铃、查询信息、Uber 打车、一键下单、在线订购披萨、控制开关等多方面。试想一下作为一个用户,如果你问了Echo二十个问题,Echo只回答对了10个,也许你会觉得它还有些笨。但当你使用Echo打了二十次Uber都准确无误的话,你会不禁赞叹:哇,它太酷了。
但如果二十次里面一旦有一次打车出现错误的时候,这个产品所带给你的信任感就会直线的下降。所以从用户体验角度来思考的话,在目前阶段里,语音交互的精确性要比它所涵盖范围的广阔性显得更加重要。对于这一类型的智能音箱也仅仅是实现了一些简单基础的功能,离人们心目中的人工智能化还相距甚远。因为从技术的角度来分析,还有很多的因素制约着用户的体验。
1、机器学习的局限性
这里所指的机器学习,是针对语音这一个单独领域的讨论,理论上我们可以将智能语音看作是语音处理与机器学习的结合。机器学习的过程我们可以理解为是:机器通过大量数据的采集,在一定算法的基础上自主的完成优化和改进,从而最终得出一个具有统计学意义的结果。而对于我们用户来说,这个统计学结果直接影响着我们在使用过程中的用户体验。
(1)首先机器学习的局限性会导致机器预测结果的偏差。
我们知道机器学习的背后是一整套算法的支持,而这些算法的优化,又依赖于大量的数据进行不断的训练,从而获取到一个标准的模型,然后再利用这一模型做出预测。在这一过程中,任何一个因素都有可能导致预测结果出现一个偏差。而这种偏差对于用户的体验有着重要的影响。
例如我们可以利用机器学习的算法,对一只足球队过去所有比赛的数据进行分析,在根据这些数据分析的基础上建立一个模型,通过这一模型对该只球队的下场比赛结果进行预测。但是我们无法保证这个预测的结果是准确的,因为即使我们采集了大量的数据进行分析,但是足球比赛本身还存在着许多未知的因素在里面,而这些因素就会导致最终的结果可能会出现偏差。而对于一个普通的用户来说,就是我根据你的机器学习算法预测的结果买了2元的足球彩票,结果最后发现自己并没有中奖。
(2)其次算法本身的体系搭建,影响着机器学习效率与准确
当算法应用于产品时,我们就不仅仅要考虑算法是否能够实现我们的需求,同时我们还必须要考虑算法本身的性能,这就和算法本身的体系搭建有着密切的关系。在这一过程中效率和准确就显的十分重要,因为对于一个用户来说,他的目标就是快速的得到一个准确的回馈。只有这样的用户体验,才能让用户感到满意。
关于机器学习算法的效率问题,我们通过最直观的例子来进行对比。在生活中,当我们与朋友面对面沟通的时候,我们常常会聊很多彼此感兴趣的话题,而在这一对话过程中,我们会不间断的互相传递信息,所以有效并且及时的反馈是对话得以维持的关键。但当你与Siri聊天的时候,你每说出一句话的时候,这段话都会经过算法的计算,回复给你一个答案,在这一过程中需要对采集到的语言进行一个处理,那么对声音的采集和算法的运算速度就在某种程度上决定着反馈的快与慢。而这其中不同的语音识别体系所使用的不同算法,就会给用户带来不同的体验。
而对于准确性来说,在语音识别对话体系当中,因为口音的问题,会导致偏差的产生。很多地方的人在讲普通话的时候,总是会遇到一些发音的问题。就比如在上大学时,遇到了一个广东的同学,他每次在说“表格”两个字的时候,总是会把“biao”的音发成“bao”,所以试想一下,当数据采集到“baoge”的时候,他也许会误判为“饱嗝”,从而最终回复出来的结果是“我还没有吃饭呢”。
(3)最后统计学的结果未必是用户期待的结果。
从机器学习的实现方式上来分析,我们可以把机器学习的过程看作是一个统计分析的过程,通过对各种数据的积累,来设置相应的参数和变量,得出一个具有统计学意义的结果,最终再根据这个结果做出判断。但是这里面往往会存在一些无法控制的因素,而这些因素就有可能导致最终的结果未必是自己想要的结果。
举个很简单的例子,一个人连续10天每天都在同一家店买一个苹果,当他第十一天继续来到这家商店购买水果的时候,如果将这一购买行为交给机器学习的算法来处理,它一定会继续帮你购买苹果,但如果今天这个人就是想吃西瓜,那么机器学习所得出的结论就会与用户的内心需求产生差异。在这种情况下统计学结果对于用户来说就是无效的。这正是说明了通过机器学习所得出的统计学意义上的结果,有时候未必是用户真正需求的。这也正是我们人类个体的差异性所无法避免的。
2、语音交互的用户体验还有待提高。
在AI如此受到热捧的今天,你会看到很多的产品或者是做语音交互算法的公司,都在宣称我们的语音识别技术多么多么的好,准确率达到了多么多么的高。但是,当你去实际体验那些搭载了语音交互的产品时,你会发现,它离我们心目中的标准还有一段距离。
首先是语音识别的全面性,还没有我们所期待的那样广泛。在语音识别的背后是一整套的内容在做支持,它就像一个百科全书一样,能够为每一个识别的结果做出对应的反应。但是当我们在细化到不同的语音交互体系上时,你会发现他们的背后都有着一套自己的内容与知识库,而这些内容所涵盖的范围目前还是有限的,这就会导致当遇到超出内容范围的问题时,就无法为用户做出一个合理的反馈。
其次是声音采集的准确性,还需要进一步的提高。就目前的技术来说,在相对安静的环境下,对标准语言进行采集时,我相信大家不会有太大的差别。但是,当放到实际的应用场景中时,往往却无法保证采集的精确。这是因为在实际的应用中,用户的使用场景是特别复杂的,一个人说话的语速,说话的语音,在同一时刻说话的人数都会让采集准确性下降。而另外一方面本身硬件的性能也会对声音的采集产生一个制约。
最后是语音交互在实际应用中缺少了一些自然性。这里作者所说的“自然性”,可以将其理解成与人类相似的一种特性。目前的语音交互中,我们所听到的反馈声音往往都是固定不变的,并且这些声音还略显生涩。这些细节会让用户在实际的使用过程中缺乏了一些亲近感,从而让用户内心与产品之间产生距离,最终影响到用户的体验。
对于语音交互体验的提升,我们需要在不同的用户场景中采集大量的数据并对算法的模型进行不断的优化,同时对硬件本身的技术不断的发展,然后从实际的应用场景考虑出发,最终为用户构造出一个理想的产品形态。
3、对外开放的接口才刚刚起步。
在过去的很长一段时间内,手机和PC一直是作为互联网的主要进入方式而存在。但当人工智能的技术得到迅猛发展的时候,很多人便开始寻找着新的互联网入口。而这个时候,语音交互就被大家所发现,开始越来越重视。因为语音就是最简单的,最直接的交互方式,是通用的输入模式。在手机和PC市场稳定的今天,后来者想要进入那个市场的行业壁垒非常高。但语音交互还处于一个群雄涿鹿的局面,现在每一个进入者都有机会在这个领域内占据自己的一席之地。
如果我们将语音交互当作一个互联网的入口来看待的时候,我们会发现目前它所对外开放的接口还很有限。就比如,目前的Echo接入了uber的打车服务,同时可以控制灯和空调等设备。但也仅仅限于这些领域。这就使得语音交互在作为一个互联网的入口时,它的功能略显单薄,无法像手机和PC那样,满足用户日常生活中的方方面面的需求,这在未来也是语音交互需要解决的核心问题之一。
通过上述例子的分析,我们可以窥探到对于人工智能在语音交互领域里的应用才刚刚起步,不管因为是技术的限制还是用户场景的缺乏,目前的产品都仅仅满足的是作为一个音箱类产品的基本型需求,而用户的期望型需求和兴奋型需求,还无法得到满足。这就会使得语音作为互联网的入口时,其功能无法让用户的需求得到真正的满足,从而最终影响到了用户体验验。
二、无人驾驶汽车
“无人驾驶”也被称为“自动驾驶”,它可以算作是人工智能的终极研究领域。因为对于“自动驾驶”来说,它已经涵盖了人工智能的所有核心和技术,并且它也是人工智能未来非常重要的发展方向。
在这里我并不是要否认“自动驾驶”在人工智能领域里的重要性,只是就目前的发展阶段,从用户需求和体验的角度来分析的话,“自动驾驶”还有很长的一段路需要走。
自动驾驶的等级分为了6个级别,如以下图所示。
从L0开始到L5,这个是对不同车辆的自动驾驶的等级进行的评估。我们可以清晰的看出,L5等级,是自动驾驶汽车发展的最终目标。在这一等级下,汽车可以完全的操控整个系统,并且能够应对一切的复杂状况。这对于用户的使用体验是一种质的飞越。试想一下,当你感觉到累的时候,一上车只需要设定目的地就可以倒头大睡,不再需要进行任何的操作。或者当你在一个地方需要用车的时候,只需要设定好目的地,车子便会自动开到你所在的位置。这种用户体验对于每一个用户来说都是极致的。但是根据当前技术的发展水平和市场反馈来看,还无法真正意义上实现这个等级。
我们就拿这个领域里最顶尖公司来和大家聊聊自动驾驶这件事:
在这里首先要明确一下的是,我们聊的是汽车的自动驾驶这一细分的用户体验,而不是整车的用户体验。所以我们会抛开汽车本身的性能,单纯的来讨论自动驾驶所带给用户的体验。
首先通过一个案例来了解一下自动驾驶的实际情况。2016年的5月份,美国的一位男子,驾驶着TESLA的Model S与一辆拖车发生碰撞,导致驾驶员死亡。当意外发生之时,车主开启了Autopilot 驾驶模式,所以这桩交通事故所有的焦点都聚集在了“自动驾驶”上。那么这个交通事故中有几个引发人们争议的点:
1)TESLA为什么没有识别到货车?
这是一个最直接也是最关键的问题点。对于自动驾驶的核心体验,就是要在无人操作车辆的情况下,保证自动驾驶的系统能够识别出周围的各种环境,并且对相对应的情况作出一个正确的判断。而对于周边环境的识别,是通过设置在车辆上的12个长距离超声波距离传感器Ultrasonic Sensors、1个长距离雷达Radar和1个前向摄像头Forward-facing camera来实现的。那么在这种情况下,为什么还会发生车祸呢?
根据相关的记录和调查可得知,当时事故发生时,外部的光照环境十分强烈,而卡车本身的白色车身被摄像头误认为是蓝天白云中的一部分。与此同时,雷达的检测也将卡车车身判定为了信号灯,这是由于当时车辆处于十字路口,特殊的地理位置环境引发了此误判。两个关键传感器的误判,导致车辆并未及时触发紧急制动功能,而驾驶员又过分的信任了自动驾驶系统,最终导致了事故的发生。
2)究竟TESLA的Autopilot 驾驶模式是一个怎么样的模式?
虽然很多人将Autopilot模式翻译成了“自动驾驶模式”,但严格意义上来说它并不是。就连马斯克本人也曾在发布会上解释:It’s autopilot not autonomous。所以将Autopilot翻译为“辅助驾驶模式”更为的准确。并且对于这种模式的使用是有限制的,根据规定驾驶者应该在封闭的高速公路使用Autopilot系统,而不是复杂的十字路口环境。所以,很多情况下,所谓的自动驾驶模式都是被过分解读的一种理解。
所谓的自动驾驶是能够适应所有复杂的情况,而不是在特定的环境下对特定的情况的处理。所以TESLA的Autopilot驾驶模式严格意义上讲,是一种更加优化的辅助驾驶,而不适用于所有的环境。当用户盲目的把辅助模式当成自动驾驶模式来使用的情况下,就会存在很大的风险,而这种风险对于用户来说是未知的,但一旦真正发生时,会造成无法挽回的严重后果。
3)TESLA是否能够适应一切的复杂环境?
本次事故发生的特殊性,就在于它是处于一个十字路口。那自动驾驶能够适应这种特殊的环境吗?就目前自动驾驶的发展水平来看,仍然是无法达到这种水平。毕竟在十字路口这种环境中,可能会面临四个方向的来车,并且还有行人,信号灯,建筑物等各类的外部环境。在这种复杂的环境下,系统必须保证每一个传感器的准确性,以及对每个数据处理的准确性,才能让车辆安全正常的通过,否者就会发生与此次事故类似的情况。所以自动驾驶对于周围环境的识别与处理会是自动驾驶最为关键的核心。
对于这些疑问点,也正是自动驾驶需要从用户体验方面考虑的问题,因为自动驾驶是一整套的系统解决方案。对于每一个问题的解决,都关系着整体的体验。而根据上面所描述的问题,我们从以下的两个方面来讨论用户体验。
1、安全性
对于一辆汽车最基本也是核心的功能就是快速出行,那么从一个地方快速安全的到达另外一个地方,就成为了其最为重要的体验。我们所理解的传统意义上的汽车都是由用户自己完成操作,所以在很大程度上安全性依赖于驾驶员的操作水平和车辆本身的状况。但随着人工智能的发展将会改变了这一现状,它将车辆的操作完全的交由自身的自动驾驶系统来完成。车辆会根据自身所配的各类传感器来实现数据的采集,然后对各类的数据汇总分析做出判断,从而在车辆处于不同环境下做出不同的判断。听上去这一原理更加具有安全性,并且特斯拉的总裁马斯克此前也公开表示,他认为无人驾驶汽车是已经被解决掉问题,随着未来几年对无人驾驶系统的优化,其安全性与可靠性比人类驾驶员更高。他所陈述的一切从技术上分析确实代表着未来,但是就目前的发展水平来看,其安全性的体验还远未达到用户的期待。就像前文中所阐述的例子,事故的发生可能是多方面的因素造成的。但对于用户来说,就意味着产品的核心体验是有问题的。
在生活中“安全性”其实是一种无形的体验,同时它的体验也代表着用户对于无人驾驶系统的一种信任。所以安全性在整个用户体验当中起着至关重要的作用,也决定着无人驾驶系统未来的发展水平。
2、全面性
对于车辆的行驶来说,可能会遇到各种各样的复杂环境。在目前的使用场景下,都是依赖于人自身的判断。而对于无人驾驶系统,就需要能够做出比人更加准确的判断。
比如当车辆处于高速公路上行驶时,能见度状况良好,四周无其他车辆行驶,应该以怎么样的速度行驶呢?对于这种环境的判断,从驾驶员的角度,我们可能会选择在限速的合理范围内,将车速提高。那么在同样的情况下,无人驾驶系统也需要能够做出和驾驶员类似的判断,将车速提升至一个合理的速度。如果在这种情况下,无人驾驶系统没有做出任何的改变,仍然以一个不变速度行驶的话,就会在某种程度上让用户感到困惑,为什么没有提高车速,从而最终影响到了用户使用无人驾驶系统驾驶车辆时的速度体验。
此外,对于一些特殊环境的处理,也是对于无人驾驶系统的一个考验。比如在下雨天或者大雾天的特殊情况下,驾驶员往往是会选择缓慢小心的行驶。而无人驾驶系统的在这种天气状态下,各类传感器的监测是否会受到影响,并且无人驾驶系统的判断是否会出现错误,都直接影响着用户的体验。所以无人驾驶系统的全面性,在很大程度上也影响着用户的体验。
对于无人驾驶的概念来说,不仅要能够达到人类目前自行驾驶车辆行驶的水平,还要能够带给用户更多和更好的用户体验。理想中的无人驾驶汽车应该像马斯克描述的那样,比传统意义上的汽车更安全,同时能够根据不同的环境,设置不同的车速和驾驶模式等参数,从而真正意义上提升用户的驾驶体验,带给用户一个完美的行驶旅程。
无人驾驶汽车,作为人工智能在汽车领域的应用,它的前景是广阔的,并且它在用户体验上实现了质的提升,从而让这种改变在未来的很长一段时间内成为汽车领域里的主流。而这种提升,我们可以概括为以下的四点:
1、无人驾驶汽车,解放了人的双手。
因为有了自动驾驶,车辆的行驶不再需要依赖于方向盘,我们可以在驾驶的过程中让双手自由的活动。
2、无人驾驶汽车,解放了人的大脑。
在过去的车辆的驾驶中,我们是需要时刻保持全神贯注的观察路面,但通过无人驾驶汽车,我们不在需要将注意力集中在路面,从而可以在整个行程中保持一个舒适的状态。
3、无人驾驶汽车,让行驶变的更安全。
过去的驾驶,依赖的是人的主观的判断和操作。而通过自动驾驶系统和各类的传感器,则可以更加全面的分析车辆周边的状况,从而做出更加精确的判断。相信随着人工智能的发展,驾驶会变得越来越安全。
4、无人驾驶汽车,让出行变得如此简单。
对于车辆的驾驶,我们有着严格的限制,比如不能在酒后驾驶车辆。但如果无人驾驶汽车出现后,驾驶者便直接可以通过自动驾驶将自己安全的送回家中,并且停车等所有后续工作,车辆也会自动完成。
这是一个看的见的未来,并且各大汽车厂商和互联网公司已经在研究和实验,并且有部分的汽车厂商已经在一定程度上实现了智能化。而在早些的时候,百度发布一项名为“Apollo”的新计划,将向汽车行业及自动驾驶领域的合作伙伴提供一个开放、完整、安全的软件平台。这让更多的传统汽车企业在这场无人驾驶的盛宴中有了一席之地。这也预示着,无人驾驶汽车的时代很快就会到来了。
但对于用户来说,他们需要的是一个更加完美的“自动驾驶”,让汽车在真正意义上的L5等级实现全自动驾驶,虽然目前我们还无法触及到这一目标,但是我相信在不远未来,它会彻底改变我们的生活,给我们提供真正智能化“无人驾驶”汽车
三、机器人
也许有人会说,人工智能的时代就是机器人的时代。这句话代表了在当前这个阶段,机器人的发展对于人工智能的意义来说同样非常的重大。我们曾经看过了许多的科幻片里,描述了导演心目中的机器人是什么样的。
1、异形前传中的仿生人:
这也算是最接近于人类的机器人,他不仅拥有了人的驱壳,同时更是像人一样,拥有了自己的独立思想。在异形契约中,最早被人类所创造出来的“仿生人”是David,它最初的设计是被用来协助人类完成太空飞行的任务。但是当他降临在这个世界上时,他的创造者发现David由于十分的与人类相似,慢慢的产生了独立的思想,从而让人类失去了对其的控制。就像电影里的那句经典台词:“我生来不是被人奴役的,我存在的意义就是创造”。 于是他就成为了一切黑暗的开始,他不再满足于受人类的控制,最终创造出了异形,从而就引发了之后人类和异形的大战。说到这里你也许会觉得,这只是一部电影而已,也仅仅是人类所幻想出来的一个故事。但当举出下面例子的时候,也许你会冷静下来认真的思考一下。
就在前不久,当马斯克和扎克伯格关于AI的威胁不停争论的时候,Facebook突然宣布关闭了一个“失控”的人工智能系统。于是乎,许多新闻的标题为了吸引观众的眼球,都是这样写的
“Facebook关闭AI系统,因为AI系统发明了自己的语言进行交流”。乍一看,这个新闻足够的劲爆,因为这意味着在人类之外存在着我们无法控制的语言。但事实上呢?其实并非如标题所描述的那样,脸书很快的就站了出来进行解释。这个事故是研究人员在测试两个机器人对话的过程中,忘记给神经网络设定激励机制,导致了两个机器间的沟通与传统的英语产生了偏差。而这种偏差并非是新的语言,只是利用了一些单词创造了新的表达方式,而他们之间的沟通本身也没有任何的实质性意义。所以说到这里的时候,我个人认为这不过是一次媒体为了吸引眼球的营销炒作罢了,过分的夸大或曲解了Facebook关闭AI系统这个事件。那我们接着往下看另外一个例子:
在此事件发生的更早些时候,其实还有另外的一个实验,它所带给我们的思考更加的深刻。谷歌的Google Brain项目中的一个团队,开发了3个神经网络:Alice、Bob和Eve。他们的任务分别是:
Alice向Bob发送加密信息。
Bob则需要对其解密。
最后,Eve则试图在没有其他神经网络提供密钥的情况下破解加密信息。
那么这个实验的结果又如何呢? 对于这三个神经网络来说,最初的信息量都为空,但随着他们实验次数的增加,Alice和Bob之间的加密信息越来越完善,到最后Eve已经无法破解。这种加密的信息,从某种意义上来看,也是属于一种我们人类所无法理解的语言,而这种语言背后所代表的意义,或许正是人类所恐惧的未知。
上面的两个例子,其实都是围绕着一个核心点在阐述,那就是“思想”。随着人工智能技术的不断发展,“情感与思想”会成为机器人在发展道路上的一个重要议题。
单纯的从用户体验的角度来思考类似于仿生人这样的机器人,摒弃世俗的伦理道德,一个具有了情感和思想的机器人,才会是人工智能时代里机器人的最高标准。
但是我不确定的是,什么样的范围才会是一个合理可控制的范围。就像异形当中仿生人的创造者,当他们发现David已经具有了不受他们控制的独立思想后,他们选择在创造下一代的仿生人沃尔特的时候,将自我创造的意识抽离了出去,而通过提前预设程序,让仿生人能够在感受到人类的情感和思想的同时,又不会超出人类的控制而去自我创造意识和情感。
对于人工智能和机器人的研究来说,未来是不可预测的,随着技术和研究的发展,人类总是突破一个又一个的技术高度。那我们对于这类型的机器人的需求是什么?我们所期望的是一个和人类无比接近但又受自己控制的机器人,同时你还会希望他能够像其他人类一样理解你的情感和思想,从而在生活中满足你的需求。
如果在未来的某一天机器人能够实现这样的功能,满足用户的情感和生活需求,那么我相信机器人的时代才会真正的到来了。
2、“机器人总动员”中的太阳能机器人:
讨论完了与人类无比相似的仿生人之后,我们来看以另外一种不同形式存在的机器人。
电影中描述的场景是:在未来的某一天我们生活的地球变成了一个巨大的垃圾场,为了生存人类离开了地球,把这个名为“瓦力”的机器人派到了地球上。它的任务就只有一个,通过预设的指令,对垃圾进行分类处理,以帮助地球恢复生态平衡。
作为一个太阳能机器人,从产品的角度来思考,它的核心功能是:分类处理垃圾。通过这一功能来满足人类让地球生态恢复平衡的核心需求。在这一用户的场景中,瓦力通过预设的指令来不断的重复,以帮助人类完成特定的工作。在我们现实生活中,这也是机器人研发与应用非常普遍的一种方式。换个名词来理解的话,我们可以认为它更接近于:“工业机器人”。通过对每一类型机器人设定核心的功能,使其发挥在特定领域的特殊作用,从而完成一些人类无法完成的工作,或者是替代人类的某种工作以提高效率和安全,从而实现人类对于效率提升和降低危险的需求。
随着人工智能的发展,这类型的机器人,已经在我们的生活中得到了广泛的应用,下面就通过一个例子来了解一下。让我们来认识一下仓储物流里的机器人。
你了解中国的快递业务量有多大吗?你知道目前我国的快递行业又有多少的从业人员吗?
根据国家邮政局公布的2017年上半年邮政行业运行情况的数据显示,2017年的上半年,全国快递业务量达到了173亿。而据不完全统计,目前我国的快递行业从业人员已经超过了200万。面对如此庞大的数量,快递的员工作就变得无比复杂和繁琐。当每天面对将近1亿的快递包裹时,如何确保快速准确的完成分拣的任务,就成为了快递行业面临的一个重要问题,这同时也成为了快递行业的一个急需解决的需求。分拣机器人,正是在这样的大环境下应用而生,其核心的功能就是通过传感器,物镜和电子光学快速对货物进行分拣,从而满足快递行业准确高效的投递包裹的需求。这里面有两个关键词:准确和高效。如果以传统的人工分拣的模式来运行的话,在面对数量如此庞大的包裹时,人的操作难以避免会出现差错,并且这种差错是无法预知,因为它依赖于人的操作,而个体的差异性会导致这种潜在的风险无法被有效的预测和控制。另一方面,从效率的角度来分析,机器可以保持24小时的不间断工作,并且每一次的工作,都可以以同样的动作效率来完成,不需要休息调整期,这种效率是人类所无法做到的。所以分拣机器人的出现正是要替代人工的操作,从而最终能够让其被大量的用于仓储物流的领域当中,正是由于这类型的机器人的出现,满足了在快递领域里的高效准确投递快递的需求,给我们的生活带来了更多的便利,让人工智能被更多的应用在实际的生活场景中。
这类型的机器人都是针对某个特殊领域,具备特殊功能的机器人,他们的存在就是为了完成特定的任务,所以从用户体验上来分析时,我们所看重的就是其完成任务的效率和成功率。这对于此类型的机器人在实际使用过程中的用户体验十分的重要。
3、钢铁侠中的托尼·史塔克
我们用机器人来形容钢铁侠并不是那么的恰当,因为他本质还是人类,只是在人类自身的基础上,通过外界的辅助设备,来实现了某种特殊的功能和效果。更准确的为其定义,可以将其理解为:辅助机械装置。那他和机器人又有什么关系呢?从实现的方式上来说,它和机器人是一样的。他们的区别就在于机器人是由编程的系统来控制,而辅助机械装置则是在编程的基础上由人类直接来操作。这一研究方向随着人工智能的不断发展,将机器与人类自身实现了更好的结合,从而让机械帮助我们实现了更多我们原本无法达到的目标。就像电影的中的钢铁侠,制造了一套由聚变能源驱动的钢铁盔甲,穿上这套盔甲,让他具有了超强的威力,最终击败了所有的坏人。也许所谓的钢铁盔甲离我们的现实还有一些距离,但是科学家们在人工智能的帮助下,已经实现了一些突破性的发展。
比如通过脑电波控制机械手臂。在美国有一位名叫Easton的19岁小伙,利用了3D打印的技术,开发出来一款通过脑电波控制的机械手臂装置,通过这一创新,能够帮助无数残疾人士完成他们过去所无法完成的动作。而这一切的发生正是在人工智能和3D打印技术基础上的一个研究成果。据统计,全球目前有超过10亿的残疾人士,他们对于此类的产品具有着强烈的需求。它的核心功能就是通过人类自身的脑电波,实现对机械装置的控制,从而满足残疾人士希望像正常人一样去完成日常生活动作的需求。就目前的技术水平来看,它所能达到的灵活度还很有限,但随着人工智能的不断发展,未来机械装置能够提供的功能将会越来越多,从而满足残疾人士更多的需求。这一研究真正的做到了将技术与人类身体的结合,在未来,也会有越来越多的此类研究应用在解决人类自身问题上的项目中来。
从人工智能的角度来看待机器人,它是这个时代的标志之一,对于我们来说,机器人满足的是人类的不同的需求。在如今的生活中,机器人被广泛的应用于生活中的各个领域,通过不同的功能满足着我们不同人群的需求,相信在未来,随着人工智能技术的发展,机器人的应用会变得更加的成熟和广泛。
四、智慧城市
智慧城市,是从人们生活的衣食住行的方方面面入手,为人们生活打造一个更加完美和便利的生活环境。而2016年的“阿里云栖大会”上所提出的“城市大脑”,更是将智慧城市的这一概念提升到了一个更高的地位。城市大脑的核心就是利用人工智能的技术来对海量的大数据进行处理和不断的自我学习,从而为这个城市的管理和资源的分配做出最合理的决策。
也许这种“城市大脑”的概念对大多数人来说是一个抽象的概念,那么我们就用几个最直观的例子来告诉大家,这个代表着人工智能未来的城市大脑究竟给我们的生活带来了什么?
1、城市交通的缓解
“城市大脑”所带给人们最真切的体验就是城市交通压力的缓解。交通拥堵,是许多城市在发展中都会面临的一个严重的问题,杭州也不例外。在2015年的年度交通分析报告中,杭州的交通拥堵排名第四。而在2016年的城市交通分析报告中,杭州的拥堵排名下降4位,拥堵趋势下降4.94%,在全国拥堵缓解城市中排名第一。这其中很大一部分的功劳要归功于杭州的“城市大脑”。
在2016年的阿里云栖大会上,王坚博士用这样的一段话,来形容了城市交通的拥堵问题“世界上最遥远的距离是红绿灯跟那个交通监控摄像头的距离,它们都在一根杆子上,但是从来就没有通过数据被连接过。”
在现实生活中,你也可能遇到过类似的场景。你所在的车流已经排起了长队在等红灯,而对面亮起的绿灯却无车通过。面对这种无奈,我们过去也只能选择等待。但是在杭州,在“城市大脑”的思考下,一切都被改变了。在杭州市内安装的上万个摄像头,成为了“城市大脑”的神经网络,每时每刻都在提供着源源不断的数据流。通过人工智能对这些大数据进行处理后,就会根据当前的车流来智能的对交通信号灯进行控制。这一刻,摄像头成为了红绿灯的眼睛,那世界上最遥远的距离也变得尽在眼前。而“城市大脑”通过对这些眼睛获取的数据进行计算,还能够为不同路段的车辆推荐不同的最优行驶路线,从而让整个城市的交通网络压力被缓解的同时又能为广大的市民提供最优的出行路线。这所有的一切,靠人脑是无法完成的。只有这个以人工智能为核心的“城市大脑”才能在如此短的时间内,对如此庞大的数据进行快速准确的处理,从而做出那个正确的决策。
2、城市安全的提升
一个城市的安全,在某种意义上来说决定着这个城市的发展水平和生活的幸福感。“城市大脑”无论从应对自然灾害的发生,还是保障社会公共安全的方面,都让杭州成为了一个更加安全的城市。
对于杭州这个沿海的城市来说,台风是其中一个比较典型的灾害。而大多数时候面对台风,我们能做的更多是预防和在出现灾情时的及时救助,从而保证人民的人身与财产安全,将各种损失降到最低。
随着“城市大脑”所带来的人工智能技术和大数据的分析,我们可以在台风来临之前,根据气象部门推算的台风轨迹,再结合该线路上的日常的车流检测数据和车流去向统计数据,还有沿途建筑和人员统计数据,推演出在台风过境时,存在哪些潜在的风险,并且针对分析结果中的人群和活动,给予特殊的提醒,从而将风险降到最低。
但台风这种自然灾害,又存在着很强的不确定性,很容易在行径过程中发生变向,一旦出现这种情况,就会让很多地方猝不及防,并且在台风途径过程线路上还有可能发生其它不可预测的次生灾害。对于这一类情况的发生,往往就需要政府部门做出快速的反映,一方面对接下来可能发生的危险进行预估同时提出解决方案,另外一方面对已经发生的灾害进行积极的营救。在这其中“城市大脑”就会扮演一个十分重要的角色。首先“城市大脑”里存储了日常检测的大量数据,能够在极短的时间内,根据实时和历史的人流,车流,城市布局等各类数据进行一个综合分析,从而帮助人们更好的应对突如其来的变化。其次,当灾害已经发生时,需要快速的调配资源和人力进行救援。这原本是一个复杂的过程,但通过“城市大脑”,可以通过分析各个消防队和救援队的人员安排,同时根据就近原则迅速的制定出一个救援方案。同时根据各个医院的接诊状况和饱和度,确保所有的伤员被合理的分配到各个医院救治。在这种情况下,你对于“城市大脑”的表现可能无法直接感知到,但它通过对各类数据的分析和判断最大限度的保证了城市的有序和安全,同时让救援能够快速顺利的进行。
除了帮助城市应对自然灾害外,“城市大脑”还可以保障社会公共安全。还记得,2014年12月31日上海外滩的跨年活动,由于一位游客跌倒,致使发生了踩踏事件,造成了36人死亡。事后认定是由于预防准备不足、现场管理不力、应对处置不当造成的。而“城市大脑”对于预防和处理这类型的突发事件,有着人类所不具有的优势。它是24小时全时工作,不需要任何的休息,它可以随时的检测到不同商业区人流量。例如当城市举行大规模的聚会活动时,通过“城市大脑”可以获取到聚集地人流的实时数据,当人流出现密集的时候,可以进行报警提示,从而让管理部门增派人手维护现成秩序。并且,根据对周边人流布局的分析,给出合理的疏导路线,从而有效的降低人群的密集度。最终透过“城市大脑”这个人工智能的判断与处理,可以有效的避免此类踩踏事件的再次发生。
同时,基于人脸识别和图像处理技术,它还可以有效的预防犯罪的发生。针对出现的拐卖儿童的犯罪,我们可以根据人脸识别的技术,快速精准的对嫌疑人进行定位,从而在第一时间对孩子进行营救。同时通过对不同场所设置的摄像头采集的数据进行对比,还可以发现各类被通缉的罪犯。并且在欧洲,一个名为“P-REACT”的系统,在摄像头内设置了视频传感器、声音传感器、运动传感器和光传感器等,并编有智能算法,可以识别出打架、追赶、抢包等这类具体的犯罪场景。我相信随着技术的发展与成熟,“城市大脑”也会出现类似于“P-REACT ”系统的安全解决方案,届时摄像头就可以自主判别路上发生的各类犯罪行为,进行自动的报警。从而让生活在这个城市中的每个人,时时刻刻感觉到有人在守护着我们大家的安全。
这正是作为人工智能未来的“城市大脑”,希望带给这座城市的安全守护!
3、城市运行的高效
杭州作为一个聚集了918万人口的城市,它的高效运行确保了人们正常的生活。
“城市大脑”除去自身搭建的整个系统体系外,它还与富士康,大华等企业合作对杭州的各类基础设施进行改造。这一改造对于城市的智能化有着重要的意义。原本很多没有互联网连接的基础设施,在经过改造之后都实现了互通互联,让整个城市成为了一个整体,全部都处于“城市大脑”的管控之下。各类基础设施通过联网后,会将大量的数据传输给“大脑”,而城市大脑在对这些数据进行分析和处理之后,就可以为整个城市的高效运行提供最佳的选择。就像前文提到的城市交通,通过对红绿灯和摄像头的联网控制,可以有效的控制城市的拥堵问题,减少市民出行等待的时间,从而让城市的运行更加的高效。在城市的发展过程中,还会面临着很多其他的问题,比如水电这类能源资源分配的问题,这直接影响着市民的生活水平和企业的发展。而“城市大脑”通过人工智能的技术,从物联网的模块上采集到大量的数据,再依靠云端的计算能力,对这些大数据进行处理,从而对水电这类能源分配做出合理的规划,帮助城市更好地调度和利用能源。从而让城市的运行效率更高。
而“城市大脑”让城市的运行变得高效的另外一个体现就是:公共服务的效率提高。
对于每个城市的政府机构、社会公共服务机构、各类企业、银行等,每天都会面对众多的民众,产生大量的数据。对于这些数据本身来说并不会产生什么价值,而如果将这些数据汇总到一起,借助云计算对这些数据进行统计分析,就能够让“城市大脑”利用这些数据来搭建信息体系,从而让公共服务效率得到提高。假设两个政府部分之间,由于信息的不对等,导致客户在办理业务时,可能需要在两个部门之间来回确认。但如果“城市大脑”将两个机构间的数据进行了互通,那么当客户在两个机构中的任意一个办理业务时,都可以从云端获取到数据,这样大大提高了服务的效率。
4、城市管理的优化
一个城市的不断发展,一定与这个城市的管理有着密不可分的关系。而一个完整的城市规划,一定离不开大量数据的支撑与验证。在这其中,“城市大脑”所构建的体系,正是为一个城市的管理提供了可靠的数据来源。
在城市的管理当中,我们需要作出很多的决策。而对于这些决策最可靠的支撑和依据就是数据。如果单纯的依靠人们的主观判断,难免会有偏向性,而人工的统计数据,有些时候又会存在误差。这些种种的因素,在过去的很长一段时间内,困扰着很多城市的管理与发展。
而“城市大脑”的出现,正是为全国各地的管理机构提供了一套完整的解决方案。在这套方案中,所有的数据来源都是机器,这保证了数据的准确性。而分布于不同场景的数据采集又确保了数据的多样性。最后通过云端将所有的数据进行统计与分析,保证了数据的客观性。当城市的管理者,依靠这些数据再去做判断的时候,可以使其对整个城市的管理变得更加的高效,在做决策时能够获得更多的数据支撑,从而为整个城市的发展与管理提供强有力的支持。
“城市大脑”这一概念的出现,正是人工智能技术在实际应用场景中的一次实践。如果把“城市大脑”看作一个产品的话,它正是从交通、安全、运行和管理这四个方面,为城市中的广大用户提供了良好的用户体验,并且让这种体验成为用户生活中的一种常态。这也许是人工智能发展到目前为止众多场景中的其中之一,但它却是我最期待的一个应用场景,因为未来随着技术的不断发展和数据的不断积累,我相信“城市大脑”还会给我们带来更多的惊喜。
五、Amazon go
Amazon go真的带给了我们想要的购物体验吗?
2016年12月 5日, Amazon发布了其最新的研究成果:amazon go 线下实体店。这不是一个一般的实体店,它是一个融合了深度学习,计算机视觉和各类传感器等人工智能领域里热门技术的一个全新模式的线下无人售货的实体店。咋一听是不是感觉到很高大上。
那对于我们每个消费者来说,到底无人售货的实体店带给我们的是一种怎样的体验呢?
这其中最吸引消费者眼球的要数它无需排队的特点了,这在某种程度上,大大的节省了消费者的等待时间。让我们根据亚马逊官方的视频,来了解一下Amazon go的整个购物流程。
首先你需要做的就是下载Amazon go的App,当你下载成功后需要登录你的Amazon帐号,然后带着你的手机便可以到Amazon go去购物了。
当你到达商店时,打开Amazon go的App,使用二维码在入口处进行扫描,便可进入到超市内开始购物了。当你把需要购买的物品从货架上拿起时,超市便会自动检测到,并将它放到你App的虚拟购物车中。如果你又不想要了放回到货架上时,也同样会被检测到将此物品从你的虚拟购物车中删除。
当你完成购物离开时,店内的传感器会自动核算你的购买记录,Amazon go的App会从你的亚马逊账号所关联的信用卡中进行扣款并发送账单。当然如果你对账单有疑问,也可以打开手机随时的查看账单。
从以上的流程当中不难看出,整个购物流程一气呵成,大大的节省了人力成本和消费者的购物时间,因为它省去了传统购物中最浪费时间的一个环节:结账。虽然从视频里看上去,一切都很完美,但是回归到现实用户的体验上来说,它仍然还有很多的问题值得我们去思考和验证。毕竟原本定于2017年年初试营业的Amazon go目前因为技术故障推迟开业。这或许也是其自身希望能够将更好的体验带给消费者。
就目前视频中所看到的,Amazon go的用户体验距离人们所期望的还有一段距离:
1、商店面积的大小。
当Amazon go的宣传视频发布的时候,就有很多人在说无人售货商店会替代实体商店,但是作为一个面积只有167平方米的商店,我个人觉得它并不会替代谁,它只是提供给人们一种新的消费方式。相对与沃尔玛或者Costco这种大型的超市来说,它更多带给你的是便利。毕竟你不能期望一个只有167平方米的商店里,所有物品应有尽有。所以更准确的来为其定位的话,我们应该将其成为:无人售货的便利店。
2、同一时刻最多只能承受20人购物。
这对于Amazon go来说是一个硬伤,据报道援引知情人士的说法,一旦选购人数超过20,Amazon Go的整套设备就很难追踪用户以及手头上选购的商品,因此这项技术目前的测试环境仅能容纳少量用户,或者要求用户放慢移动速度。试想一下,当消费者去超市购物,被要求在购物的时候尽量慢一些,这是一种多么糟糕的体验,并且还有可能在结账时出现错误。换做是我宁愿去一家需要排队的便利店,也不会想去体验未知存在的风险。
3、一人购物与多人购物的冲突。
通过视频中,我们不难看出,整个购物流程,从一开始消费者扫描二维码到购物完成都是由一个人来实现的,因为这其中的整个流程都是和亚马逊账号所关联在一起的。但对于购物来说,它可以是一个人的行为,但可以是多个人行为。例如一家人路过Amazon go需要进入购买商品时,此时只有母亲拥有Amazon go的app,那作为孩子是否也被允许进入呢?如果孩子被允许进入的话,当孩子发生获取商品的行为时,如何来判断其与母亲的关系?如果孩子不被允许进入,那Amazon go将会把非常多的家庭拒之门外。这些在Amazon go的视频中都没有得到体现。
购物除去它本身的购买行为外,它同时也被视作是一种消遣娱乐的方式。如果仅仅是为了快速而把购物本身变得流程化,也会让我们失去一些购物所带给我们的快乐。
除了Amazon go 之外,目前国内也出现了很多类似的线下无人售货商店,例如:阿里无人超市“淘咖啡”、Take Go等一批新型的无人商店。其在技术上与Amazon go略有不同,但在实现的方式上大相径庭。在进入前都需要进行一个身份的验证来绑定支付的路径,在验证通过后进入到超时内便可以进行随意的选购了。当购物完成后不需要在排队支付,直接离开便可以实现自动的结账。其实在某种意义上来看待,他们都是将每次购物完成后的付款流程,提前到了购物开始前的预设,这样当用户完成购物时,就不再需要排队付款了。
这种模式本身是没有任何问题的,关键之处就在于除去技术和功能的实现外,对于购物的每一个细节的把控才是用户体验的关键,而不是简单的在技术上的堆积实现。未来清晰可见,但是人工智能与线下零售业的结合却还有很长的路要走。
回到本段开始,作者提出的那个疑问:Amazon go真的带给了我们想要的购物体验吗?
我的回答是:Amazon go确实带给我们一种全新的购物体验,但是这种体验是基于原有购物基础上的一种丰富而非替代。它让人们可以去尝试不同的方式购买,但是目前它还无法取代原有的超市而存在。Amazon go是人工智能在这个领域里的第一次尝试,这也仅仅是个开始。也许在不久的未来,当技术发展到一定阶段,当用户的体验更加完美时,这种购物模式会成为生活的中一部分。
六、关于人工智能的构想
作为一名产品经理,在看待人工智能的时候更多会从用户的需求角度来思考最终的产品形态。因为无论是何种技术的发展,最终都需要应用在用户场景中,通过产品的功能满足用户的需求。那么人工智能作为一个技术的发展方向,一定是需要与具体的产品相结合,从而让技术真正意义上转化为产品。而这一过程中,人工智能所能够搭载的形态和领域范围都十分的广阔,所以如何在这众多的技术概念中,设计出一款能够满足用户需求的独特产品,我想是无数产品经理所追求的。作为一名智能硬件领域里的产品经理,我也根据个人的经验和市场调查,给出一些个人对于人工智能技术应用于最终产品形态的构想。
当还没有出现计算机的时候,人们对于计算的需求,还仅是通过算盘的功能来满足。在那个时候,人们根本还没有意识到,我们的需求会变成利用计算机去处理数以百计的海量数据。这一需求其实是一直隐藏在用户自身的潜在需求,只是在当时的技术环境下,人们根本不知道如何去实现,所以潜意识中就将这种需求所过滤掉了。但后来随着技术的发展,人们开始了解到,计算机技术可以帮助人类处理很多复杂的计算和问题,于是乎人类基于对计算机的了解,就出现了很多的需求。当计算机随着不断的发展其功能渐渐满足了人类的大众需求的时候,它便开始走进了每一个用户的家中,成为了人们生活中不可获取的一部分。
虽然哲学上说“人不能两次走进同一条河流”,但对于人工智能来说,它的发展与早期的计算机有着很多类似之处。它是一个抽象的技术,绝大多数人还并不是十分了解它。所以我们没有办法通过市场调研和用户分析,来直接获取用户对于人工智能的需求。但是人工智能的发展已经进入了一个发展的快速期,需要更多的用户场景来让技术落地。
对于产品来说,人工智能的发展是意味着我们能够实现一些过去我们无法做到的事情,但如果要真正的满足人类的需求,最终还是要回归到对人的研究上。人类的需求,来自于自身的感觉,当我们深入了解到人类自身的感觉的时候,我们便可以根据这种感觉所派生的需求来思考产品的形态,进而利用人工智能的技术确定产品的功能,设计出真正让用户感到满意和喜欢的产品。
而人又有一些基本的需求:
人类的饥饿感:派生了对食物的需求
人类的孤独感:派生了对社交的需求
人类的好奇感:派生了对信息的需求
人类的乏味感:派生了对娱乐的需求
……
对于人类来说,大部分时间,我们是透过:视觉,听觉,触觉来认识这个世界的(嗅觉和味觉更多的与食物相关)。当我们思考人工智能未来的发展时,也需要结合:视觉,听觉,触觉这三个方面的因素,来构想未来产品的形态。因为每一个人都是通过这三种感官来认识环境和世界的。当我们在这三方面带给用户良好的体验时,也就意味着产品带给了用户良好的体验。
个人构想的用户场景
在上面已经介绍了目前人工智能主要发展的几个方向,并且小编个人认为未来人工智能在以上的领域中所带来的成就,绝不亚于工业革命对世界的改变。当然小编作为一名智能硬件公司的产品经理,对人工智能的发展也有着自己的一些理解。
1、智能家居领域
在人工智能的浪潮下,智能家居是一个非常好的创新方向。但是就目前市面上的产品来说却未能被大众普遍接受,更准确的说是目前的智能家居只是更换了一种人工控制的方式,并没有实质上的改变。这其中最大的问题就是:产品的功能和体验,还无法满足用户需求。
试想一下,一个智能音箱搭载了智能语音交互系统或者是一个智能电视搭载了移动终端远程控制,这些所谓的智能产品使用的方式还是通过人来操作完成的。当然也有一些产品在此模式上做了一些创新,例如一些小夜灯可以根据人的移动和外界光线来自动调整亮度,又比如某些空调可以根据当前屋内环境来自动调节温度。但所有这些产品当以一个单独的个体出现在家里时,它带给我们的体验也仅仅只能是功能操作的一种变换。
在我的认识里,智能家居是近几年才兴起的一个词汇。我们拆分来看,家居的含义是家庭装修和家具配置,它通过提供休息,做饭,洗澡,看电视,上网等功能,来满足用户在日常生活中对睡觉,食物,舒适,娱乐和信息传递的需求。而这里的智能指的是具有一定判断和逻辑,在某种程度上能够像人一样的完成一件事情的智慧。当我们将智能放在家居这个名词前面的时候,它改变的只是功能的实现方式,而没有改变人类对于家居的需求。所以本质上,智能家居满足用户的仍然是他们对于睡觉,食物,舒适,娱乐和信息传递的需求,但不同的是,智能家居通过不同的功能实现方式,能够带给用户更好的体验,而这种体验是用户之前所从未体验过的,在某种程度上,给我们的视觉、听觉和触觉带来了一种不一样的反馈,透过这种实现方式所满足的用户需求,能够让用户生活变得更加的简单和便利。
所以智能家居它不应该是某一种或者某一类的家居产品,而是一整套功能与内容相结合的生活解决方案,它们的构成应该包含:
语音交互作为入口+全息投影作为反馈+人脸识别作为辅助+机器学习与操控作为替代+强大的内容体系作为支撑
1)首先语音交互作为智能家居的入口,应该采用主动交互的模式。
我们应该跳出原先那种固有的被动接受的指令模式。进而设立一种主动服务式的智能产品模式。从用户主导变为主动服务的模式,将一套人工智能的体系预设到产品当中,并且通过深度学习不断的对预设内容进行自动优化和改进,从而通过产品的主动交互,来满足用户的使用需求。
具体的使用场景:
一类是预设好的场景指令,例如预设了沐浴的相关场景,每当用户下班回到家时,语音助手便可以向主人询问需要什么时候洗澡,通过对主人的语音反馈进行搜集和识别后,便可以按照主人的需求,在相应的时间点准备好热水,将室内的温度调整到一个合适的温度,然后在对应的时间点提醒主人该洗澡了。
另外一类,是留给用户开放设置的入口,让用户能够根据自己的需求,来设置各种各样的场景。例如用户是一个股票投资者,便可以通过设置相对应的场景,让语音助手在每天晚上主人回到家后,主动的去播报当天股票的情况和相关的信息。又如用户养了一条狗,便可以通过语音预设,当主人不在家的时候,让语音助手陪狗狗说话。
2)全息投影作为一种反馈方式
在生活中,单纯的语音交互对于用户体验来说是有缺陷的。这就好比在日常的生活中,我们会经常遇到:这个事情在电话里讲不清楚,我们当面沟通吧。理论上不管是电话里还是面对面,都是通过语言对话来讲述的,那为什么用户会觉得当面沟通会比电话沟通更加可靠呢?那是因为视觉+听觉的综合反馈要比单纯的听觉反馈更加准确,在实际的面对面中,除去对方的话语,你还可以通过对方的肢体和面部表情来判断对方的反馈结果。所以,在人工智能的产品中,我们单纯的去设计一个语音交互产品是无法带给用户满意的反馈。在平时的人与人之间的沟通都很容易出现理解错误的情况下,单纯的与机器的语音交互,往往会造成沟通的偏差。这个时候通过视觉与听觉的结合,会让机器与人之间的沟通更加的精准。
具体的使用场景:
在智能家居的环境中,通过类似全息的投影的技术,来对语音交互的结果进行一个显示。例如,用户对语音交互的场景进行了设置,当设置完成时,为了确保设置的准确性,通过全息投影的技术将预设的结果显示出来,以确保与机器的沟通准确无误。又或者对于用户关心的一些信息,除去语音反馈外,图像的反馈会让用户感觉更加直观。
那为什么要选择类似全息投影这样的方式,而不选择手机或者电视电脑作为反馈的方式呢?这是因为使用的便利性。当反馈发生时,应该是语音与图像的同步进行,在这种情况下使用类似全息投影,用户不需要再进行任何的动作,只要通过眼镜和耳朵就可以确认反馈。同时全息投影的另外一个特性就是可以带给用户带来更加强烈的沉浸感,这种3D效果的沉浸感会让用户仿佛置身于所呈现的场景中。并且对于类似的技术来说,它可以针对室内不同的位置和环境做不同的反馈效果,这样能够提供给用户一个科技感很强的使用场景,从而让反馈变得更加的简单便利。
3)人脸识别作为辅助
人脸识别这项技术的目的就是在于对人的身份识别。它通过图像的采集来判断目标人物的身份,同时在配合轨迹追踪和姿势判断等算法,来对人的行为做出判断,更多的时候应用于监控的领域当中。当我们在智能家居生活的构想中,来应用人脸识别技术的时候,我们会发现,它可以让我们所处的环境变得更加的安全和智能。
具体的使用场景:
安全性:对于每一个人来说,我们都希望所生活的环境是安全舒适的。而智能家居可以通过摄像头类的传感器搭载人脸识别的算法来实时的对家里或者周边的环境进行图像的采集与判断。当发现陌生人出现或者发现异常的时候,及时的向家人进行一警,从而来提高整个家庭的安全性。
智能性:人脸识别作为一个身份判别的方式,在智能家居的整个体系当中是必不可少的一环。就像之前所描述的当用户下班回到家时,语音助手便可以向主人询问需要什么时候洗澡。那如何来判断用户回家呢?这就需要人脸识别来完成。通过摄像头采集到图像来识别出到家的是否为自己的主人,从而再决定是否唤醒语音助手。
4)机器学习与操控作为替代
这应该是整个智能家居的核心所在,也是真正意义上带给人们的一种改变,因为这种替代是解放了人类的工作。
人类在日常生活的家居中都会进行哪些工作?打扫卫生,整理衣服,做饭,人工智能需要从替代人工作的角度来出发设计。
我想你一定听说过扫地机器人的产品,它的出现正是希望能够替代人类进行家庭地面的清洁工作。但在实际的使用过程中,用户还是会遇到一些问题,比如因为体积的原因,会导致清理的不够细致。同时机器人在使用后还需要对其进行清洁,这对于用户来说仍然是一项繁琐的工作。而用户所想要的是一个完全自主的清洁过程。在这里小编对智能清洁的工作也做了大胆的想象,当然在目前来说这也还只是一种概念性的构想。
在这个构想中,并没有改变当前各种地板的材质和样式。而是利用人工智能的技术,通过判断整个地面上的摆置物后,利用特殊的处理方式,在墙壁和各个物体之间构造一个水平面,而这个水平面与地面之前形成一个封闭的空间。这个时候再利用四周墙根处的吸尘装置,对封闭空间内的灰尘和杂物进行吸收。在洗尘完成之后,再通过刷子或抹布等方式,自动的对整个地面进行二次清洁。所有清理掉的垃圾,会被自动的搜集到垃圾收纳处。整个清洁的过程,用户只需要在清洁结束后将垃圾倒掉便可。
也许这种构想的可行性还有待论证,但对于智能家居来说,用户需要的正是这样的替代,不管是怎样的实现方式,对于用户来说,他们希望得到的都是能够替代人的工作,而不是简单的更换操作方式。
另外一个设想便是智能衣柜。在日常生活中面对不断增加的衣服数量,我们经常需要对自己的衣柜进行整理与归类,但智能衣柜的构想可以让我们将这一工作交给机器来完成。首先智能衣柜会将内衣,外套,裙子等衣服的分类提前设置好,用户只需要每次将不同的衣服放到相对应的收纳整理区域,衣柜便会自动根据各种传感器来识别衣服的重量和款式,再通过机械的方式将衣服折叠或挂起,最终对这些衣服进行自动整理和归类。在这一领域中,日本的一家机器人公司已经开发出了一款名为:“laundroid”的机器人。但其高昂的售价和缓慢的整理速度无法让普通用户接受,所以未来这个领域还有长足的提升空间。
最后一个讲到的便是智能厨房。在这个构想中,用户所需要的工作仅仅是买菜回家和将吃完的碗筷收拾到处理区域中。整个流程的实现,当用户将买回的菜放入厨房的智能装置中后,选择要做的菜,机器便会首先对菜品进行必要的清洗工作,在清洗完成后,对菜品进行切或摘的操作,然后根据用户选择的菜谱,在进行对应的炒或蒸的一系列烹饪手法,在这一过程中,机器会根据菜谱定量的添加各种调味料,直到整个流程完成后会自动的将食物放入至盘中,用户只需要将做好的才端上餐桌便可。在用户享受完丰盛的美食后,再将餐具统一放置在处理区域,机器便会自动的对碗筷进行清理,并且在清理完成后对碗筷进行归类放置。整个过程中,大大的节省了用户的时间和操作流程。
机器学习与操控作为替代是整个智能家居的核心,它所替代的是在我们生活中会占据大量时间的工作,这种替代会让我们从日常的家庭繁琐中所解放出来,同时又为我们提供了一个干净舒适的生活环境,让我们的生活变得更加的智能。
5)强大的内容体系作为支撑
无论智能家居的体系如何的变化,都离不开其背后内容的支撑。这内容不仅仅是语音库、图像库和机器学习的内容,它还包含了我们生活的方方面面。强大的内容作为智能家居的大脑,将所有一切联系关联在了一起,让我们摆脱了移动端的束缚,也让我们的生活变得更加的简单。
而智能家居的内容服务终端,就是这样的一个产品形态。它就像一个家庭里的大脑,管理着家庭里所有琐碎的事情。比如电费快用完时,它会主动咨询主人是否缴费,然后通过智能中心,从智能钱包里直接向水电中心缴费。又比如,智能终端会了解到你的所有个人信息,然后当你的信用卡快到期了它会提醒你,当你的车辆出现违章它也会催促你及时处理。同时,它会与各大医院建立联网系统,提醒你上次体检后,医生给你的建议,通过你日常的饮食习惯,从而给你生活的忠告。并且当你家里的卫生纸快用完时,你只需要冲着它喊一句“帮我买一提卫生纸”,它便会自动帮你下单送货上门。在这里,你还可以叫车,可以订餐,你可以做到的事情还有很多很多……
智能家居的背后是一整个生态的内容。它不是以某一种内容作为单一的联系,而是将所有的信息汇总在一起,形成了一个完整的大脑,对所有的内容进行管理和操作。而在这一点上,我想没有任何一方会比支付宝更加的合适。支付宝经过多年的积累已经搭建好了一个完整的生态圈,而人工智能的发展应该利用支付宝的生态圈来深入到智能家居的领域。
支付宝就是整个生态圈信息最全的一个内容提供商。并且它可以帮助你连接到生活的方方面面。支付、缴费、沟通等这所有的内容应用于智能家居上时,这意味着让智能家居真正的成为了你生活的管家。在整个智能家居的体系背后,强大的内容支撑,通过语音音箱,智能家具等各种创新的人工智能的硬件产品,为用户的生活带来完全创新的体验。
如果智能家居实现了以上构想,那么在未来,我们的一天很可能是会这样度过的:
早晨起床,告诉语音助手,你的早餐要一杯豆浆和两个煎蛋,于是智能厨房便开始帮你准备。当你刷牙洗漱的时候,语音助手会根据智能家居的终端大脑告诉你这一天可能需要注意的工作和安排。当你吃完早餐穿衣服的时候,打开智能衣柜面,呈现在你面前的是整齐的衣服,并且语音助手会根据当天的天气情况给出你穿衣的建议。当准备出门打车的时候,智能家居的大脑已经提前帮你叫好了车,准时出发开始一天的辛勤工作。当你下班回到家的时候,精疲力尽的你,又饿又累,这个时候,你只需要将买好的蔬菜放入洗菜区域,然后说出你想吃什么,就可以去享受智能淋浴为你提前准备好的热水澡了。吃完晚餐,想和爸妈聊个天,打开全息投影,躺在沙发上便可以与父母享受着亲情的温暖。当你准备入睡时,去到床上不需要再拿起手机刷信息,只需要看着投影,听着音乐便可享受这睡前的美好时光。当你感觉到困意时,只需要说一句“我要睡觉了”,声音和灯光便都会关闭,为你营造一个适合睡眠的环境。这样,你智能生活的一天就结束了!
2、娱乐领域
还记得在16年曾经风靡一时的pockmom go吗?它一经面世便受到了全球用户的热捧。他也让AR(增强现实技术)技术一下被推到风口浪尖。在当前的大环境下,用户对于娱乐和社交的需求是巨大的,这也就解释了为什么王者荣耀、快手等一系列的手机App能够如此的受欢迎。
对于人工智能来说,娱乐和社交同样也是一个十分广阔的应用场景,关键就在于我们如何将两者结合在一起。
我们来聊聊人工智能领域的游戏会是什么样的,先从游戏的一些设计理念来说起(小编不是专业的游戏产品经理,所以以下观点仅供参考)。
游戏的设计是一项复杂的工作,你需要知道它可以满足用户的哪些需求,带给了用户什么价值,如何保持用户的持续活跃度等一系列的问题。对于一款游戏的设计,还需要满足一些基本的原则:
游戏的主题内容:让用户对游戏有一个直观的认识
游戏的核心玩法:让游戏的内容和操作吸引到用户
游戏的操作规则:让用户明白应该遵循什么规律
游戏的奖惩机制:带给用户成就感和挫败感,维系其忠诚度
游戏的即时反馈:带给用户实时状态,感受游戏的实时性
游戏的持续更新:不断更新任务和玩法,让玩家保持新鲜感
游戏的晋升途径:让玩家树立目标,保持在线
游戏的现实世界:让玩家感受到,因为游戏而给他们的生活带了什么不同之处
通过游戏的这些基本原则,再结合到人工智能的技术和个人经验,小编也构想了一款关于人工智能领域里的游戏,暂且称其为:人工智能宠物。下面来说说我对这款游戏的设想吧:
首先这款游戏内容里的所有宠物不再是一个单纯虚拟宠物,而是一个具有不同宠物外形的智能硬件,它需要连接网络使用,并且每一种外形的宠物都具有不同的功能,但是用户需要通过完成任务升级来不断的解锁新功能,从而让自己宠物的功能变得更加的强大。这里的完成任务不再是单纯的线上操作,而是可以将你的宠物与手环或者微信运动等绑定在一起,通过各种类型 运动数据传输给宠物进行补充能量和提升等级。并且这个宠物具备了语音交互的功能。当你的宠物长大到一定年龄后,你就可以解锁像交友这类的功能,直接通过你的宠物与其他的宠物进行语音社交。而当你在外发生微信支付等设定的行为时,也可以为其补充技能。此外,你的宠物还会有线上的虚拟形象,你可以为他起名字和更改形象,并且通过参与线上的对战,还可以为你的机器宠物解锁更多的功能。
接着再从游戏的角度来思考这个人工智能的宠物:
游戏的主题内容:人工智能宠物,让机器宠物陪伴你的身边,陪你一起升级。
游戏的核心玩法:通过微信运动的数据,或者其他一些生活中真实的行为来完成任务,与宠物建立强联系,从而培养用户的良好生活方式。并且通过这些行为不断的解锁宠物的新功能,为玩家呈现出一个完美的宠物伴侣。
游戏的操作规则:让宠物成长与实际生活关联在一起,每升高一个等级,解锁一个功能。
游戏的奖惩机制:玩家可以通过完成不同的任务来获得奖励,同时因为玩家自身的原因,也会导致惩罚。
游戏的即时反馈:这个宠物是会联网,所有的数据都会透过云端实时的与宠物共享。
游戏的持续更新:对于宠物硬件功能的设定是提前预设好的,但宠物背后的整个云端体系是会不断的更新,透过云端来为宠物不断的增加新的功能。同时也为用户不断的提供新的玩法。
游戏的晋升途径:当玩家的宠物等级越高的时候,玩家所拥有的功能就越强大。
游戏的现实世界:透过这一人工智能的宠物,将实现生活与虚拟生活实现紧密的联系,让人工智能真正的带给我们一个不一样的游戏世界。
总结:
这是一个人工智能的时代,在我们生活的每一个角落都可以看到人工智能的影子。我们没有办法去评论它的好与坏,因为技术本身是没有对错,只是技术所应用的使用场景和后果会有好坏之分。
在这个被技术所主导的时代中,我们需要的是引导,引导技术向着一个正确的方向所前进,找到那些人类真正的需求所在,让技术真正给人类的生活带来帮助而不是灾难。
埃隆·马斯克曾经在他的推特上这样写到:
“AI will be the best or worst thing ever for humanity, so let’s get it right.”
对于人类来说,AI可能带来美好,也可能带来灾难,所以我们必须让其在正确的方向上发展。
无论如何,找到那些真正需要人工智能的应用场景,将人工智能的技术应用在需要它的地方,让其为了人类的文明做出它应有的贡献,这是人工智能领域里每一个工作者的一份责任。
从用户场景,来思考人工智能可见的未来,这个未来充满了未知的可能性……
谢谢。