随着人工智能的越发火热,越来越多公司开始研发人工智能产品,其中对话AI产品尤其被大家所关注。当前十分火爆的智能音箱就属于人工智能对话AI产品,其主要交互方式是语音对话,所以语音交互开始被广泛关注。本文尝试探讨的课题,即是图形用户界面设计与语音用户界面设计的关系。
GUI与VUI的概念
本文中GUI (Graph User Interface) 指的是图形用户界面,包括我们现在所熟知的界面交互设计和视觉设计。本文中VUI (Voice User Interface) 指的是语音用户界面。
GUI是道格·恩格尔巴特(鼠标发明者)提出的概念,自从80年代苹果推出第一款搭载GUI的电脑后,至今为止GUI一直是人机交互的代表。VUI前身是IVR —— 交互式语音应答系统,比如:10086的语音应答系统。
21世纪初,IVR系统已逐渐普及。起初,“按键+语音”的混合形式(“请按‘1’号键,或说‘1’),成为了人们和很多公司沟通的常见方式。
简而言之,VUI主要指的是人通过自然语言与计算机进行交互。由此可见,GUI和VUI指的都是用户与计算机进行交互,区别在于交互方式不同,前者通过图形界面进行交互,后者通过自然语言进行交互。
VUI更加自然
GUI——用户与系统在肢体上、感知上、概念上联系的所有部分的总和。所谓肢体上指的是用户点击按钮、操作键盘和鼠标;感知上指的是视觉、听觉和触觉;概念上指的是认知。
用户与计算机进行交互,主要通过手指操作硬件进行输入,主要通过视觉感知获取输出。整个交互模式是人为创造的,对人类是陌生的,是非自然的,学习成本较高。
对于VUI来说,用户与计算机的交互方式是自然语音,就像人与人进行沟通。用户通过声带发声进行输入,通过听觉进行感知,交互模式是自然的,学习成本较低,老人和小孩都能快速学会。
VUI信息量较小
GUI所能表达的信息量往往较大,更加丰富,维度更广(包括时间和空间)。因为人类的视觉可感知到的信息更加丰富,也更加立体。在图形界面上不止可以展示文字,还可以展示图片和动画,信息输出更加丰富、生动和高效。当然,如果输出的信息越丰富,认知成本也会越大,也更难快速抓住关键信息。
VUI信息输出的载体是自然语言,靠听觉进行感知。因此,VUI在单位时间内所能输出的信息量较小,较单一,且只涉及时间维度。正因为如此,VUI的语音一定要简洁高效,切记废话,要让用户在短时间内快速获知核心信息。由于语音信息密度小,用户在获取语音信息的时候也会更加专注和轻松,不会被附加信息所干扰。
GUI的设计目标和部分设计原则同样适用于VUI
VUI同样属于用户体验设计范畴,只不过交互形式发生了变化,而人本化的设计目标和基于认知的设计原则不变。
1. 易于理解和使用
VUI同样需要易于理解和使用,同样需要遵循可见性、一致性、熟悉性和启示性。可见性——尝试保证事物可见,让用户感知到哪些功能是可用的,知道系统的当前状态。
可见性不单单指视觉可见,对于VUI来说,可见性主要指听觉“可见”,目的是让用户察觉到它。
一致性——在使用设计特征时保持一致,在相同系统和标准工作流程下保持一致。对于VUI来说,一致性包括人格一致、说法一致、音效一致等。
熟悉性——使用用户熟悉的事物,目的是让用户在使用产品时有熟悉感,而不是陌生感。熟悉感会让用户感到亲切和自信,否则会感到不安和焦虑。对于VUI来说,熟悉性指的是系统反馈的语音是让用户感到熟悉的、亲切的,就像朋友在与自己聊天。
启示性——一个优秀的设计是能够清楚地看出它是用来做什么的。比如:把按钮设计成可按压的样子,那么人们在使用时就会按下它。对于VUI来说,启示性指的是系统要巧妙地给用户提示,启发用户更熟练地与系统进行交互。
比如:如果用户说:“我想听Barenaked Ladies的歌曲《Call and Answer》。” 然后VUI回应:“播放Barenaked Ladies的《Call and Answer》。”这样下次用户可能就会直接说:“播放Barenaked Ladies的《Call and Answer》。”
2. 安全、信任的
VUI同样需要让用户感到安全并信任系统,让用户感到控制感,知道他们在做什么和怎么去做。
控制——清楚何人或何物处于控制之中,并允许用户进行控制。对于VUI来说,就是要给用户充分的控制权。比如:在播放音乐时,需要支持语音控制音量、上一首、下一首、收藏、取消收藏、切换播放模式等操作,让用户可以完全解放双手。
反馈——快速地从系统向人反馈信息,从而用户可以了解他们的操作所带来的影响,恒定而一致的反馈会促进控制的感觉。对于VUI来说,需要给用户充分且恰当的语音、音效等反馈,让用户及时感知到系统状态。就像人与人交流时,如果A说了句话,B没有回应,那么A就会感到没有被尊重,这是很糟糕的体验。
恢复——支持快速和有效的恢复操作,尤其是从失误和错误的操作中。对于VUI来说,同样要避免单行线式的操作路径,需要给用户返回、恢复的机会,比如:有语音收藏歌曲功能,就一定也要有语音取消收藏功能。
约束——提供一些约束从而用户不会进行不合适的操作,尤其是,可以通过限制性允许的操作和对危险操作的确认来防止用户产生严重的错误。对于VUI来说,对于某些有风险的操作,也需要给用户一定的约束。比如:当用户说:“把音量调大最大”时,系统最好让用户进行二次确认:“音量最大会非常响,确定要调到最大吗?”
3. 灵活、愉悦的
用户体验设计的目标之一就是要让用户感到愉悦,因此情感化设计被不断提起。人工智能对话AI产品的设计目标当然也是要让用户感到愉悦。
灵活性——允许多种方式,适应具有不同经验和兴趣的用户。为用户提供可以改变事物外观和行为的机会,从而实现系统的个性化。比如:如果可以让用户选择或切换系统的人格(端庄稳重还是俏皮可爱),用户的满意度肯定会因此加分。
风格——设计需要是时髦且吸引人的。对于VUI来说,需要系统的音色和语气是吸引人的,不管是端庄稳重、俏皮可爱,还是温柔舒缓,总之需要有魅力。有魅力才能让用户动感情,喜欢上这个系统。
趣味性——一个吸引人的系统必须是文雅的、友好的、有趣的、令人愉悦的。对于VUI来说,需要在对话中尝试添加一些趣味性。我们都喜欢幽默的人,自然也会喜欢幽默的系统。这主要取决于系统语料的质量,需要语料是丰富且有趣的。当然什么事都需要把握好尺度,过分了就会显得不真诚。