最自然的人机交互技术是指那些能够利用人类自然地认知和感知能力、社会技能以及我们从小就养成的行为习惯。—人机交互大师Turk
人机交互开始于世界上第一台计算机ENIAC的出现,操作系统是以下命令的方式来完成的,程序员主要通过穿孔卡和键盘来使用计算机;
1968 年道格拉斯·恩格尔巴特向全世界展示了一套利用鼠标、和弦键盘以及显示器来操作计算机的在线交互系统,登时惊艳众人;
(道格拉斯演示 NLS 系统,图片来源:Computing History)
电脑端交互:
关于苹果和微软的图形用户界面,反正大家都知道,不做赘述了。革命性的人机交互设计对计算机的推广普及可谓居功至伟。
70年代Xerox研究中心的Alan Kay提出了Smalltalk面向对象程序设计等思想,并发明了重叠式多窗口系统;
1989年Tim Berners-Lee在日内瓦的CERN用HTML及HTTP开发了WWW网,随后出现了各种浏览器(网络用户界面),使互联网飞速发展起来;
至此,基本上形成鼠标、键盘、桌面、窗口的交互铁律;满足了交互的稳定、高效、精准需求。计算机的人机交互大局已定!
移动端交互:
在诺基亚、摩托罗拉统治手机市场时,键盘交互是绝对主流,尤其黑莓全键盘更是键盘交互的巅峰。固一世之雄也,而今廉颇老矣。
2007年1月9日,iPhone的横空出世可以说改变了整个手机行业——它的3.5英寸全触控屏幕、金属机身以及iPhone OS真正推开了智能手机时代的大门,触摸屏交互方式由来已久,然而iPhone的标杆引领作用使之成为主流,触摸解决了键盘的低效,实现所见即所得的直观交互体验,为后来的移动互联网发展奠定基础。
随后iPhone 4S带来的Siri、iCloud ,Siri推广了人工智能助理,iCloud推广了移动端云存储。Siri的初衷是为了实现智能化语音交互,虽然近些年来人工智能风头无两,然而要真正实现满意的交互体验仍然任重道远。iCloud的云存储在交互方面可以提供更多的云端资源,转移了终端硬件压力,拓展了设备的发挥空间。
2003年7月富士通推出全世界首款带有指纹识别的F505i手机,2013年iPhone5s重新定义指纹识别,之后,全世界的高端旗舰手机都开始攻关指纹识别技术,该技术除实现智能手机的解锁等交互,目前国内手机配件供应商以思立微、汇顶为主的指纹识别产品可以实现上下左右等交互功能,如今中高端智能手机市场指纹识别几乎成为标配。
2016年10月25日小米新品发布会上,发布小米MIX。采用全面屏黑科技,整部手机正面,其屏幕为6.4英寸全面屏极简设计,屏占比高达91.3%,屏幕显示内容更多,视觉体验更震撼。采用无胶榫卯卡扣式连接,如果我没猜错的话应该是开创了全面屏手机的先河。
2017年9月13日,苹果在乔布斯礼堂发布iPhone X ,取消指纹识别,使用面部识别,并使用异行全面屏,为了 AR 做专门优化和升级,iPhone X 的 A11 芯片相对前作又有了绝对性的提升,A11 还单独拥有一个每秒运算次数最高可达 6000 亿次的神经网络引擎,在当前它可以担负起为面容 ID 提供快速分析的性能支撑,而后期则将体现出其在神经网络和深度学习方面的优势,在人工智能等应用中发挥巨大作用,这些技术在新的人机交互方面蕴含着巨大潜能。目前国内手机大厂正在跟进······
年初的时候vivo带来了真正量产版本的屏幕指纹手机X20 Plus屏幕指纹版,并在MWC2018展会期间vivo公布了一款概念手机APEX。笔者未曾体验不敢妄加评价,不过这总归是个好消息。相比面部识别的种种负面新闻,屏下指纹识别显然是更好的解决方案,尤其是使用全面屏的情况下,当下主流屏下指纹识别设计方案有超声波、压力、电容、光电等,鉴于技术尚不成熟,各大厂商难以量产退求其次。
先驱还是先烈?
炫酷有余,需求不足
微软的XBOX体感游戏机,初代Kinect的技术堪称豪华,被当时视为“黑科技”,搭载RGB彩色镜头、3D深度传感器、红外发射器和红外镜头具有当时消费级产品中最好的动作识别精度,这主要得益于采用了PrimeSense公司的解决方案,后者的深度传感器可以利用红外线和摄像头追踪空间中的物体。
遗憾的是问世近7年后,微软体感游戏设备Kinect终于要停产了。另外PrimeSense公司被苹果收购后,其深度传感器技术又整合入了iPhone X,成为人脸解锁需要的核心技术之一。
2012年4月谷歌发布了一款“拓展现实”眼镜,它具有和智能手机一样的功能,可以通过声音控制拍照、视频通话和辨明方向,以及上网冲浪、处理文字信息和电子邮件等。Google Project Glass主要结构包括,在眼镜前方悬置的一台摄像头和一个位于镜框右侧的宽条状的电脑处理器装置,配备的摄像头像素为 500 万,可拍摄 720p 视频。
令人遗憾的是2015年1月19日,谷歌停止了谷歌眼镜的“探索者”项目。谷歌眼镜可以算作AR产品,能够实现真实世界和虚拟的信息集成,具有实时交互性,在三维尺度空间中增添定位虚拟物体。如今iPhone 有意扶持AR,今后发展请大家拭目以待。
虚拟现实技术(VR)是仿真技术与计算机图形学人机接口技术多媒体技术传感技术网络技术等多种技术的集合,是一门富有挑战性的交叉技术前沿学科和研究领域。虚拟现实技术(VR)主要包括模拟环境、感知、自然技能和传感设备等方面。
模拟环境是由计算机生成的、实时动态的三维立体逼真图像。感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外,还有听觉、触觉、力觉、运动等感知,甚至还包括嗅觉和味觉等,也称为多感知。
自然技能是指人的头部转动,眼睛、手势、或其他人体行为动作,由计算机来处理与参与者的动作相适应的数据,并对用户的输入作出实时响应,并分别反馈到用户的五官。传感设备是指三维交互设备。虚拟现实技术在20世纪60年代就已萌芽,经过多年发展始终没能找到爆发期。
全息投影技术(front-projected holographic display)也称虚拟成像技术。其技术原理多样,全息投影技术可以在现实空间生成立体的幻像,有些可以与人进行交互,参见星球大战里的全息通信。如果该技术能够实现真正实用化,必将引发交互革命,目前的全息投影适用范围产品展览、汽车服装发布会、舞台节目、互动、酒吧娱乐、场所互动投影等。风靡世界的虚拟偶像初音未来的现场演出就是全息投影实现的。
如此极客的玩物,不胜枚举······
未来或许还没来
更加神奇的人机交互,如眼球控制、意念控制,心灵感应,脑机接口什么的,要么还停留在科幻阶段,要么尚无产品化的实物,在此也就不敢多说了。“无所不在的计算思想”持续指导着人机交互的发展,设备将不再是累赘,而是融合到我们周围的自然环境中,并更加智能地为我们提供服务。
可感知用户界面(PUI)目前主要集中在以下几大领域:触控交互、笔式交互、机器视觉交互、语音交互、脑-机交互、其他传感器类交互以及多通道交互领域。尽管如今有语音、图像等交互方式蓬勃发展,图形用户界面(GUI)在短时间内仍然占据主流。
未来会来,但不是今天!
没有预测的尾声
随着计算机能力越来越强大,人类对其依赖和要求也越来越多,如何让机器更好地理解人类意图,让人类更轻松得到所需,这才是人机交互技术本质所在。正如《数字化生存》的作者尼葛洛庞蒂所言“界面应该设计得像人一样,而不是像仪表板一样”“这种设计不仅了解人的需求和感觉,而且表现出超凡的聪明才智,以至于物理界面本身消失不见了。”