【编者按】本文解析了当前仍在开发中的全新技术bRight——bBright实现的是智能化的人机交互。文中对SRI计算机科学实验室Grit Denker博士的采访解析了当下技术发展的现状及未来的前景。
我坐在电脑旁敲键盘的时候,旁边是一个显示屏把世界各地的新闻订阅源推送过来,另一个屏幕则不断更新着Twitter,还有一个屏幕则告诉我又有新邮件进了收件箱。尽管我已经感到被信息淹没了,但比起那些空中交通指挥员、网络管理员以及在应急控制中心的工作人员,甚至是繁忙的股票交易员来说,我的问题不值一提。由加利福尼亚SRI国际的研究人员开发的bRight,目的就是要帮助那类经常需要做出果断决定,但同时又面对从各处在同一时刻到来的巨大信息流的人更容易地工作,这些人员也是虚拟助手Siri的最初开发者。为了提供自动化任务和数据过滤,这一系统可以通过之前的行为来预测个人或集体的行动、表现和需要。
2007年,硅谷公司SRI国际创立了Siri公司,以把由美国国防部高级研究计划局资助的CALO(能学习和组织的认识助手)人工智能项目发展而来的虚拟个人助手商业化。之后在2010年2月,在iOS平台上发布了一个免费的公测版应用,仅仅几个月后,苹果就收购了这家公司。往后到2011年10月,一个叫Siri的语音助手做为iPhone 4S的新功能发布了。
不久,Google也在Android 4.1(Jelly Bean)上发布了自己的虚拟个人助手。为了能用自然人声提供像Siri一样的搜索和帮助,Google Now根据用户之前的行为和决定来提供信息和建议。SRI最新的项目bRight,做为一个解答什么是认知过载,在紧急情况下涌入的信息流在什么情况下可以被证明是太多而无法有效地迅速处理的项目,它比前面提到的两个系统都要先进。
研究模型通过脸部识别技术和眼球追踪系统,以及近距离、手势和触摸传感器来建立详细的用户档案。和现代电脑在遇到特定的情况时有效地走捷径从而增加性能效率一样,bRight强大的人工智能软件使用这一信息来预测需要什么样的东西来使得只有和工作相关的数据才会提供给用户,需要的工具可以直接送到用户手上,而重复的工作则能够完全或部分地自动进行。
例如,在一个简单的层面上,如果一个用户在文档中高亮了一个词,系统就可以猜测用户需要的下一个菜单项是什么从而把可能的选项显示出来。或者是如果某人在写一封特定的邮件,例如员工通讯或是绩效公报,bRight也许可以通过之前的行为来预测它的接收者是谁,从而预先放到收件者栏。或许也可以探测潜在的错误和对标准程序的违反。
“如果bRight识别了用户行为的某一类别,就可以提供正确的行为指导,”SRI计算机科学实验室的Grit Denker博士解释道,“比如说当我在写一封关于新bRight新点子的邮件时,而我一般都是先发给内部团队,再发给外部人员,这样,如果我在发送邮件时没有先发给我的内部团队,bRight就可以提醒我这是不是我的正确意愿。”
在一个更加紧急的情况下,例如当计算机网络遭遇恶意攻击时,bRight可以执行激进的上下文过滤来把管理员直接需要的相关信息提供给他,同时把不需要紧急处理的信息推后处理。它也可以预测在这种情况下所需的工具,从而通过跟踪传感器来把这些工具放到更易取用的地方。
此外,更加智能地使用共享信息也可以节约宝贵的反应时间。例如,一个身在华盛顿的网络管理员可能发现了一个系统威胁,于是向在加州的同事发邮件寻求迅速行动,但是却忘了把完成任务所需的重要信息包括进来。这时,发现管理员的首要工作在写邮件时,bRight就可以进入相关的加州邮件从而把重要的空白之处补上。
“bRight结合了程序层面的语义标记和监控层面的传感器,”Denker博士说道,“这种结合可以提高预测的精度,特别在一个没有很长时间的训练数据的情况下。为了实现可用性,需要很高的精确性。要实现这一点必须把认知模型和应用程序完美结合。我们目前正在使用我们的工具开发一个网络领域的用户认知模型。我们非常想找到可以和我们一起让bRight在至少符合以下条件中的两个的领域实例化:信息过载,快速做出和执行决定,以及协作需要。
bRight的框架正在被装载到各种不同的平台和装置上,从平板上运行的精简版到图片中显示的那个巨大的多点触控原型机。后者包括了一个标准高清电视,一些指向用户的摄像头,一个红外线眼球追踪系统以及一个叫作bRight工作台的触摸屏界面。在触摸屏的下面,有一系列的红外感应器用来捕捉屏幕上的多点触控,近距离探测以及手势记录。除此之外有个台式电脑在运行软件。
“在未来,可以预见很多的传感系统将变得更小,而且有些已经实现了,”Denker博士猜测道,“这样就可以更容易地把核心的人工智能算法转移到平板和智能手机这类平台上。”