自然用户界面(Natural User Interface, 简称NUI)被认为是既CLI(Command-line interface)和GUI(Graphical User Interface)之后的下一代用户界面。它的特点是:非常简单易学,可以让新用户在很短的时间内从“初学者”变成“专家”,让用户在使用NUI的过程中持续的收获成功而不会有挫败感。这也是NUI中“N”的含义:通过更合理的发掘和利用用户已有的心智模型和潜意识中的东西,创造出合适的隐喻,让互动的发生变得更加自然,减少用户的思考和疑惑的时间。NUI中通常糅合了多种交互手段,例如:触控、语音、手势、体势等等。
原文作者:Donald A. Norman
“我相信未来的人们会回过头来看2010年 — 我们跨越了鼠标和键盘,将一些更加自然的交互手段,例如触摸、语音、手势、书写等糅合在一起,跨入了被计算机科学家称为NUI的时代。”
—— Steve Baller CEO Microsoft
基于各种手势的交互技术目前已经成为了商业领域的新宠。更小更便宜但是更高效的微处理器、内存储设备、摄像头、让用户通过点击、滑动、和其他各种复杂手势来操作设备成为可能。“交互”这个名词正在被重新定义,规则也正在被改写。甚至连未来的交互方式都已经被市场起好了名字:“Natural User Interface”。
其实这也没有什么奇怪的,市场中的一些噱头总是比现实要超前的多。无论交互的形式怎样变化,其中影响用户体验的一些核心元素并没有改变。GUI的强大之处在于:“图形”并不是它的全部,它服务于以一种非常直观的方式告诉用户哪些操作动作是可行的以及怎样执行这些动作。也许图形化“图标”和“菜单”显得有些机械,且GUI在面对复杂的系统时的表现也不尽如人意,但是其至少提供给了用户探索和学习的机会。GUI最重要的设计原则既“可见性”:通过“菜单”,所有可能的操作行为都对用户可见且易于发现,让系统易于探索并被用户自然掌握。
基于手势的用户界面并不新鲜,其实在较早的时候,手势就已经成为了人机交互的一部分。Brad Myer在1998年发表的一篇文章简单回顾了这一领域,介绍了手势技术研究从上世纪60年代开始直到90年代初步商业化部署(例如92年苹果的 Newton)的历程。到了80年代,Myron Krueger通过投影技术探索人造现实(Artificial Reality)领域则让手势交互技术开始为大众所熟悉。而多点触控技术则从上世纪80年代开始就已经存在:Nimish Mehta在1982年的论文中设计了第一个服务于HCI的多点触控交互系统。如果再将思路放广一些,大部分乐器本身就是“手势”和“多点触控”的结合体,而后期电子乐器的出现(电子鼓,电吉他)让这两样交互技术同电子世界联系了起来,这种交互形式已经存在了很久 — 1928年俄罗斯人发明的泰勒明电子琴(合成器)是世界上最早的这种使用手势控制的电子设备。
大部分手势都远谈不上“自然”并能够让用户轻易学会,只有少数手势能够让用户不需要刻意学习而立刻使用。即便是最简单的“摇头”动作,在不同的文化中也有不同的含义。相信前往印度的西方旅行者肯定有过这种体验:点头表示“no”,摇头表示“yes”。同样的,即便是最简单的“您好”,“再见”,“到这里来”等手势在不同的文化中也有不同的表现方法。你可以在wiki百科中搜索“list of gesture”来了解一些高频率手势在世界各地的使用情况。
另一个手势不被看好的原因是 — 由于手势通常是一个短暂的动作且不会留下“记录”或者“路径”,这些重要信息的缺失导致当用户的手势没有得到任何反馈时(当用户犯错时),通常只有很少的信息能帮助他们找出原因。另外,一个纯粹的基于手势的交互系统对用户来说会是一个巨大的挑战 — 他们必须自己去探索所有可能的手势操作指令并记住它们。
当然,并不是说基于手势的交互技术就一无是处了,它仍然是一种很强大的交互方式,并且我也相信它会在未来的交互世界中找到自己的位置并占有一席之地。科技进步的过程也就是让新技术走向廉价的过程,让基于这些新技术的产品可以被大规模的制造和推广开去。我认为手势技术在未来会被统一和标准化,就像现在的一些“标准”手势那样:向上抬手代表着“更多”(提高音量、大小等),摇动设备代表“提供另一个选择”,水平滑动手指意味着“前往新的页面”等。新的标准和细节会被制定,举个例子:大家都知道用手指按住并拖动图片以改变它的位置,但是大部分人对于停止手势操作后,依然让图片滑动一下段距离再停下来的 “动量”因素并不熟悉(目前还是有很多移动设备的用户界面都忽视了对“动量”的设计)。“动量”设计的关键涉及到了另一个参数:“摩擦力” — 这样,当用户将图片拖动到另一个位置并停止手势时,图片仍然会在“动量”的驱动下继续运动,并在“摩擦力”的作用下运动一小段距离后渐渐停下来。当然,放在今天,“动量”的效果对大部分人都不陌生,但是我第一次见到这个效果还是20多年前的事情了 — Apple的HCI小组,由Joy Mountford开发出来。手势的时长和动态性无疑会在今后成为大部分论文和研讨会所关注的焦点,即便是在今天,不同的研究小组也有自己的“规则”,特别是在很多设计细节上都不尽相同,例如,当你用手指头拖动一张图片并触及到屏幕边缘时会发生什么?如果有多个屏幕呢?如果有多个用户,每个用户各占用独立的一个屏幕呢?图片可以从一台电脑被“拖动”到另一台电脑上去吗?这些交互细节也由于各自“规则”的不同而变得不一样。
目前手势开发者所面临的一些困难让我想到了很早前GUI开发者所遇到的一些类似问题。在开发早期Xerox PARC的GUI时,当用户将文件图标拖放在文件夹图标上时,很自然的,文件图标应该消失在文件夹图标上 — 同理,拖放到垃圾桶图标上时也应该产生同样的视觉效果。但是这个交互原则在遇到打印机图标时遇到了问题:执行拖放动作之后,文件是被打印出来了,但是同时文件也消失了,这是合理的吗?当时,交互设计师花费了大量的时间来解决类似的问题,让各个细节都趋近合理、完美、和降低疑惑。而在基于手势的交互系统中,这样的问题会更多,也需要设计师花费时间仔细思考这些问题。
目前,有些研究者正在尝试开发一种全新的“手势语言”,试图根据用户触控点的数量来赋予系统不同的指令输入含义。例如,单点触控、两点触控、三点触控、四点触控等,分别代表不同的指令或指令输入方式。着让我想到了在鼠标点击动作中曾经出现的类似问题:一次点击代表放置输入符,两次点击代表选择一个单词,三次点击代表选择一段话 — 看似合理,但是也有内在的逻辑问题。如果每次点击都是“上升一个层次”的话,那三次点击为什么是选定一段话,而不是一句话?需要注意的是,研究者在开发 Xerox Star的GUI时,曾经花费了相当多的精力来建立一套“完善而标准”的“点击”命令系统,就像现在研究者尝试建立一套“手势”指令系统一样,只是这套 “标准”并没有能长久的发挥效力,只有很少一部分规则沿用至今。
如果从体验的角度看手势操作的话,它也可以分为两面:手势(以及间接的体势)可以在交互的过程中带给用户更多的参与度和愉悦度,但与此同时,长久的使用手势操作也很容易让用户感觉疲劳,不当的手势甚至会让用户有受伤的危险,在Wii上热门的保龄球游戏就是一个例子,很多用户会把握在手中的控制器当作保龄球扔出去,某些过于“自然”的手势/体势很可能会造成些我们意想不到的后果。
有些人可能会说:我们的系统是完全基于手势/体势的,不需要任何控制器,当然,这就不存在把控制器扔出去的情景了,但是紧接着而来的是另外一些更为复杂的问题:虚拟物体在实体世界中象征的缺失?缺少了控制器,系统能否应付得来极端复杂的人体运动状态 — 范围、连续性、持续性、临时性等的界定,都是挡在前面的难题。这也是为什么目前大部分基于手势的系统都会提供给用户或多或少的控制设备:开关、手持控制器、手套等等,以绕开一些更复杂的技术问题。
手势交互系统的设计同其他形式的交互系统并没有本质上的区别,也必须遵从基本的交互设计中的基本原则:用户形象、用户行为、使用场景、以及用户同系统之间可能发生的各个交互细节、它们所可能产生的影响和结果。由于手势操作的高自由度,用户的手势常常会模棱两可,不清晰,因此来自系统中的反馈 — 用于指导用户的提示,让用户了解他们的动作造成了什么效果,错误出现在哪里,应该怎样做才能走出困境,则更加必不可少。另外,由于手势是一种自然存在的行为,系统还必须具备区分用户手势的能力:哪些是用户下意识的动作,哪些是用户的指令输入。在解决这个问题的过程中可能又会遇到更多的问题,指令输入和用户自然手势动作的分类将变得很困难,而这些问题在键盘、鼠标、和触控笔上是不会出现的。
最后,我想要总结的是,手势技术会成为未来交互技术中非常有意义的一个组成部分,但是它还需要时间真正成熟起来、让研究者找到最适合它的使用场景、有一套标准的规范让相同的手势在不同的系统中可以表示相同的含义。另外,我们也需要一套更好的理论来处理手势系统中的用户引导、反馈、纠错等问题。
基于触屏的手势交互系统目前已经被很多用户所接受,我常常看到人们在不知道动作能否被系统理解的情况下使用手势同用户界面互动 — 例如在不支持触控的屏幕上使劲用手指点击、使用拖拽手势却发现图片纹丝不动、在洗漱池前摇手却发现水龙头是需要拧开的。毫无疑问,手势技术是一种可以给用户带来更高层次体验的交互技术,它能带给用户更好的“控制感”。但就像其他新科技一样,手势在带来这些让人愉悦的体验的同时也有其代价。不同的系统会有不同的规则,学习曲线会让用户抓狂;身体有缺陷的用户将会遇到难题(喜剧演员又有料可说了);用户永远不知道系统中还有哪些可用手势是自己未发现的,记忆一大堆手势命令让人头疼。尽管手势交互技术带来的是更大的潜力和能量,但是它也同样带来了更多的问题和挑战,更多让系统一团糟和用户疑惑的可能性。
无论如何,新的科技总能最终找到属于它们自己的位置,它们的价值需要被人们慢慢发掘出来并使用在合适的地方。但是本质上,这些交互技术都不能称自己为“自然的”,它们也并没有比对方“自然”到哪里去,因为规则是人制定的,新用户需要耗费相当的精力建立新的心智模型并学习怎样使用NUI系统。
最后,NUI真的能带来“自然”的交互体验吗?我觉得不行,不过它们在未来会很有用。
文章来源:nickinteractiondesign.com