智能应用开放平台

未来,开口即来

入门一.png

机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。对语音交互应用的开发者和设计师而言,则增加了一个新的挑战:如何打造以自然对话为基础的用户体验。


透过 语音交互设计指南,我们将帮助你的产品,打造更好的语音交互体验。语音设计指南将会包含:语音设计的核心原则、语音设计的方法与流程、语音设计的原则与实践。如果这些文档仍无法帮助你提升语音应用的体验,可以透过我们所提供的语音设计检查表,快速确认你的对话应用是否已经准备好让用户使用了。


了解对话的组成

设计良好体验的语音交互应用前,建议你先了解组成自然对话的几个基本要素。语音交互别于界面交互,需要在有限的对话内,分析用户的意图,并做出正确的回应。通过对使用者自然语言交互习惯的解构,可以发现一个成功的语音对话,会包含下面几个阶段与要素:

入门二.png

语音设计是基于从拟真人自然谈话的基础,因此在设计这类型的交互方式时,我们可以将语音交互拆解成上述的四个过程。如果我们再继续细部拆解人类的对话时,可以发现目前的语音交互技术,是基于上述的四个过程,和下列的几个关键行为模型所开发的。


一. 关键词

自然语言对话是由双方的一来一往对谈所组成的。而在轮流对话交谈的过程中,如果没有一个有效连接双方的关键实体词,很容易在轮流的对谈中失去同步。

入门三.png

上述就是一个对话失效的案例,在语音交互的产品中,由于缺少界面信息的辅助,用户进行交互的过程中,很容易因为不正确的关键词,导致语音交互失败,带来差劲的使用体验。更多关于建立语音应用中的关键词,请参考文档【实体】。


二. 上下文

在用户进行自然对话时,可能会因为表达事情的复杂度、时间、地点、效率等,产生具有脉络的对话过程,所有的对话元素会编织在一个连贯的线性对话中。因此在建立你的语音应用时,需要考虑使用者在使用时,是否会有上下文的对话情境。

入门四.png

对话是否能产生意义,除了需要正确的关键词帮助对话双方同步当前认知外,更多时候是取决于当前对话的上下文内容。因此开发者与设计者在建立语音应用时,需要提前进行一些可能的假设与推测,让使用者的语音交互不会被局限在狭隘的使用场景中。更多关于建立语音应用的上下文,请参考文档【上下文】。


三. 多变性

人是复杂且多变的生物,可能会因为当前的时间、环境,甚至因为正在进行的动作,会使用各种单词和方式来叙说同样的事情。因此对于开发者与设计师来说,语音设计中会面对大量多样化的语音输入命令。

入门五.png

语音交互过程中的输入内容,是无法像界面那样规范化的,语音交互的流程会显得更加直接。因此在创建语音应用时,除了规划好使用者可能进行的语境外,还需要收集使用者表达意图时,可能会说的语料。了解更多关于语料的作用,参考文档【意图】和【语料】。

在语音交互过程中,用户只能依靠有限的语音提示以及短期记忆来完成操作,因此语音设计最困难的事情,就是会遇到使用者大量无用的语音输入信息。因此除了编写使用者正常使用的对话内容外,还需要编写发生错误时的回复内容,引导用户脱离错误的使用情境。


对话的意图与阶段

在语音交互过程中,依照使用者所给予的关键信息是否充足,可能会有清晰意图、不明确意图、无意图等几种不同对话类别。为了创建良好用户体验的语音应用,当用户透过语音方式发起意图时,需要依据不同的意图类型,做出适当的对话设计。

对话交互过程中包含了聆听、处理、回复等几个主要的交互行为,用户在对话的不同阶段中,可能会对使用体验有不同的期待,因此不同阶段的语音交互行为以及内容编写,都需要帮助用户进行预期管理。开发者与设计师也需要注意,用户在进行语音交互的过程中,在不同阶段遇到错误时,该如何帮助用户脱离,回到正确的使用流程中。

了解更多关于对话意图类型与对话交互流程,可以帮助你更好的设计语音应用。建议你了解文档 【对话的意图与阶段】。


语音对话内容编写

自然语音是基于听觉系统所展开的交互方式,在人与人的对谈中,常会以口头快捷的方式,直观表达想说的内容。但在语音对话的内容编写中,由于自然语言理解技术的限制,仍不建议使用较为直白的方式来回复用户。一个好的语音对话内容设计,应该要在不遵循一个死板的对话脚本基础下,来帮助使用者完成她的意图。

除了设定配合声音形象的对话内容外,在设计语音对话的过程中,常常容易使用书面文字,来设计与用户对话的语音内容,编写对话内容时可能也会因不同的能力与编写者,产生较大的差异性,这些都会影响用户进行语音交互时的使用体验。

了解更多关于对话编写及错误引导的设计贴士,可以帮助你更好的管理用户预期。建议你了解文档【语音对话内容编写】。


语音交互设计实践

在阿里精灵开放平台创建属于自己的对话应用时,参考语音交互设计原则,可以更快速的帮助你在应用未上线之前,提升初期的语音交互用户体验。这些语音设计原则与 Do & Don’t,将能帮助你避开语音设计的误区,提升用户进行语音交互时的可用性。

在发布你的对话应用前,可以参考语音设计检查表,确认你所创建的对话应用是否有遗漏,或者可提升使用体验的部分,并且帮助你更快的通过我们的审核。

了解更多关于语音设计原则,可以帮助你更快且更高程度的提升语音交互可用性。建议你了解文档【语音交互设计实践】。