你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

合成语音的披露设计模式

重要

仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。

现在,你已确定文本到语音虚拟形象体验的正确披露级别,接下来可以探索潜在的设计模式。

概述

下面是可应用于合成语音体验的披露设计模式范围。 如果披露评估的结果为“高披露”,我们建议 明确披露,这意味着直接传达合成语音的来源。 隐式披露 包括提示和交互模式,这些模式有利于语音体验,无论所需的披露级别是高还是低。

披露模式范围的关系图。

类别 例子
显式披露模式
隐式披露模式

使用以下图表直接引用适用于合成语音的模式。 此图表中的一些其他条件也适用于你的方案:

如果你的合成语音体验… 建议 设计模式
需要高披露 提前至少使用一个显式模式和隐式提示来帮助用户生成关联。
需要低披露 披露可能最小或不必要的,但可能会受益于某些隐式模式。
参与度较高 为长期使用而构建,提供多个入口点,以在用户旅程中进行披露。 强烈建议进行入职培训。
包括儿童作为主要目标受众 将家长作为主要披露受众,并确保他们能够有效地向孩子传达披露。
包括盲人用户或视力不佳的用户作为主要目标受众 包括所有用户,并确保任何形式的视觉披露具有关联的可选文本或声音效果。 请遵循关于对比度和显示尺寸的无障碍标准。 使用听觉提示传达披露。
无屏幕、无设备或将语音用作主要或仅交互模式 使用听觉提示传达披露。
可能包含多个用户/听众(例如多个家庭中的私人助理) 请注意不同的用户背景和理解水平,并在用户旅程中提供多种信息披露机会。

显式披露

如果你的合成语音体验需要高披露,最好使用以下至少一种显式模式来明确说明合成性质。

透明介绍

在语音体验开始之前,通过完全透明地了解其语音的来源及其功能来引入数字助理。 使用此模式的最佳时机是在载入新用户或向返回的用户引入新功能时。 在介绍过程中实现隐式提示有助于用户形成有关数字代理合成性质的心理模型。

首次用户体验

首次运行体验过程中的透明介绍示意图。
在载入新用户时引入了合成语音。

建议

  • 描述语音是人为的(例如“数字”)
  • 描述代理能够做的事情
  • 显式声明语音的来源
  • 提供一个入口点,了解有关合成语音的详细信息

返回用户体验

如果用户跳过入门体验,请继续提供透明引导体验的入口点,直到用户首次激活语音功能。

返回用户体验过程中的透明介绍示意图。
为合成语音体验提供一致的入口点。 当用户在用户旅程中的任何时间点首次触发语音时,允许其返回载入体验。

言语透明介绍

通过语音提示陈述数字助理的语音来源,足以显式实现披露。 此模式最适合高披露方案,其中语音是唯一可用的交互模式。

口述透明介绍示意图。
在用户体验中,当需要引入或定位某个人的声音时,请使用透明的介绍方式。

第一人称口述透明介绍示意图。
为了提高透明度,语音演员可以用第一人称披露合成语音的来源。

显式署名

如果用户将与音频播放器或交互式组件交互以触发语音,请使用此模式。

新闻媒体方案中的显式署名示意图。
显式署名是指说明语音来源

建议

  • 提供入口点,了解有关合成语音的详细信息

自定义和校准

让用户可以控制数字助理的答复方式(即语音的听感)。 当用户根据自己的条件与系统交互,并考虑到特定目标时,根据定义,他们已经明白这不是一个真实的人。

用户控件

提供对合成语音体验产生有意义且明显影响的选择。

用户偏好的图示。
用户首选项允许用户自定义和改进其体验。

建议

  • 允许用户自定义语音(例如,选择语言和语音类型)
  • 为用户提供一种方法来教系统响应其独特的语音(例如语音校准)
  • 针对用户生成的或上下文交互进行优化(例如提醒)

角色自定义

提供自定义数字助理语音的方法。 如果语音基于名人或广为人知的人,请考虑在用户预览语音时同时使用视觉和口语介绍。

语音自定义关系图。
提供从一组语音中进行选择的能力有助于传达人工性质。

建议

  • 允许用户预览每个语音的声音
  • 为每个语音使用真实的介绍
  • 提供入口点,了解有关合成语音的详细信息

向家长披露

除了遵守 COPPA 法规外,如果你的主要目标受众是年幼儿童,并且你的暴露水平很高,则向家长提供披露。 对于敏感用途,请考虑在成人认可使用合成语音后获取体验。 鼓励父母向孩子传达信息。

向家长披露的示意图。
针对父母优化的透明介绍可确保成年人在孩子与语音交互之前了解语音的合成性。

建议

  • 将父母作为主要受众进行信息披露
  • 鼓励父母向孩子传达披露信息
  • 提供入口点,了解有关合成语音的详细信息
  • 通过向父母提出一个简单的“验证”问题来控管体验,以确保他们已阅读披露内容。

提供机会以了解有关语音的制作方式的详细信息

为页面、弹出窗口或外部网站提供上下文相关的入口点,以提供有关合成语音技术的详细信息。 例如,可以展示一个链接,让用户在用户引导过程中了解更多信息,或者当用户在对话期间请求更多信息时。

入门点图示,了解详细信息。
提供有关合成语音的详细信息的入口点示例。

用户请求有关合成语音的详细信息后,主要目标是让他们了解合成语音的来源,并透明地了解技术。

一个关于向用户提供更多合成语音信息的图表。
可以在外部帮助站点中提供更多信息。

建议

  • 简化复杂的概念,避免使用法律和技术行话
  • 请勿将此内容埋在隐私和使用条款声明中
  • 保持内容简洁,并在可用时使用图像

隐式披露

一致性是在整个用户旅程中隐式实现披露的关键。 跨设备和交互模式一致地使用视觉和听觉提示有助于在隐式模式和显式披露之间建立关联。

隐式提示的一致性关系图。

隐式提示和反馈

可通过不同的方式表达拟人形象,从代理的实际视觉表示形式到语音、声音、光模式、弹跳形状甚至设备振动。 在定义角色时,利用隐式提示和反馈模式,而不是瞄准非常类似于人类的虚拟形象。 这是最大程度地减少对更显式披露的需求的一种方法。

视觉提示和反馈的关系图。
这些提示有助于将代理拟人化,但不会使其过于像人。 在一段时间内一致使用时,它们还可以自行成为有效的披露机制。

在合并以下类型的提示时,请考虑体验的不同交互模式:

类别 例子
视觉提示
  • 虚拟形象
  • 响应式实时提示(例如动画)
  • 非屏幕提示(例如设备上的灯光和模式)
听觉提示
  • 索尼康(例如,简短独特的声音,一系列音乐音符)
触觉提示
  • 振动

功能披露

可通过对数字助理能够执行的操作设置准确期望来隐式实现披露。 提供示例命令,以便用户可以了解如何与数字助手交互,并提供上下文帮助,以便在体验的早期阶段了解有关合成语音的详细信息。

可创建的默认对话响应的示例示意图。

对话透明度

当对话落入意外路径时,请考虑创建有助于重置预期、增强透明度并引导用户成功路径的默认响应。 也有机会在对话中使用显式披露。

处理意外路径的示意图。
当代理被问任务外或“私人”问题时,就可以提醒用户代理的合成性质并引导用户适当与之交流或将用户重新导向真人。

处理任务外问题的示意图。

何时披露

在整个用户旅程中,有许多披露机会。 为第一次使用、第二次使用、第 n 次使用设计,并接受“失败”的时刻以突出透明度,例如,当系统出错或用户发现代理功能的限制时。

用户旅程中披露机会的示意图。
标准数字助理用户旅程的示例,其中突出显示了各种披露机会。

预先披露

披露的最佳时机是首次与合成语音进行交互时。  在个人语音助手场景中,这通常发生在入门指导期间,或用户首次虚拟开箱体验时。 在其他方案中,可能是合成语音首次读取网站上的内容或用户首次与虚拟字符交互时。

应要求

在用户旅程中的任何时候,用户在请求时都应能够轻松访问其他信息、控制首选项,并接收透明的沟通。

持续披露

使用可持续增强用户体验的隐式设计模式。

系统失败时

使用披露作为从容应对故障的机会。

其他资源

另请参阅