你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

合成语音的披露设计模式

2025-09-29

重要

仅为方便起见，提供非英语翻译。请参阅 EN-US 版本以获取最终版本的此文档。

现在，你已确定文本到语音虚拟形象体验的正确披露级别，接下来可以探索潜在的设计模式。

概述

下面是可应用于合成语音体验的披露设计模式范围。如果披露评估的结果为“高披露”，我们建议明确披露，这意味着直接传达合成语音的来源。隐式披露包括提示和交互模式，这些模式有利于语音体验，无论所需的披露级别是高还是低。

披露模式范围的关系图。

类别	例子
显式披露模式	透明简介口头清晰介绍显式署名自定义和校准家长披露提供机会以了解有关语音的制作方式的详细信息
隐式披露模式	功能披露隐式提示和反馈对话透明度

使用以下图表直接引用适用于合成语音的模式。此图表中的一些其他条件也适用于你的方案：

如果你的合成语音体验…	建议	设计模式
需要高披露	提前至少使用一个显式模式和隐式提示来帮助用户生成关联。	显式披露隐式披露
需要低披露	披露可能最小或不必要的，但可能会受益于某些隐式模式。	功能披露对话透明度
参与度较高	为长期使用而构建，提供多个入口点，以在用户旅程中进行披露。强烈建议进行入职培训。	透明简介自定义和校准功能披露
包括儿童作为主要目标受众	将家长作为主要披露受众，并确保他们能够有效地向孩子传达披露。	家长披露口头清晰介绍隐式披露对话透明度
包括盲人用户或视力不佳的用户作为主要目标受众	包括所有用户，并确保任何形式的视觉披露具有关联的可选文本或声音效果。请遵循关于对比度和显示尺寸的无障碍标准。使用听觉提示传达披露。	口头清晰介绍听觉提示触觉提示对话透明度辅助功能标准
无屏幕、无设备或将语音用作主要或仅交互模式	使用听觉提示传达披露。	口头清晰介绍听觉提示
可能包含多个用户/听众（例如多个家庭中的私人助理）	请注意不同的用户背景和理解水平，并在用户旅程中提供多种信息披露机会。	透明简介（返回用户）提供机会以了解有关语音的制作方式的详细信息对话透明度

显式披露

如果你的合成语音体验需要高披露，最好使用以下至少一种显式模式来明确说明合成性质。

透明介绍

在语音体验开始之前，通过完全透明地了解其语音的来源及其功能来引入数字助理。使用此模式的最佳时机是在载入新用户或向返回的用户引入新功能时。在介绍过程中实现隐式提示有助于用户形成有关数字代理合成性质的心理模型。

首次用户体验

首次运行体验过程中的透明介绍示意图。
在载入新用户时引入了合成语音。

建议

描述语音是人为的（例如“数字”）
描述代理能够做的事情
显式声明语音的来源
提供一个入口点，了解有关合成语音的详细信息

返回用户体验

如果用户跳过入门体验，请继续提供透明引导体验的入口点，直到用户首次激活语音功能。

返回用户体验过程中的透明介绍示意图。
为合成语音体验提供一致的入口点。当用户在用户旅程中的任何时间点首次触发语音时，允许其返回载入体验。

言语透明介绍

通过语音提示陈述数字助理的语音来源，足以显式实现披露。此模式最适合高披露方案，其中语音是唯一可用的交互模式。

口述透明介绍示意图。
在用户体验中，当需要引入或定位某个人的声音时，请使用透明的介绍方式。

第一人称口述透明介绍示意图。
为了提高透明度，语音演员可以用第一人称披露合成语音的来源。

显式署名

如果用户将与音频播放器或交互式组件交互以触发语音，请使用此模式。

新闻媒体方案中的显式署名示意图。
显式署名是指说明语音来源。

建议

提供入口点，了解有关合成语音的详细信息

自定义和校准

让用户可以控制数字助理的答复方式（即语音的听感）。当用户根据自己的条件与系统交互，并考虑到特定目标时，根据定义，他们已经明白这不是一个真实的人。

用户控件

提供对合成语音体验产生有意义且明显影响的选择。

用户偏好的图示。
用户首选项允许用户自定义和改进其体验。

建议

允许用户自定义语音（例如，选择语言和语音类型）
为用户提供一种方法来教系统响应其独特的语音（例如语音校准）
针对用户生成的或上下文交互进行优化（例如提醒）

角色自定义

提供自定义数字助理语音的方法。如果语音基于名人或广为人知的人，请考虑在用户预览语音时同时使用视觉和口语介绍。

语音自定义关系图。
提供从一组语音中进行选择的能力有助于传达人工性质。

建议

允许用户预览每个语音的声音
为每个语音使用真实的介绍
提供入口点，了解有关合成语音的详细信息

向家长披露

除了遵守 COPPA 法规外，如果你的主要目标受众是年幼儿童，并且你的暴露水平很高，则向家长提供披露。对于敏感用途，请考虑在成人认可使用合成语音后获取体验。鼓励父母向孩子传达信息。

向家长披露的示意图。
针对父母优化的透明介绍可确保成年人在孩子与语音交互之前了解语音的合成性。

建议

将父母作为主要受众进行信息披露
鼓励父母向孩子传达披露信息
提供入口点，了解有关合成语音的详细信息
通过向父母提出一个简单的“验证”问题来控管体验，以确保他们已阅读披露内容。

提供机会以了解有关语音的制作方式的详细信息

为页面、弹出窗口或外部网站提供上下文相关的入口点，以提供有关合成语音技术的详细信息。例如，可以展示一个链接，让用户在用户引导过程中了解更多信息，或者当用户在对话期间请求更多信息时。

入门点图示，了解详细信息。
提供有关合成语音的详细信息的入口点示例。

用户请求有关合成语音的详细信息后，主要目标是让他们了解合成语音的来源，并透明地了解技术。

一个关于向用户提供更多合成语音信息的图表。
可以在外部帮助站点中提供更多信息。

建议

简化复杂的概念，避免使用法律和技术行话
请勿将此内容埋在隐私和使用条款声明中
保持内容简洁，并在可用时使用图像

隐式披露

一致性是在整个用户旅程中隐式实现披露的关键。跨设备和交互模式一致地使用视觉和听觉提示有助于在隐式模式和显式披露之间建立关联。

隐式提示的一致性关系图。

隐式提示和反馈

可通过不同的方式表达拟人形象，从代理的实际视觉表示形式到语音、声音、光模式、弹跳形状甚至设备振动。在定义角色时，利用隐式提示和反馈模式，而不是瞄准非常类似于人类的虚拟形象。这是最大程度地减少对更显式披露的需求的一种方法。

视觉提示和反馈的关系图。
这些提示有助于将代理拟人化，但不会使其过于像人。在一段时间内一致使用时，它们还可以自行成为有效的披露机制。

在合并以下类型的提示时，请考虑体验的不同交互模式：

类别	例子
视觉提示	虚拟形象响应式实时提示（例如动画）非屏幕提示（例如设备上的灯光和模式）
听觉提示	索尼康（例如，简短独特的声音，一系列音乐音符）
触觉提示	振动