你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
借助自定义语音识别,你可以使用自定义模型进行实时语音转文本翻译、语音翻译和批量听录,从而提高应用程序的语音识别准确度。
小窍门
将自定义语音模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 门户中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源。
使用自己的数据微调 Azure AI 语音基础模型,创建自定义语音模型。 你上传数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。
本文介绍如何使用微调创建自定义语音模型。 有关自定义语音识别的详细信息,请参阅自定义语音识别概述文档。
小窍门
可以将自定义语音识别模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源。
开始微调
自定义语音微调包括模型、训练和测试数据集以及部署终结点。 每个项目都特定于一个区域设置。 例如,可以针对美式英语进行微调。
在 Azure AI Foundry 门户中,可以微调一些 Azure AI 服务模型。 例如,可以微调某个模型来实现自定义语音识别。 每个自定义模型特定于某个区域设置。 例如,可以微调美国英语的模型。
转到 Azure AI Foundry 门户中的项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目。
在左侧窗格中选择“微调”。
选择“AI 服务微调”>“+ 微调”。
在向导中,为自定义语音选择“自定义语音”(语音转文本微调)。 然后选择下一步。
输入微调作业的语言、名称和说明。 然后选择 创建。
继续微调
转到 Azure AI 语音文档,了解如何继续微调自定义语音模型:
查看已微调的模型
微调后,可以从 “微调 ”页访问自定义语音模型和部署。
在左侧窗格中选择“微调”。
选择“AI 服务微调”。
创建自定义语音项目后,可以从 “自定义语音 ”页访问自定义语音模型和部署。
登录 Speech Studio。
选择要使用的订阅和语音资源。
重要说明
如果使用音频数据训练自定义模型,请在具有专用硬件的区域中选择服务资源来训练音频数据。 有关详细信息,请参阅区域表中的脚注。
选择“自定义语音”>“创建新项目”。
遵照向导中的说明创建项目。
按名称选择新项目,或选择“转到项目”。 然后,应在左侧面板中看到这些菜单项: 语音数据集、 训练自定义模型、 测试模型和 部署模型。
获取 REST API 的项目 ID
将语音转文本 REST API 用于自定义语音时,需要将 project 属性设置为自定义语音项目的 ID。 需要设置 project 该属性,以便可以在 Azure AI Foundry 门户中管理微调。
重要说明
自定义语音的项目 ID 与 Azure AI Foundry 项目的 ID 不同。
选择或开始微调自定义语音模型后,可以在 URL 中找到项目 ID。
在左侧窗格中选择“微调”。
选择“AI 服务微调”。
从 “模型名称 ”列中选择要检查的自定义模型。
检查浏览器中的 URL。 项目 ID 是 URL 的一部分。 例如,项目 ID 位于
00001111-aaaa-2222-bbbb-3333cccc4444以下 URL 中:https://ai.azure.com/build/models/aiservices/speech/customspeech/00001111-aaaa-2222-bbbb-3333cccc4444/<REDACTED_FOR_BREVITY>
将语音转文本 REST API 用于自定义语音时,需要将 project 属性设置为自定义语音项目的 ID。 需要设置属性 project ,以便可以在 Speech Studio 中管理微调。
若要在 Speech Studio 中获取自定义语音项目的项目 ID,请执行以下作:
登录到 Speech Studio 并选择 “自定义语音 ”磁贴。
选择自定义语音项目。
检查浏览器中的 URL。 项目 ID 是 URL 的一部分。 例如,项目 ID 位于
00001111-aaaa-2222-bbbb-3333cccc4444以下 URL 中:https://speech.microsoft.com/portal/<Your-Resource-ID>/customspeech/a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1

