你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用微调自定义语音模型

借助自定义语音识别,你可以使用自定义模型进行实时语音转文本翻译、语音翻译和批量听录,从而提高应用程序的语音识别准确度。

小窍门

将自定义语音模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 门户中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源

使用自己的数据微调 Azure AI 语音基础模型,创建自定义语音模型。 你上传数据、测试和训练自定义模型、比较模型之间的准确度,以及将模型部署到自定义终结点。

本文介绍如何使用微调创建自定义语音模型。 有关自定义语音识别的详细信息,请参阅自定义语音识别概述文档。

小窍门

可以将自定义语音识别模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源

开始微调

自定义语音微调包括模型、训练和测试数据集以及部署终结点。 每个项目都特定于一个区域设置。 例如,可以针对美式英语进行微调。

Azure AI Foundry 门户中,可以微调一些 Azure AI 服务模型。 例如,可以微调某个模型来实现自定义语音识别。 每个自定义模型特定于某个区域设置。 例如,可以微调美国英语的模型。

  1. 转到 Azure AI Foundry 门户中的项目。 如果需要创建项目,请参阅创建 Azure AI Foundry 项目

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”>“+ 微调”

    选择微调 Azure AI 服务模型的页面的屏幕截图。

  4. 在向导中,为自定义语音选择“自定义语音”(语音转文本微调)。 然后选择下一步

  5. 输入微调作业的语言、名称和说明。 然后选择 创建

继续微调

转到 Azure AI 语音文档,了解如何继续微调自定义语音模型:

查看已微调的模型

微调后,可以从 “微调 ”页访问自定义语音模型和部署。

  1. 登录 Azure AI Foundry 门户

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”

    可在其中查看已微调的 AI 服务模型的页面的屏幕截图。

创建自定义语音项目后,可以从 “自定义语音 ”页访问自定义语音模型和部署。

  1. 登录 Speech Studio

  2. 选择要使用的订阅和语音资源。

    重要说明

    如果使用音频数据训练自定义模型,请在具有专用硬件的区域中选择服务资源来训练音频数据。 有关详细信息,请参阅区域表中的脚注。

  3. 选择“自定义语音”>“创建新项目”。

  4. 遵照向导中的说明创建项目。

按名称选择新项目,或选择“转到项目”。 然后,应在左侧面板中看到这些菜单项: 语音数据集训练自定义模型测试模型部署模型

获取 REST API 的项目 ID

将语音转文本 REST API 用于自定义语音时,需要将 project 属性设置为自定义语音项目的 ID。 需要设置 project 该属性,以便可以在 Azure AI Foundry 门户中管理微调。

重要说明

自定义语音的项目 ID 与 Azure AI Foundry 项目的 ID 不同。

选择或开始微调自定义语音模型后,可以在 URL 中找到项目 ID。

  1. 登录 Azure AI Foundry 门户

  2. 在左侧窗格中选择“微调”

  3. 选择“AI 服务微调”

  4. “模型名称 ”列中选择要检查的自定义模型。

  5. 检查浏览器中的 URL。 项目 ID 是 URL 的一部分。 例如,项目 ID 位于 00001111-aaaa-2222-bbbb-3333cccc4444 以下 URL 中:

    https://ai.azure.com/build/models/aiservices/speech/customspeech/00001111-aaaa-2222-bbbb-3333cccc4444/<REDACTED_FOR_BREVITY>
    

将语音转文本 REST API 用于自定义语音时,需要将 project 属性设置为自定义语音项目的 ID。 需要设置属性 project ,以便可以在 Speech Studio 中管理微调。

若要在 Speech Studio 中获取自定义语音项目的项目 ID,请执行以下作:

  1. 登录到 Speech Studio 并选择 “自定义语音 ”磁贴。

  2. 选择自定义语音项目。

  3. 检查浏览器中的 URL。 项目 ID 是 URL 的一部分。 例如,项目 ID 位于 00001111-aaaa-2222-bbbb-3333cccc4444 以下 URL 中:

    https://speech.microsoft.com/portal/<Your-Resource-ID>/customspeech/a0a0a0a0-bbbb-cccc-dddd-e1e1e1e1e1e1