你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

自定义语音识别模型生命周期

将自定义语音识别模型部署到自定义终结点后,可以使用一段时间。 但是当新基本模型可用时,旧模型将过期。 你必须定期重新创建并训练基于最新基础模型的自定义模型,充分利用提高的准确度和质量。

以下是一些与模型生命周期相关的关键术语:

  • 训练:使用基础模型,并使用文本数据和/或音频数据,根据你的领域/场景对其进行自定义。 在某些上下文(如 REST API 属性)中,训练也称为适应
  • 听录:使用模型并执行语音识别(将音频解码为文本)。
  • 终结点:基础模型或只有你可以访问的自定义模型的特定部署。

注意

F0 语音资源使用的终结点在 7 天后删除。

过期时间线

下面是模型适应和听录到期的时间线:

  • 训练会在 Microsoft 创建基础模型时所在的季度结束后提供,时间为期一年。
  • 使用基础模型的听录会在 Microsoft 创建基础模型时所在的季度结束后提供,时间为期两年。
  • 使用自定义模型的听录会在你创建自定义模型时所在的季度结束后提供,时间为期两年。

在此上下文中,季度的结束日期为 1 月 15 日、4 月 15 日、7 月 15 日和 10 月 15 日。

模型到期时需要执行的操作

自定义模型或基本模型到期时,它不再可用于听录。 可以在不停机的情况下更改自定义语音识别终结点使用的模型。

听录路由 已到期模型结果 建议
自定义终结点 语音识别请求回退到同一区域设置的最新基础模型。 你会得到结果,但识别可能无法准确听录域数据。 根据部署自定义语音模型指南中所述,更新终结点的模型。
批量听录 对已过期模型的批量听录请求失败,出现 4xx 错误。 在每个 听录 - 提交 REST API 请求正文中,将 model 属性设置为基本模型或未过期的自定义模型。 否则,请不要添加 model 属性,以始终使用最新的基本模型。

获取基本模型到期日期

小窍门

将自定义语音模型从 Speech Studio 引入 Azure AI Foundry 门户。 在 Azure AI Foundry 门户中,可以通过连接到现有语音资源来继续之前的操作。 有关连接到现有语音资源的详细信息,请参阅连接到现有语音资源

创建自定义模型时会显示可以将基本模型用于训练的最后日期。 有关详细信息,请参阅训练自定义语音识别模型

按照以下说明获取基本模型的听录到期日期:

  1. 登录 Azure AI Foundry 门户
  2. 在左侧窗格中选择“微调”
  3. 选择“AI 服务微调”
  4. “模型名称 ”列中选择要检查的自定义模型。
  5. 选择“ 部署模型”。
  6. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。
  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“部署模型”。

  3. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。

    显示听录到期日期的“部署模型”页的屏幕截图。

在继续作之前,请确保已安装并配置 语音 CLI

若要获取基本模型的训练和听录到期日期,请使用 spx csr model status 命令。 根据以下说明构造请求参数:

  • url 属性设置为要获取的基本模型的 URI。 可以运行 spx csr list --base 命令来获取各个区域设置的可用基础模型。

下面是示例语音 CLI 命令,用于获取基本模型的训练和听录到期日期:

spx csr model status --api-version v3.2 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/aaaabbbb-0000-cccc-1111-dddd2222eeee

重要

必须设置 --api-version v3.2。 语音 CLI 使用 REST API,但尚不支持晚于 v3.2版本。

在响应中,记下 adaptationDateTime 属性中的日期。 此属性是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime 属性中的日期。 此日期是可以将基本模型用于听录的最后日期。

应接收以下格式的响应正文:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/bbbbcccc-1111-dddd-2222-eeee3333ffff",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

对于模型的语音 CLI 帮助,请运行以下命令:

spx help csr model

要获取基本模型的训练和听录到期日期,请使用语音转文本 REST APIModels_GetBaseModel 操作。 可以发出 Models_ListBaseModels 请求,以获取所有区域设置的可用基本模型。

使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 BaseModelId 替换为模型 ID,将 YourSpeechResoureKey 替换为语音资源密钥,将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSpeechResoureKey"

在响应中,记下 adaptationDateTime 属性中的日期。 此日期是可以使用基本模型进行训练的最后日期。 也记下 transcriptionDateTime 属性中的日期。 此日期是可以将基本模型用于听录的最后日期。

应接收以下格式的响应正文:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/bbbbcccc-1111-dddd-2222-eeee3333ffff",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

获取自定义模型到期日期

按照以下说明获取自定义模型的听录到期日期:

  1. 登录 Azure AI Foundry 门户
  2. 在左侧窗格中选择“微调”
  3. 选择“AI 服务微调”
  4. “模型名称 ”列中选择要检查的自定义模型。
  5. 选择“ 部署模型”。
  6. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。

按照以下说明获取自定义模型的听录到期日期:

  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“训练自定义模型”。

  3. 自定义模型的到期日期显示在“到期”列中。 此日期是可以将自定义模型用于听录的最后日期。 基础模型不会显示在“训练自定义模型”页上

    屏幕截图显示听录到期日期的“训练自定义模型”页。

也可按照以下说明获取自定义模型的听录到期日期:

  1. 登录 Speech Studio

  2. 选择“自定义语音识别”> 你的项目名称 >“部署模型”。

  3. 模型的到期日期显示在“到期”列中。 此日期是可以将模型用于听录的最后日期。

    显示听录到期日期的“部署模型”页的屏幕截图。

在继续作之前,请确保已安装并配置 语音 CLI

若要获取自定义模型的听录到期日期,请使用 spx csr model status 命令。 根据以下说明构造请求参数:

  • url 属性设置为要获取的模型的 URI。 将 YourModelId 替换为模型 ID,将 YourServiceRegion 替换为语音资源区域。

下面是示例语音 CLI 命令,用于获取自定义模型的听录到期日期:

spx csr model status --api-version v3.2 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

重要

必须设置 --api-version v3.2。 语音 CLI 使用 REST API,但尚不支持晚于 v3.2版本。

在响应中,记下 transcriptionDateTime 属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime 属性不适用,因为自定义模型不可用于训练其他自定义模型。

应接收以下格式的响应正文:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/ccccdddd-2222-eeee-3333-ffff4444aaaa",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/bbbbcccc-1111-dddd-2222-eeee3333ffff"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/ddddeeee-3333-ffff-4444-aaaa5555bbbb"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

对于模型的语音 CLI 帮助,请运行以下命令:

spx help csr model

要获取自定义模型的听录到期日期,请使用语音转文本 REST APIModels_GetCustomModel 操作。

使用模型 URI 发出 HTTP GET 请求,如以下示例所示。 将 YourModelId 替换为模型 ID,将 YourSpeechResoureKey 替换为语音资源密钥,将 YourServiceRegion 替换为语音资源区域。

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSpeechResoureKey"

在响应中,记下 transcriptionDateTime 属性中的日期。 此日期是可以将自定义模型用于听录的最后日期。 adaptationDateTime 属性不适用,因为自定义模型不可用于训练其他自定义模型。

应接收以下格式的响应正文:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/ccccdddd-2222-eeee-3333-ffff4444aaaa",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/bbbbcccc-1111-dddd-2222-eeee3333ffff"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/ddddeeee-3333-ffff-4444-aaaa5555bbbb"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}