生成 AI 模型维护策略

本文介绍 基础模型 API 按令牌付费基础模型 API 预配吞吐量基础模型微调 产品/服务的模型维护策略。

为了继续支持最先进的模型,Databricks 可能会更新支持的模型或停用这些产品/服务的旧模型。

模型退休政策

以下部分汇总了所指示功能产品/服务的停用策略。 有关当前退役模型和计划停用日期的列表,请参阅 退役模型

重要

适用于基础模型 API 的停用策略(按令牌付费)和基础模型微调产品/服务仅影响支持的聊天和完成模型。

基础模型 API(按令牌付费)

下表汇总了基础模型 API 按令牌付费的停用策略。

停用通知 过渡到停用 停用日期
Databricks 将通过以下步骤来通知客户已设置为停用的模型:
  • 在 Databricks 工作区的 “服务 ”页上,模型卡上会显示一条警告消息,指示模型计划停用。
  • 适用的文档会包含一则通知,指出相应模型计划停用并提供不再支持该模型的起始日期。
Databricks 将在 三个月内停用模型。 在此三个月的期间,客户可以:
  • 选择迁移到基础模型 API 预配的吞吐量终结点,以继续使用其生命周期结束日期的模型。
  • 迁移现有工作流以使用建议的替换模型。
该模型不再可供使用,并且已从产品中删除。 适用的文档会更新为建议使用替换模型。

基础模型 API(预配吞吐量)

下表汇总了基础模型 API 预配吞吐量的停用策略。

停用通知 过渡到停用 停用日期
Databricks 将通过以下步骤来通知客户已设置为停用的模型:
  • 对于为弃用的模型提供服务的终结点,Databricks 工作区中该终结点的详细信息页上会显示一条警告消息。 此消息指示模型计划停用和适用的停用日期。
  • 工具提示消息为工作负荷迁移提供建议的备用模型。
  • 适用的文档会包含一则通知,指出相应模型计划停用并提供不再支持该模型的起始日期。
Databricks 将在 六个月内停用模型。 在此六个月期间:
  • 客户可以使用已弃用的模型继续运行现有的预配吞吐量终结点,直到停用日期。
  • 未主动使用已弃用模型的客户无法为已弃用的模型创建新的预配吞吐量终结点或重启已停止的终结点。
该模型不再可供使用,并且已从产品中删除。
  • 使用已停用模型的所有终结点都转换为具有描述性消息的失败状态。 对这些终结点的任何请求都将失败。
  • 客户可以删除使用已停用模型的终结点,但无法重启它们。
  • 适用的文档会更新为建议使用替换模型。

基础模型微调

下表汇总了基础模型微调的停用策略。

停用通知 过渡到停用 停用日期
Databricks 将通过以下步骤来通知客户已设置为停用的模型:
  • 在“ 试验 ”选项卡中,基础模型微调的下拉菜单中会显示一条警告消息,指示该模型计划停用。
  • 适用的文档会包含一则通知,指出相应模型计划停用并提供不再支持该模型的起始日期。
Databricks 在 三个月内停用模型。 在这三个月的时间里,客户可以迁移现有工作流以使用推荐的替换模型。 该模型不再可供使用,并且已从产品中删除。 适用的文档会更新为建议使用替换模型。

模型更新

Databricks 可能会向按令牌付费的模型提供增量更新,以提供优化。 更新模型时,终结点 URL 保持不变,但响应对象中的模型 ID 会更改以反映更新的日期。 例如,如果在 2024 年 3 月 4 日将更新寄送到 meta-llama/Meta-Llama-3.3-70B,响应对象中的模型名称将更新为 meta-llama/Meta-Llama-3.3-70B-030424。 Databricks 维护可引用的更新的版本历史记录。

停用的模型

以下部分总结了基础模型微调、基础模型 API 按令牌付费和基础模型 API 预配的吞吐量产品/服务的当前和即将停用的模型停用情况。

基础模型 API 按令牌付费停用情况

下表显示了模型停用情况,它们的停用日期和以及基础模型 API 按标记付费服务工作负载的建议替换模型。 Databricks 建议在指定的停用日期之前迁移应用程序以使用替换模型。

重要

2024 年 12 月 11 日,Meta-Llama-3.3-70B-Instruct 已在基础模型 API 按令牌付费终结点中取代对 Meta-Llama-3.1-70B-Instruct 的支持。

模型 停用日期 推荐的替换模型
DBRX 指示 2025 年 4 月 30 日 Meta-Llama-4-Maverick
Mixtral-8x7B 指示 2025 年 4 月 30 日 Meta-Llama-4-Maverick
Meta-Llama-3.1-70B-Instruct 2024 年 12 月 11 日 Meta-Llama-4-Maverick
Meta-Llama-3-70B-Instruct 2024 年 7 月 23 日 Meta-Llama-4-Maverick
Meta-Llama-2-70B-Chat 2024 年 10 月 30 日 Meta-Llama-4-Maverick
MPT 7B 指示 2024 年 8 月 30 日 Meta-Llama-4-Maverick
MPT 30B 指示 2024 年 8 月 30 日 Meta-Llama-4-Maverick

如果需要对特定模型版本提供长期支持,Databricks 建议为服务工作负荷使用基础模型 API 预配的吞吐量

基础模型 API 预配的吞吐量停用

下表显示了模型系列停用、其停用日期和建议的替换模型,用于为工作负荷提供基础模型 API 预配的吞吐量。 Databricks 建议在指定的停用日期之前迁移应用程序以使用替换模型。

模型系列 停用日期 推荐的替换模型
元 Llama 3 70B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
元 Llama 3 8B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
Meta Llama 2 70B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
Meta Llama 2 13B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
元 Llama 2 7B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
DBRX 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
Mistral 8x7B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
Mixtral 7B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
MPT 30B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。
MPT 7B 2026 年 2 月 15 日 同一产品/服务上的可比模型,如 Llama 3.2、3.3 或 4 个类似大小的模型。

基础模型微调停用情况

下表显示了已停用的模型系列、其停用日期以及用于基础模型微调工作负荷的建议替换模型系列。 Databricks 建议在指定的停用日期之前迁移应用程序以使用替换模型。

模型系列 停用日期 推荐的替代型号系列
DBRX 2025 年 4 月 30 日 Llama-3.1-70B
Mixtral 2025 年 4 月 30 日 Llama-3.1-70B
Mistral 2025 年 4 月 30 日 Llama-3.1-8B
Meta-Llama-3.1-405B 2025 年 1 月 30 日 Llama-3.1-70B
Meta-Llama-3 2025 年 1 月 7 日 Meta-Llama-3.1
Meta-Llama-2 2025 年 1 月 7 日 Meta-Llama-3.1
Code Llama 2025 年 1 月 7 日 Meta-Llama-3.1