你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
注释
另有一篇以中心为重点的配额文章可供参考:管理和增加中心资源的配额。
配额使你可以灵活、主动地管理订阅中不同部署之间速率限制的分配。 本文逐步讲解如何管理 Azure AI Foundry 模型(Foundry 项目)的配额。 中心级配额指南已移至 hub-quota.md。
Azure 使用限制和配额来防止由于欺诈导致的预算超支,并遵循 Azure 容量约束。 这也是控制管理员成本的好方法。 对于生产工作负载,请在缩放时考虑这些限制。
在本文中,你将了解:
- 查看配额和限制
- 请求增加配额和限制
Azure AI Foundry 共享配额
Azure AI Foundry 提供了一个共享配额池,可供不同区域的不同用户同时使用。 根据可用性,用户可以暂时从共享池访问配额,并使用配额在有限的时间内执行测试。 具体持续时间取决于用例。 如果暂时使用配额池中的配额,则无需为短期提高配额而提交支持票证,也无需等待配额请求获得批准,即可继续处理工作负载。
可以使用共享配额池从模型目录测试 Foundry 模型的推理。 应仅将共享配额用于创建临时测试终结点,而不要用于创建生产终结点。 对于生产中的终结点,应请求专用配额。 共享配额的计费基于使用情况。
在 Azure AI Foundry 门户中查看和请求配额
使用配额管理同一订阅中多个 Azure AI Foundry 项目之间的模型配额分配。
在 Azure AI Foundry 门户中,从左侧菜单底部选择 管理中心 。
从左侧菜单中选择 “配额 ”以打开配额视图,可在其中查看特定 Azure 区域中模型的配额。
若要从配额视图中请求配额,请展开部署列中列出的任何分组,直到看到模型部署及其相关信息。
- 使用“显示所有配额”切换开关来显示所有配额或仅显示当前分配的配额。
- 使用“分组依据”下拉列表按“配额类型、区域和模型”、“配额类型、模型和区域”或“无”对列表进行分组。 “无”选项显示模型部署的平面列表,而不是嵌套列表。
- 在给定模型部署的行项上,选择“配额分配”列中的铅笔图标以编辑模型部署的配额分配。
- 在“请求配额”列中选择“请求配额”,以请求标准部署类型的配额增加。
- 使用页面一侧的图表查看有关配额使用情况的更多详细信息。 图表是交互式的;将鼠标悬停在图表的某一部分上会显示更多信息,选择图表会筛选模型列表。 选择图表图例会筛选图表中显示的数据。
- 使用 “预配吞吐量 ”链接查看有关预配模型的信息,包括可用于估算工作负荷所需的 PTU 数的 容量计算器 。