Deployments - Create Or Update
更新与认知服务帐户关联的指定部署的状态。
PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.CognitiveServices/accounts/{accountName}/deployments/{deploymentName}?api-version=2024-10-01
URI 参数
| 名称 | 在 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
account
|
path | True |
string minLength: 2maxLength: 64 pattern: ^[a-zA-Z0-9][a-zA-Z0-9_.-]*$ |
认知服务帐户的名称。 |
|
deployment
|
path | True |
string |
与认知服务帐户关联的部署的名称 |
|
resource
|
path | True |
string minLength: 1maxLength: 90 |
资源组的名称。 名称不区分大小写。 |
|
subscription
|
path | True |
string minLength: 1 |
目标订阅的 ID。 |
|
api-version
|
query | True |
string minLength: 1 |
用于此作的 API 版本。 |
请求正文
| 名称 | 类型 | 说明 |
|---|---|---|
| properties |
认知服务帐户部署的属性。 |
|
| sku |
表示 SKU 的资源模型定义 |
|
| tags |
object |
资源标记。 |
响应
| 名称 | 类型 | 说明 |
|---|---|---|
| 200 OK |
成功创建/更新部署。 |
|
| 201 Created |
成功创建部署。 |
|
| Other Status Codes |
描述作失败的原因的错误响应。 |
示例
PutDeployment
示例请求
PUT https://management.azure.com/subscriptions/subscriptionId/resourceGroups/resourceGroupName/providers/Microsoft.CognitiveServices/accounts/accountName/deployments/deploymentName?api-version=2024-10-01
{
"sku": {
"name": "Standard",
"capacity": 1
},
"properties": {
"model": {
"format": "OpenAI",
"name": "ada",
"version": "1"
}
}
}
示例响应
{
"id": "/subscriptions/subscriptionId/resourceGroups/resourceGroupName/providers/Microsoft.CognitiveServices/accounts/accountName/deployments/deploymentName",
"name": "deploymentName",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"sku": {
"name": "Standard",
"capacity": 1
},
"properties": {
"model": {
"format": "OpenAI",
"name": "ada",
"version": "1"
},
"provisioningState": "Succeeded"
}
}
{
"id": "/subscriptions/subscriptionId/resourceGroups/resourceGroupName/providers/Microsoft.CognitiveServices/accounts/accountName/deployments/deploymentName",
"name": "deploymentName",
"type": "Microsoft.CognitiveServices/accounts/deployments",
"sku": {
"name": "Standard",
"capacity": 1
},
"properties": {
"model": {
"format": "OpenAI",
"name": "ada",
"version": "1"
},
"provisioningState": "Accepted"
}
}
定义
| 名称 | 说明 |
|---|---|
|
Call |
调用速率限制认知服务帐户。 |
|
created |
创建资源的标识的类型。 |
| Deployment |
认知服务帐户部署。 |
|
Deployment |
仅供内部使用。 |
|
Deployment |
认知服务帐户部署模型的属性。 |
|
Deployment |
部署模型版本升级选项。 |
|
Deployment |
认知服务帐户部署的属性。 |
|
Deployment |
获取调用作时资源的状态。 |
|
Deployment |
认知服务帐户部署模型的属性。 (已弃用,请改用 Deployment.sku。 |
|
Deployment |
部署缩放类型。 |
|
Error |
资源管理错误附加信息。 |
|
Error |
错误详细信息。 |
|
Error |
错误响应 |
|
Request |
|
| Sku |
表示 SKU 的资源模型定义 |
|
Sku |
如果服务具有多个层,但在 PUT 上不需要,则需要资源提供程序实现此字段。 |
|
system |
与创建和上次修改资源相关的元数据。 |
|
Throttling |
CallRateLimit
调用速率限制认知服务帐户。
| 名称 | 类型 | 说明 |
|---|---|---|
| count |
number |
呼叫速率限制的计数值。 |
| renewalPeriod |
number |
呼叫速率限制的续订期(以秒为单位)。 |
| rules |
createdByType
创建资源的标识的类型。
| 值 | 说明 |
|---|---|
| User | |
| Application | |
| ManagedIdentity | |
| Key |
Deployment
认知服务帐户部署。
| 名称 | 类型 | 说明 |
|---|---|---|
| etag |
string |
资源 Etag。 |
| id |
string |
资源的完全限定资源 ID。 示例 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName} |
| name |
string |
资源的名称 |
| properties |
认知服务帐户部署的属性。 |
|
| sku |
表示 SKU 的资源模型定义 |
|
| systemData |
与创建和上次修改资源相关的元数据。 |
|
| tags |
object |
资源标记。 |
| type |
string |
资源的类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts” |
DeploymentCapacitySettings
仅供内部使用。
| 名称 | 类型 | 说明 |
|---|---|---|
| designatedCapacity |
integer (int32) minimum: 0 |
指定的容量。 |
| priority |
integer (int32) minimum: 0 |
此容量设置的优先级。 |
DeploymentModel
认知服务帐户部署模型的属性。
| 名称 | 类型 | 说明 |
|---|---|---|
| callRateLimit |
调用速率限制认知服务帐户。 |
|
| format |
string |
部署模型格式。 |
| name |
string |
部署模型名称。 |
| publisher |
string |
部署模型发布者。 |
| source |
string |
自选。 部署模型源 ARM 资源 ID。 |
| sourceAccount |
string (arm-id) |
自选。 模型的源,另一个 Microsoft.CognitiveServices 帐户 ARM 资源 ID。 |
| version |
string |
自选。 部署模型版本。 如果未指定版本,则会分配默认版本。 对于不同的模型,默认版本不同,当有可用于模型的新版本时,可能会更改。 可以从列表模型 API 找到模型的默认版本。 |
DeploymentModelVersionUpgradeOption
部署模型版本升级选项。
| 值 | 说明 |
|---|---|
| OnceNewDefaultVersionAvailable | |
| OnceCurrentVersionExpired | |
| NoAutoUpgrade |
DeploymentProperties
认知服务帐户部署的属性。
| 名称 | 类型 | 说明 |
|---|---|---|
| callRateLimit |
调用速率限制认知服务帐户。 |
|
| capabilities |
object |
功能。 |
| capacitySettings |
仅供内部使用。 |
|
| currentCapacity |
integer (int32) |
当前容量。 |
| dynamicThrottlingEnabled |
boolean |
如果启用了动态限制。 |
| model |
认知服务帐户部署模型的属性。 |
|
| parentDeploymentName |
string |
父部署的名称。 |
| provisioningState |
获取调用作时资源的状态。 |
|
| raiPolicyName |
string |
RAI 策略的名称。 |
| rateLimits | ||
| scaleSettings |
认知服务帐户部署模型的属性。 (已弃用,请改用 Deployment.sku。 |
|
| versionUpgradeOption |
部署模型版本升级选项。 |
DeploymentProvisioningState
获取调用作时资源的状态。
| 值 | 说明 |
|---|---|
| Accepted | |
| Creating | |
| Deleting | |
| Moving | |
| Failed | |
| Succeeded | |
| Disabled | |
| Canceled |
DeploymentScaleSettings
认知服务帐户部署模型的属性。 (已弃用,请改用 Deployment.sku。
| 名称 | 类型 | 说明 |
|---|---|---|
| activeCapacity |
integer (int32) |
部署活动容量。 如果客户最近更新 |
| capacity |
integer (int32) |
部署容量。 |
| scaleType |
部署缩放类型。 |
DeploymentScaleType
部署缩放类型。
| 值 | 说明 |
|---|---|
| Standard | |
| Manual |
ErrorAdditionalInfo
资源管理错误附加信息。
| 名称 | 类型 | 说明 |
|---|---|---|
| info |
object |
其他信息。 |
| type |
string |
其他信息类型。 |
ErrorDetail
错误详细信息。
| 名称 | 类型 | 说明 |
|---|---|---|
| additionalInfo |
错误附加信息。 |
|
| code |
string |
错误代码。 |
| details |
错误详细信息。 |
|
| message |
string |
错误消息。 |
| target |
string |
错误目标。 |
ErrorResponse
错误响应
| 名称 | 类型 | 说明 |
|---|---|---|
| error |
错误对象。 |
RequestMatchPattern
| 名称 | 类型 | 说明 |
|---|---|---|
| method |
string |
|
| path |
string |
Sku
表示 SKU 的资源模型定义
| 名称 | 类型 | 说明 |
|---|---|---|
| capacity |
integer (int32) |
如果 SKU 支持横向扩展/缩减,则应包含容量整数。 如果资源无法横向扩展/缩小,则可能会省略此范围。 |
| family |
string |
如果服务具有不同代的硬件(对于同一 SKU,则可以在此处捕获)。 |
| name |
string |
SKU 的名称。 例 - P3。 它通常是字母+数字代码 |
| size |
string |
SKU 大小。 当名称字段是层和其他一些值的组合时,这将是独立的代码。 |
| tier |
如果服务具有多个层,但在 PUT 上不需要,则需要资源提供程序实现此字段。 |
SkuTier
如果服务具有多个层,但在 PUT 上不需要,则需要资源提供程序实现此字段。
| 值 | 说明 |
|---|---|
| Free | |
| Basic | |
| Standard | |
| Premium | |
| Enterprise |
systemData
与创建和上次修改资源相关的元数据。
| 名称 | 类型 | 说明 |
|---|---|---|
| createdAt |
string (date-time) |
资源创建时间戳(UTC)。 |
| createdBy |
string |
创建资源的标识。 |
| createdByType |
创建资源的标识的类型。 |
|
| lastModifiedAt |
string (date-time) |
上次修改的资源时间戳(UTC) |
| lastModifiedBy |
string |
上次修改资源的标识。 |
| lastModifiedByType |
上次修改资源的标识的类型。 |
ThrottlingRule
| 名称 | 类型 | 说明 |
|---|---|---|
| count |
number |
|
| dynamicThrottlingEnabled |
boolean |
|
| key |
string |
|
| matchPatterns | ||
| minCount |
number |
|
| renewalPeriod |
number |