你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

CLI (v2) 批量部署 YAML 架构

适用于:Azure CLI ml 扩展 v2(当前)

源 JSON 架构可在 https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json 中找到。

注意

本文档中详细介绍的 YAML 语法基于最新版本的 ML CLI v2 扩展的 JSON 架构。 此语法必定仅适用于最新版本的 ML CLI v2 扩展。 可以在 https://azuremlschemasprod.azureedge.net/ 上查找早期扩展版本的架构。

YAML 语法

密钥 类型 说明 允许的值 默认值
$schema 字符串 YAML 架构。 如果使用 Azure 机器学习 VS Code 扩展来创作 YAML 文件,则可通过在文件顶部包含 $schema 来调用架构和资源完成操作。
name 字符串 必需。 部署的名称。
description 字符串 部署的说明。
tags 对象 部署的标记字典。
endpoint_name 字符串 必需。 要在其中创建部署的终结点的名称。
type 字符串 批处理部署的类型。 使用 model 进行模型部署,使用 pipeline 进行管道组件部署。 如果未指定,则默认为经典批处理部署

版本 1.7 中的新增功能
%>
settings 对象 部署的配置。 有关允许的值,请参阅模型和管道组件的特定 YAML 参考。

版本 1.7 中的新增功能

提示

CLI 扩展版本 1.7 及更高版本中引入了密钥 type。 为了完全支持向后兼容性,此属性默认为 model。 但是,如果未显式指示,则不会强制执行密钥 settings,并且模型部署设置的所有属性都应在 YAML 规范的根目录中指明。

模型部署的 YAML 语法

当为 type: model 时,将强制实施以下语法:

密钥 类型 说明 允许的值 默认值
model 字符串或对象 必需。 要用于部署的模型。 此值可以是对工作区中现有版本受控模型的引用,也可以是对内联模型规范的引用。

若要引用现有模型,请使用 azureml:<model-name>:<version> 语法。

若要内联定义模型,请遵循模型架构

对于生产方案,最佳做法应该是单独创建模型并在此处引用模型。
code_configuration 对象 评分代码逻辑的配置。

如果模型采用 MLflow 格式,则不需要此属性。
code_configuration.code 字符串 包含用于对模型进行评分的所有 Python 源代码的本地目录。
code_configuration.scoring_script 字符串 上述目录中的 Python 文件。 此文件必须具有 init() 函数和 run() 函数。 对于任何成本较高或者一般性的准备工作(例如将模型加载到内存中),请使用 init() 函数。 init() 将在进程开始时调用一次。 使用 run(mini_batch) 为每个项评分;mini_batch 值是文件路径列表。 run() 函数应返回 Pandas 数据帧或数组。 每个返回的元素指示 mini_batch 中成功运行一次输入元素。 有关如何创作评分脚本的详细信息,请参阅了解评分脚本
environment 字符串或对象 用于作业的环境。 此值可以是对工作区中现有版本受控环境的引用,也可以是对内联环境规范的引用。

如果模型采用 MLflow 格式,则不需要此属性。

若要引用现有环境,请使用 azureml:<environment-name>:<environment-version> 语法。

若要以内联方式定义环境,请遵循环境架构

对于生产方案,最佳做法应该是单独创建环境并在此处引用环境。
compute 字符串 必需。 要执行批处理评分作业的计算目标的名称。 此值应是通过 azureml:<compute-name> 语法对工作区中现有计算的引用。
resources.instance_count 整数 要用于每个批量评分作业的节点数。 1
settings 对象 模型部署的特定配置。

在 1.7 版中已更改。
settings.max_concurrency_per_instance 整数 每个实例的并行 scoring_script 运行的最大数量。 1
settings.error_threshold 整数 应忽略的文件失败次数。 如果整个输入的错误计数超出此值,则批量评分作业将终止。 error_threshold 用于整个输入,而不是单独的小批量。 如果省略,则允许文件失败任意次数,而不会终止作业。 -1
settings.logging_level 字符串 日志详细程度。 .- . info
settings.mini_batch_size 整数 code_configuration.scoring_script 可以在一次 run() 调用中处理的文件数。 10
settings.retry_settings 对象 用于对每个小批量进行评分的重试设置。
settings.retry_settings.max_retries 整数 针对失败或已超时小批量的最大重试次数。 3
settings.retry_settings.timeout 整数 对单个小批量进行评分的超时(以秒为单位)。 当小批量大小较大或模型运行成本较高时,请使用较大的值。 30
settings.output_action 字符串 指示应如何在输出文件中组织输出。 如果要按照summary_only中的指示生成输出文件,请使用 。 如果要返回预测作为 append_row 函数 run() 语句的一部分,请使用 return %> append_row
settings.output_file_name 字符串 批量评分输出文件的名称。 predictions.csv
settings.environment_variables 对象 要针对每个批量评分作业设置的环境变量键值对字典。

管道组件部署的 YAML 语法

当为 type: pipeline 时,将强制实施以下语法:

密钥 类型 说明 允许的值 默认值
component 字符串或对象 必需。 用于部署的管道组件。 此值可以是对工作区或注册表中现有版本控制管道组件的引用,也可以是内联管道规范。

若要引用现有组件,请使用 azureml:<component-name>:<version> 语法。

若要定义内联管道组件,请遵循管道组件架构

对于生产场景,最佳做法应该是单独创建组件并在此处引用。

版本 1.7 中的新增功能
settings 对象 管道作业的默认设置。 有关可配置属性的集合,请参阅设置键的属性

版本 1.7 中的新增功能

备注

az ml batch-deployment 命令可用于管理 Azure 机器学习批量部署。

示例

示例 GitHub 存储库中提供了示例。 下面引用了其中一些示例:

YAML:MLflow 模型部署

包含 MLflow 模型的模型部署,不需要指示 code_configurationenvironment

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
endpoint_name: heart-classifier-batch
name: classifier-xgboost-mlflow
description: A heart condition classifier based on XGBoost
type: model
model: azureml:heart-classifier-mlflow@latest
compute: azureml:batch-cluster
resources:
  instance_count: 2
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 2
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 300
  error_threshold: -1
  logging_level: info

YAML:带有评分脚本的自定义模型部署

指示要使用的评分脚本和环境的模型部署:

$schema: https://azuremlschemas.azureedge.net/latest/modelBatchDeployment.schema.json
name: mnist-torch-dpl
description: A deployment using Torch to solve the MNIST classification dataset.
endpoint_name: mnist-batch
type: model
model:
  name: mnist-classifier-torch
  path: model
code_configuration:
  code: code
  scoring_script: batch_driver.py
environment:
  name: batch-torch-py38
  image: mcr.microsoft.com/azureml/openmpi4.1.0-ubuntu20.04:latest
  conda_file: environment/conda.yaml
compute: azureml:batch-cluster
resources:
  instance_count: 1
settings:
  max_concurrency_per_instance: 2
  mini_batch_size: 10
  output_action: append_row
  output_file_name: predictions.csv
  retry_settings:
    max_retries: 3
    timeout: 30
  error_threshold: -1
  logging_level: info

YAML:旧模型部署

如果 YAML 中未指示属性 type,则推断模型部署。 但是,密钥 settings 将不可用,并且属性应放置在 YAML 的根目录中,如此示例中所示。 强烈建议始终指定属性 type

$schema: https://azuremlschemas.azureedge.net/latest/batchDeployment.schema.json
endpoint_name: heart-classifier-batch
name: classifier-xgboost-mlflow
description: A heart condition classifier based on XGBoost
model: azureml:heart-classifier-mlflow@latest
compute: azureml:batch-cluster
resources:
  instance_count: 2
max_concurrency_per_instance: 2
mini_batch_size: 2
output_action: append_row
output_file_name: predictions.csv
retry_settings:
  max_retries: 3
  timeout: 300
error_threshold: -1
logging_level: info

YAML:管道组件部署

一个简单的管道组件部署:

$schema: https://azuremlschemas.azureedge.net/latest/pipelineComponentBatchDeployment.schema.json
name: hello-batch-dpl
endpoint_name: hello-pipeline-batch
type: pipeline
component: azureml:hello_batch@latest
settings:
    default_compute: batch-cluster

后续步骤