你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要说明
本文提供有关使用 Azure 机器学习 SDK v1 的信息。 SDK v1 自 2025 年 3 月 31 日起弃用。 对它的支持将于 2026 年 6 月 30 日结束。 可以在该日期之前安装和使用 SDK v1。
建议在 2026 年 6 月 30 日之前过渡到 SDK v2。 有关 SDK v2 的详细信息,请参阅 什么是 Azure 机器学习 CLI 和 Python SDK v2? 以及 SDK v2 参考。
将 Azure 机器学习模型部署为 Web 服务可创建 REST API 终结点。 可将数据发送到此终结点,并接收模型返回的预测。 本文档介绍了如何使用 C#、Go、Java 和 Python 为 Web 服务创建客户端。
将模型部署到本地环境、Azure 容器实例或 Azure Kubernetes 服务时,你将创建一个 Web 服务。 你将使用 Azure 机器学习 SDK 检索用来访问 Web 服务的 URI。 如果启用了身份验证,则还可以使用该 SDK 来获取身份验证密钥或令牌。
用于创建使用机器学习 Web 服务的客户端的常规工作流为:
- 使用 SDK 获取连接信息。
- 确定模型使用的请求数据的类型。
- 创建调用 Web 服务的应用程序。
提示
本文档中的示例是手动创建的,没有使用 OpenAPI (Swagger) 规范。 如果已为部署启用了 OpenAPI 规范,则可以使用 swagger-codegen 之类的工具为服务创建客户端库。
重要说明
本文中的一些 Azure CLI 命令使用适用于 Azure 机器学习的 azure-cli-ml 或 v1 扩展。 对 v1 扩展的支持将于 2025 年 9 月 30 日结束。 在该日期之前,你能够安装和使用 v1 扩展。
我们建议你在 2025 年 9 月 30 日之前过渡到 ml 或 v2 扩展。 有关 v2 扩展的详细信息,请参阅 Azure 机器学习 CLI 扩展和 Python SDK v2。
连接信息
注意
使用 Azure 机器学习 SDK 获取 Web 服务信息。 这是一个 Python SDK。 可以使用任何语言来为服务创建客户端。
              azureml.core.Webservice 类提供了创建客户端所需的信息。 创建客户端应用程序时,以下 Webservice 属性非常有用:
- 
              auth_enabled- 如果启用了密钥身份验证,则为True;否则为False。
- 
              token_auth_enabled- 如果启用了令牌身份验证,则为True;否则为False。
- 
              scoring_uri- REST API 地址。
- 
              swagger_uri- OpenAPI 规范的地址。 如果已启用自动生成架构,则可以使用此 URI。 有关详细信息,请参阅使用 Azure 机器学习部署模型。
可通过几种方式检索已部署的 Web 服务的此信息:
              适用于: 适用于 Python 的 Azure 机器学习 SDK v1
适用于 Python 的 Azure 机器学习 SDK v1
- 部署模型时,会返回包含有关服务的信息的 - Webservice对象:- service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config) service.wait_for_deployment(show_output = True) print(service.scoring_uri) print(service.swagger_uri)
- 可以使用 - Webservice.list检索工作区中为模型部署的 Web 服务列表。 可以添加筛选器,以缩小返回的信息列表范围。 有关可以筛选的对象的详细信息,请参阅 Webservice.list 参考文档。- services = Webservice.list(ws) print(services[0].scoring_uri) print(services[0].swagger_uri)
- 如果知道已部署的服务的名称,可以创建 - Webservice的新实例,并以参数的形式提供工作区和服务名称。 新对象包含有关已部署的服务的信息。- service = Webservice(workspace=ws, name='myservice') print(service.scoring_uri) print(service.swagger_uri)
下表显示了这些 URI 的外观:
| URI 类型 | 示例 | 
|---|---|
| 评分 URI | http://104.214.29.152:80/api/v1/service/<service-name>/score | 
| Swagger UI | http://104.214.29.152/api/v1/service/<service-name>/swagger.json | 
提示
对于您的部署,IP 地址是不同的。 每个 AKS 群集都有自己的 IP 地址,供部署到该群集的应用共享。
受保护的 Web 服务
如果已使用 TLS/SSL 证书保护部署的 Web 服务,则可以使用评分或 swagger URI 通过 HTTPS 连接到该服务。 HTTPS 对客户端和 Web 服务之间的通信进行加密来帮助保护两者之间的通信。 加密使用传输层安全性 (TLS)。 TLS 有时仍称为安全套接字层 (SSL),这是 TLS 的前身。
重要说明
Azure 机器学习部署的 Web 服务仅支持 TLS 版本 1.2。 创建客户端应用程序时,请确保它支持此版本。
有关详细信息,请参阅使用 TLS 通过 Azure 机器学习来保护 Web 服务。
服务的身份验证
Azure 机器学习提供了两种方法来控制对 Web 服务的访问。
| 身份验证方法 | ACI | AKS | 
|---|---|---|
| 密钥 | 默认已禁用 | 默认情况下启用 | 
| 标记 | 不可用 | 默认已禁用 | 
将请求发送到由密钥或令牌保护的服务时,请使用 Authorization 标头来传递密钥或令牌。 密钥或令牌的格式必须为 Bearer <key-or-token>,其中 <key-or-token> 为密钥或令牌值。
密钥和令牌的主要区别在于,密钥是静态的且能手动重新生成,而令牌需要在到期时刷新。 Azure 容器实例和 Azure Kubernetes 服务部署的 Web 服务支持基于密钥的身份验证,而基于令牌的身份验证仅能用于 Azure Kubernetes 服务部署。 有关配置身份验证的详细信息,请参阅针对部署为 Web 服务的模型配置身份验证。
使用密钥进行身份验证
为部署启用身份验证时,会自动创建身份验证密钥。
- 部署到 Azure Kubernetes 服务时,会默认启用身份验证。
- 部署到 Azure 容器实例时,会默认禁用身份验证。
若要控制身份验证,请在创建或更新部署时使用 auth_enabled 参数。
如果已启用身份验证,可以使用 get_keys 方法来检索主要和辅助身份验证密钥:
primary, secondary = service.get_keys()
print(primary)
重要说明
如需重新生成密钥,请使用 service.regen_key。
使用令牌进行身份验证
为 Web 服务启用令牌身份验证时,用户必须向 Web 服务提供 Azure 机器学习 JWT 才能访问它。
- 部署到 Azure Kubernetes 服务时,默认情况下会禁用令牌身份验证。
- 部署到 Azure 容器实例时,不支持令牌身份验证。
若要控制令牌身份验证,请在创建或更新部署时使用 token_auth_enabled 参数。
如果启用了令牌身份验证,可以使用 get_token 方法来检索持有者令牌以及该令牌的到期时间:
token, refresh_by = service.get_token()
print(token)
如果安装了 Azure CLI 和机器学习扩展,则可使用以下命令获取令牌:
az ml service get-access-token -n <service-name>
重要说明
目前,检索令牌的唯一方法是使用 Azure 机器学习 SDK 或 Azure CLI 机器学习扩展。
需要在令牌的 refresh_by 时间后请求一个新令牌。
请求数据
REST API 预期请求正文是采用以下结构的 JSON 文档:
{
    "data":
        [
            <model-specific-data-structure>
        ]
}
重要说明
数据结构需要符合服务中评分脚本和模型的预期。 评分脚本在将数据传递到模型之前可以修改数据。
二进制数据
有关如何在服务中启用对二进制数据的支持的信息,请参阅二进制数据。
提示
启用二进制数据支持这一操作是在部署的模型所使用的 score.py 文件中实现的。 从客户端中,使用编程语言的 HTTP 功能。 例如,以下代码片段将 JPG 文件的内容发送到 Web 服务:
import requests
# Load image data
data = open('example.jpg', 'rb').read()
# Post raw data to scoring URI
res = request.post(url='<scoring-uri>', data=data, headers={'Content-Type': 'application/> octet-stream'})
跨域资源共享 (CORS)
有关在服务中启用 CORS 支持的信息,请参阅跨源资源共享。
调用服务 (C#)
此示例演示如何使用 C# 调用 Web 服务:
using System;
using System.Collections.Generic;
using System.IO;
using System.Net.Http;
using System.Net.Http.Headers;
using Newtonsoft.Json;
namespace MLWebServiceClient
{
    // The data structure expected by the service
    internal class InputData
    {
        [JsonProperty("data")]
        // The service used by this example expects an array containing
        //   one or more arrays of doubles
        internal double[,] data;
    }
    class Program
    {
        static void Main(string[] args)
        {
            // Set the scoring URI and authentication key or token
            string scoringUri = "<your web service URI>";
            string authKey = "<your key or token>";
            // Set the data to be sent to the service.
            // In this case, we are sending two sets of data to be scored.
            InputData payload = new InputData();
            payload.data = new double[,] {
                {
                    0.0199132141783263,
                    0.0506801187398187,
                    0.104808689473925,
                    0.0700725447072635,
                    -0.0359677812752396,
                    -0.0266789028311707,
                    -0.0249926566315915,
                    -0.00259226199818282,
                    0.00371173823343597,
                    0.0403433716478807
                },
                {
                    -0.0127796318808497, 
                    -0.044641636506989, 
                    0.0606183944448076, 
                    0.0528581912385822, 
                    0.0479653430750293, 
                    0.0293746718291555, 
                    -0.0176293810234174, 
                    0.0343088588777263, 
                    0.0702112981933102, 
                    0.00720651632920303
                }
            };
            // Create the HTTP client
            HttpClient client = new HttpClient();
            // Set the auth header. Only needed if the web service requires authentication.
            client.DefaultRequestHeaders.Authorization = new AuthenticationHeaderValue("Bearer", authKey);
            // Make the request
            try {
                var request = new HttpRequestMessage(HttpMethod.Post, new Uri(scoringUri));
                request.Content = new StringContent(JsonConvert.SerializeObject(payload));
                request.Content.Headers.ContentType = new MediaTypeHeaderValue("application/json");
                var response = client.SendAsync(request).Result;
                // Display the response from the web service
                Console.WriteLine(response.Content.ReadAsStringAsync().Result);
            }
            catch (Exception e)
            {
                Console.Out.WriteLine(e.Message);
            }
        }
    }
}
返回的结果类似于以下 JSON 文档:
[217.67978776218715, 224.78937091757172]
调用服务 (Python)
此示例演示如何使用 Python 调用 Web 服务:
import requests
import json
# URL for the web service
scoring_uri = '<your web service URI>'
# If the service is authenticated, set the key or token
key = '<your key or token>'
# Two sets of data to score, so we get two results back
data = {"data":
        [
            [
                0.0199132141783263,
                0.0506801187398187,
                0.104808689473925,
                0.0700725447072635,
                -0.0359677812752396,
                -0.0266789028311707,
                -0.0249926566315915,
                -0.00259226199818282,
                0.00371173823343597,
                0.0403433716478807
            ],
            [
                -0.0127796318808497,
                -0.044641636506989,
                0.0606183944448076,
                0.0528581912385822,
                0.0479653430750293,
                0.0293746718291555,
                -0.0176293810234174,
                0.0343088588777263,
                0.0702112981933102,
                0.00720651632920303]
        ]
        }
# Convert to JSON string
input_data = json.dumps(data)
# Set the content type
headers = {'Content-Type': 'application/json'}
# If authentication is enabled, set the authorization header
headers['Authorization'] = f'Bearer {key}'
# Make the request and display the response
resp = requests.post(scoring_uri, input_data, headers=headers)
print(resp.text)
返回的结果类似于以下 JSON 文档:
[217.67978776218715, 224.78937091757172]
Web 服务架构(OpenAPI 规范)
如果在部署中使用了自动生成架构,则可以通过使用 swagger_uri 属性获取服务的 OpenAPI 规范的地址。 (例如 print(service.swagger_uri)。)使用 GET 请求,或在浏览器中打开 URI 以检索规范。
以下 JSON 文档是为部署生成的架构(OpenAPI 规范)示例:
{
    "swagger": "2.0",
    "info": {
        "title": "myservice",
        "description": "API specification for Azure Machine Learning myservice",
        "version": "1.0"
    },
    "schemes": [
        "https"
    ],
    "consumes": [
        "application/json"
    ],
    "produces": [
        "application/json"
    ],
    "securityDefinitions": {
        "Bearer": {
            "type": "apiKey",
            "name": "Authorization",
            "in": "header",
            "description": "For example: Bearer abc123"
        }
    },
    "paths": {
        "/": {
            "get": {
                "operationId": "ServiceHealthCheck",
                "description": "Simple health check endpoint to ensure the service is up at any given point.",
                "responses": {
                    "200": {
                        "description": "If service is up and running, this response will be returned with the content 'Healthy'",
                        "schema": {
                            "type": "string"
                        },
                        "examples": {
                            "application/json": "Healthy"
                        }
                    },
                    "default": {
                        "description": "The service failed to execute due to an error.",
                        "schema": {
                            "$ref": "#/definitions/ErrorResponse"
                        }
                    }
                }
            }
        },
        "/score": {
            "post": {
                "operationId": "RunMLService",
                "description": "Run web service's model and get the prediction output",
                "security": [
                    {
                        "Bearer": []
                    }
                ],
                "parameters": [
                    {
                        "name": "serviceInputPayload",
                        "in": "body",
                        "description": "The input payload for executing the real-time machine learning service.",
                        "schema": {
                            "$ref": "#/definitions/ServiceInput"
                        }
                    }
                ],
                "responses": {
                    "200": {
                        "description": "The service processed the input correctly and provided a result prediction, if applicable.",
                        "schema": {
                            "$ref": "#/definitions/ServiceOutput"
                        }
                    },
                    "default": {
                        "description": "The service failed to execute due to an error.",
                        "schema": {
                            "$ref": "#/definitions/ErrorResponse"
                        }
                    }
                }
            }
        }
    },
    "definitions": {
        "ServiceInput": {
            "type": "object",
            "properties": {
                "data": {
                    "type": "array",
                    "items": {
                        "type": "array",
                        "items": {
                            "type": "integer",
                            "format": "int64"
                        }
                    }
                }
            },
            "example": {
                "data": [
                    [ 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 ]
                ]
            }
        },
        "ServiceOutput": {
            "type": "array",
            "items": {
                "type": "number",
                "format": "double"
            },
            "example": [
                3726.995
            ]
        },
        "ErrorResponse": {
            "type": "object",
            "properties": {
                "status_code": {
                    "type": "integer",
                    "format": "int32"
                },
                "message": {
                    "type": "string"
                }
            }
        }
    }
}
有关详细信息,请参阅 OpenAPI 规范。
要了解可根据规范创建客户端库的实用工具,请参阅 swagger-codegen。
提示
部署服务后,可以检索架构 JSON 文档。 使用部署的 Web 服务中的 swagger_uri 属性(例如 service.swagger_uri)获取本地 Web 服务的 Swagger 文件的 URI。
后续步骤
若要查看 Python 和深度学习模型的实时评分的参考体系结构,请转至 Azure 体系结构中心。