Delen via


Ondersteunde metriek voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Tabelkoppen

Metriek - de weergavenaam van de metriek zoals die in het Azure-portaal wordt weergegeven.
Naam in Rest API - Metrische naam zoals wordt genoemd in de REST API.
Eenheid : maateenheid.
Aggregatie: het standaardaggregatietype. Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies die - beschikbaar zijn voor de metrische waarde.
Tijdsintervallen - waarmee de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M aan dat de metrische waarde elke minuut, PT30M om de 30 minuten, PT1H elk uur enzovoort wordt genomen.
DS Exporteren: of de metrische waarde kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen.

Zie voor meer informatie over het exporteren van metrische gegevens - Metrische gegevens exporteren met behulp van regels voor gegevensverzameling en diagnostische instellingen maken in Azure Monitor.

Zie het overzicht van metrische gegevens in Azure Monitor voor meer informatie over het bewaren van metrische gegevens.

Categorie: Resource

Metrische gegevens Naam in REST API Eenheid Aggregatie Afmetingen Tijdseenheden DS Exporteren
Percentage CPU-geheugengebruik

Percentage geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
CpuMemoryUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
PERCENTAGE CPU-gebruik

Percentage CPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
CpuUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
Fouten bij het verzamelen van gegevens per minuut

Het aantal gegevensverzamelingsgebeurtenissen nam per minuut af.
DataCollectionErrorsPerMinute Tellen Minimum, Maximum, Gemiddelde instanceId, , reasontype PT1M Nee
Aantal dataverzamelingsevenementen per minuut

Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt.
DataCollectionEventsPerMinute Tellen Minimum, Maximum, Gemiddelde instanceId, type PT1M Nee
Implementatiecapaciteit

Het aantal exemplaren in de implementatie.
DeploymentCapacity Tellen Minimum, Maximum, Gemiddelde instanceId, State PT1M Nee
Schijfgebruik

Percentage schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
DiskUtilization Procent Minimum, Maximum, Gemiddelde instanceId, disk PT1M Ja
GPU Energy in Joules

Interval energie in Joules op een GPU-knooppunt. Energie wordt met intervallen van één minuut gerapporteerd.
GpuEnergyJoules Tellen Minimum, Maximum, Gemiddelde instanceId PT1M Nee
PERCENTAGE GPU-geheugengebruik

Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
GpuMemoryUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja
PERCENTAGE GPU-gebruik

Percentage GPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.
GpuUtilizationPercentage Procent Minimum, Maximum, Gemiddelde instanceId PT1M Ja

Categorie: Verkeer

Metrische gegevens Naam in REST API Eenheid Aggregatie Afmetingen Tijdseenheden DS Exporteren
Aanvraaglatentie P50

De gemiddelde P50-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P50 Milliseconden Gemiddeld <geen> PT1M Ja
Aanvraaglatentie P90

De gemiddelde P90-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P90 Milliseconden Gemiddeld <geen> PT1M Ja
Aanvraaglatentie P95

De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode
RequestLatency_P95 Milliseconden Gemiddeld <geen> PT1M Ja
Aanvraaglatentie P99

De gemiddelde P99-aanvraaglatentie geaggregeerd door alle aangevraagde latentiewaarden die zijn verzameld over de geselecteerde periode
RequestLatency_P99 Milliseconden Gemiddeld <geen> PT1M Ja
Aanvragen per minuut

Het aantal aanvragen dat binnen een minuut naar de online-implementatie wordt verzonden
RequestsPerMinute Tellen Gemiddeld envoy_response_code PT1M Nee

Volgende stappen