Ondersteunde metriek voor Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments

2025-04-17

De volgende tabel bevat de metrische gegevens die beschikbaar zijn voor het resourcetype Microsoft.MachineLearningServices/workspaces/onlineEndpoints/deployments.

Tabelkoppen

Metriek - de weergavenaam van de metriek zoals die in het Azure-portaal wordt weergegeven.
Naam in Rest API - Metrische naam zoals wordt genoemd in de REST API.
Eenheid : maateenheid.
Aggregatie: het standaardaggregatietype. Geldige waarden: Gemiddelde, Minimum, Maximum, Totaal, Aantal.
Dimensies die - beschikbaar zijn voor de metrische waarde.
Tijdsintervallen - waarmee de metrische gegevens worden bemonsterd. Geeft bijvoorbeeld PT1M aan dat de metrische waarde elke minuut, PT30M om de 30 minuten, PT1H elk uur enzovoort wordt genomen.
DS Exporteren: of de metrische waarde kan worden geëxporteerd naar Azure Monitor-logboeken via diagnostische instellingen.

Zie voor meer informatie over het exporteren van metrische gegevens - Metrische gegevens exporteren met behulp van regels voor gegevensverzameling en diagnostische instellingen maken in Azure Monitor.

Zie het overzicht van metrische gegevens in Azure Monitor voor meer informatie over het bewaren van metrische gegevens.

Categorie: Resource

Metrische gegevens	Naam in REST API	Eenheid	Aggregatie	Afmetingen	Tijdseenheden	DS Exporteren
Percentage CPU-geheugengebruik Percentage geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`CpuMemoryUtilizationPercentage`	Procent	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Ja
PERCENTAGE CPU-gebruik Percentage CPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`CpuUtilizationPercentage`	Procent	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Ja
Fouten bij het verzamelen van gegevens per minuut Het aantal gegevensverzamelingsgebeurtenissen nam per minuut af.	`DataCollectionErrorsPerMinute`	Tellen	Minimum, Maximum, Gemiddelde	`instanceId`, , `reasontype`	PT1M	Nee
Aantal dataverzamelingsevenementen per minuut Het aantal gegevensverzamelingsgebeurtenissen dat per minuut wordt verwerkt.	`DataCollectionEventsPerMinute`	Tellen	Minimum, Maximum, Gemiddelde	`instanceId`, `type`	PT1M	Nee
Implementatiecapaciteit Het aantal exemplaren in de implementatie.	`DeploymentCapacity`	Tellen	Minimum, Maximum, Gemiddelde	`instanceId`, `State`	PT1M	Nee
Schijfgebruik Percentage schijfgebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`DiskUtilization`	Procent	Minimum, Maximum, Gemiddelde	`instanceId`, `disk`	PT1M	Ja
GPU Energy in Joules Interval energie in Joules op een GPU-knooppunt. Energie wordt met intervallen van één minuut gerapporteerd.	`GpuEnergyJoules`	Tellen	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Nee
PERCENTAGE GPU-geheugengebruik Percentage gpu-geheugengebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`GpuMemoryUtilizationPercentage`	Procent	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Ja
PERCENTAGE GPU-gebruik Percentage GPU-gebruik op een exemplaar. Het gebruik wordt met intervallen van één minuut gerapporteerd.	`GpuUtilizationPercentage`	Procent	Minimum, Maximum, Gemiddelde	`instanceId`	PT1M	Ja

Categorie: Verkeer

Metrische gegevens	Naam in REST API	Eenheid	Aggregatie	Afmetingen	Tijdseenheden	DS Exporteren
Aanvraaglatentie P50 De gemiddelde P50-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode	`RequestLatency_P50`	Milliseconden	Gemiddeld	<geen>	PT1M	Ja
Aanvraaglatentie P90 De gemiddelde P90-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode	`RequestLatency_P90`	Milliseconden	Gemiddeld	<geen>	PT1M	Ja
Aanvraaglatentie P95 De gemiddelde P95-aanvraaglatentie geaggregeerd door alle latentiewaarden voor aanvragen die zijn verzameld over de geselecteerde periode	`RequestLatency_P95`	Milliseconden	Gemiddeld	<geen>	PT1M	Ja
Aanvraaglatentie P99 De gemiddelde P99-aanvraaglatentie geaggregeerd door alle aangevraagde latentiewaarden die zijn verzameld over de geselecteerde periode	`RequestLatency_P99`	Milliseconden	Gemiddeld	<geen>	PT1M	Ja
Aanvragen per minuut Het aantal aanvragen dat binnen een minuut naar de online-implementatie wordt verzonden	`RequestsPerMinute`	Tellen	Gemiddeld	`envoy_response_code`	PT1M	Nee

Volgende stappen

Feedback

Is deze pagina nuttig?