Dela via


Samla in GPU-metriker från NVIDIA DCGM Exporter genom att använda hanterad tjänst för Prometheus.

NVIDIA DCGM Exporter möjliggör insamling och export av NVIDIA GPU-mått, såsom utnyttjande, minnesanvändning och strömförbrukning. Du kan använda denna exporterare och möjliggöra GPU-övervakning genom Azure Monitor hanterad tjänst för Prometheus-funktionen och genom Azure Managed Grafana.

Deploy NVIDIA DCGM Exporter

Distribuera exportören och konfigurera insamlingen av mätvärden genom att följa instruktionerna i Monitor GPU metrics from NVIDIA DCGM Exporter with managed service for Prometheus and Azure Managed Grafana on AKS.

Fråga efter GPU-mått

De skrapade metrikvärdena lagras i det Azure Monitor-arbetsutrymme som är associerat med hanterad tjänst för Prometheus. Du kan fråga efter metriken direkt från arbetsytan eller via Azure Managed Grafana-instansen som är ansluten till arbetsytan.

För att visa NVIDIA GPU-mått i Azure Monitor-arbetsytan:

  1. I Azure-portalen, gå till ditt Azure Kubernetes Service-kluster.

  2. Under Monitoring, select Insights>Monitor Settings.

    Diagram som visar urval för att visa Azure Monitor-arbetsytan.

  3. Välj Azure Monitor-arbetsyteinstansen. På sidan för instansöversikt, välj sektionen Metrics för att hämta data.

    Alternativt kan du välja en Azure Managed Grafana-instans. Därefter, på översiktssidan för instance, välj endpoint-URL-en. Denna åtgärd öppnar Grafana-portalen, där du kan fråga Azure Container Storage-måtten. Datakällan konfigureras automatiskt för att du ska kunna fråga efter metrik från den associerade Azure Monitor-arbetsytan.

För att lära dig mer om att fråga efter Prometheus-metriker från en Azure Monitor-arbetsyta, se Connect Grafana to Azure Monitor Prometheus metrics.

Felsökning

Om du har några problem, se felsökningsinformationen för Prometheus-gränssnittet.