Spåra experiment och modeller med hjälp av MLflow

2025-10-31

Spårning är processen för att spara relevant information om experiment. I den här artikeln får du lära dig hur du använder MLflow för att spåra experiment och körningar på Azure Machine Learning-arbetsytor.

Vissa metoder som är tillgängliga i MLflow-API:et kanske inte är tillgängliga när du använder Azure Machine Learning. Mer information om åtgärder som stöds och som inte stöds finns i Supportmatris för frågekörningar och experiment. Du kan också lära dig mer om MLflow-funktioner som stöds i Azure Machine Learning i artikeln MLflow och Azure Machine Learning.

Anmärkning

Information om hur du spårar experiment som körs på Azure Databricks finns i Spåra Azure Databricks maskininlärningsexperiment med MLflow och Azure Machine Learning.
Information om hur du spårar experiment som körs i Azure Synapse Analytics finns i Spåra ML-experiment för Azure Synapse Analytics med MLflow och Azure Machine Learning.

Förutsättningar

Ha en Azure-prenumeration och den kostnadsfria eller betalda versionen av Azure Machine Learning.
Om du vill köra Azure CLI- och Python-kommandon installerar du Azure CLI v2 och Azure Machine Learning SDK v2 för Python. Tillägget ml för Azure CLI installeras automatiskt första gången du kör ett Azure Machine Learning CLI-kommando.

Installera MLflow SDK-paketet mlflow och Azure Machine Learning-plugin-programmet azureml-mlflow för MLflow:
```
pip install mlflow azureml-mlflow
```
Tips/Råd

Du kan använda mlflow-skinny paketet, som är ett enkelt MLflow-paket utan SQL-lagring, server, användargränssnitt eller datavetenskapsberoenden. Vi rekommenderar det här paketet för användare som främst behöver MLflow-spårnings- och loggningsfunktionerna, men inte hela sviten med funktioner, inklusive distributioner.
Skapa en Azure Machine Learning-arbetsyta. Information om hur du skapar en arbetsyta finns i Skapa resurser som du behöver för att komma igång. Granska de åtkomstbehörigheter som du behöver för att utföra MLflow-åtgärder på din arbetsyta.
Om du vill utföra fjärrspårning eller spåra experiment som körs utanför Azure Machine Learning konfigurerar du MLflow så att det pekar på spårnings-URI:n för din Azure Machine Learning-arbetsyta. Mer information om hur du ansluter MLflow till din arbetsyta finns i Konfigurera MLflow för Azure Machine Learning.

Konfigurera experimentet

MLflow organiserar information i experiment och körningar. Körningar kallas jobb i Azure Machine Learning. Som standard kör loggen till ett automatiskt skapat experiment med namnet Standard, men du kan konfigurera vilket experiment som ska spåras.

Bärbara datorer
jobb

För interaktiv träning, till exempel i en Jupyter-anteckningsbok, använder du MLflow-kommandot mlflow.set_experiment(). Följande kodfragment konfigurerar till exempel ett experiment:

experiment_name = 'hello-world-example'
mlflow.set_experiment(experiment_name)

Om du vill skicka jobb med hjälp av Azure Machine Learning CLI eller SDK anger du experimentnamnet med hjälp experiment_name av jobbets egenskap. Du behöver inte konfigurera experimentnamnet i träningsskriptet.

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
command: echo "hello world"
environment:
  image: library/python:latest
tags:
  hello: world
display_name: hello-world-example
experiment_name: hello-world-example
description: |

Konfigurera körprocessen

Azure Machine Learning spårar träningsjobb i det som MLflow kallar körningar. Använd körningar för att samla in all bearbetning som jobbet utför.

Bärbara datorer
jobb

När du arbetar interaktivt börjar MLflow spåra din träningsrutin så snart du loggar information som kräver en aktiv körning. Om till exempel MLflows autologgningsfunktion är aktiverad startar MLflow-spårningen när du loggar ett mått eller en parameter eller startar en träningscykel.

Det är dock vanligtvis bra att starta processen explicit, särskilt om du vill registrera den totala tiden för ditt experiment i fältet Varaktighet. Om du vill starta körningen uttryckligen använder du mlflow.start_run().

Oavsett om du startar körningen manuellt eller inte måste du stoppa körningen så att MLflow vet att experimentkörningen är klar och kan markera körningens status som Slutförd. Om du vill stoppa en körning använder du mlflow.end_run().

Följande kod startar en körning manuellt och avslutar den i slutet av notebook-filen:

mlflow.start_run()

# Your code

mlflow.end_run()

Det är bäst att starta körningar manuellt så att du inte glömmer att avsluta dem. Du kan använda context manager-paradigmet för att hjälpa dig komma ihåg att avsluta en körning.

with mlflow.start_run() as run:
    # Your code

När du startar en ny körning med hjälp mlflow.start_run()av kan det vara användbart att ange parametern run_name , som senare översätts till namnet på körningen i Azure Machine Learning-användargränssnittet. Den här metoden hjälper dig att identifiera löpningen snabbare.

with mlflow.start_run(run_name="hello-world-example") as run:
    # Your code

Med Azure Machine Learning-jobb kan du skicka långvariga tränings- eller slutsatsdragningsrutiner som isolerade och reproducerbara körningar.

Skapa en träningsrutin som har spårning

När du arbetar med jobb inkluderar du vanligtvis all träningslogik som filer i en mapp, till exempel src. En av filerna är en Python-fil som innehåller startpunkten för din träningskod.

I din träningsrutin kan du använda MLflow SDK för att spåra mått, parametrar, artefakter eller modeller. Exempel finns i Loggmått, parametrar och filer med MLflow.

I följande exempel visas en hello_world.py träningsrutin som lägger till loggning:

# imports
import os
import mlflow

from random import random

# define functions
def main():
    mlflow.log_param("hello_param", "world")
    mlflow.log_metric("hello_metric", random())
    os.system(f"echo 'hello world' > helloworld.txt")
    mlflow.log_artifact("helloworld.txt")


# run functions
if __name__ == "__main__":
    # run main function
    main()

I föregående kodexempel används mlflow.start_run()inte . Om den här raden används återanvänder MLflow den aktuella aktiva körningen. Därför behöver du inte ta bort mlflow.start_run() om du migrerar kod till Azure Machine Learning.

Kontrollera att jobbets miljö har MLflow installerat

Alla Azure Machine Learning-utvalda miljöer har redan MLflow installerat. Men om du använder en anpassad miljö skapar du en conda.yml fil som har de beroenden du behöver och refererar till miljön i ditt jobb.

channels:
- conda-forge
dependencies:
- python=3.8.5
- pip
- pip:
  - mlflow
  - azureml-mlflow
  - fastparquet
  - cloudpickle==1.6.0
  - colorama==0.4.4
  - dask==2023.2.0

Konfigurera jobbnamnet

Använd parametern display_name i Azure Machine Learning-jobb för att konfigurera namnet på körningen.

Använd egenskapen display_name för att konfigurera jobbet.

Azure CLI
Python SDK

För att konfigurera jobbet skapar du en YAML-fil med din jobbdefinition i en job.yml fil utanför src-katalogen .

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
command: echo "hello world"
environment:
  image: library/python:latest
tags:
  hello: world
display_name: hello-world-example
experiment_name: hello-world-example
description: |

from azure.ai.ml import command, Environment

command_job = command(
    code="src",
    command="echo "hello world",
    environment=Environment(image="library/python:latest"),
    compute="cpu-cluster",
    display_name="hello-world-example"
)

Se till att du inte använder mlflow.start_run(run_name="") i din träningsrutin.

Skicka jobbet

Arbetsytan är resursen på den översta nivån för Azure Machine Learning, vilket ger en central plats där du kan arbeta med alla Azure Machine Learning-artefakter som du skapar. Anslut till Azure Machine Learning-arbetsytan.

Azure CLI
Python SDK

az account set --subscription <subscription>
az configure --defaults workspace=<workspace> group=<resource-group> location=<location>

Importera de bibliotek som krävs:

from azure.ai.ml import MLClient
from azure.identity import DefaultAzureCredential

Konfigurera information om arbetsytan och få åtkomst till arbetsytan.

subscription_id = "<subscription>"
resource_group = "<resource-group>"
workspace = "<workspace>"

ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)

Öppna en terminal och använd följande kod för att skicka jobbet. Jobb som använder MLflow och körs på Azure Machine Learning loggar automatiskt all spårningsinformation till arbetsytan.
- Azure CLI
- Python SDK
Använd Azure Machine Learning CLI för att skicka ditt jobb.
```
az ml job create -f job.yml --web
```
Använd Python SDK för att skicka ditt jobb.
```
returned_job = ml_client.jobs.create_or_update(command_job)
returned_job.studio_url
```
Övervaka jobbframsteg i Azure Machine Learning Studio.

Aktivera automatisk MLflow-loggning

Du kan logga mått, parametrar och filer med MLflow manuellt, och du kan också förlita dig på MLflows automatiska loggningsfunktion. Varje maskininlärningsramverk som stöds av MLflow avgör vad som ska spåras automatiskt.

Om du vill aktivera automatisk loggning infogar du följande kod före träningskoden:

mlflow.autolog()

Visa mått och artefakter på din arbetsyta

Mätvärden och artefakter från loggar från MLflow spåras på din arbetsyta. Du kan visa och komma åt dem i Azure Machine Learning Studio eller komma åt dem programmatiskt med hjälp av MLflow SDK.

Så här visar du mått och artefakter i studion:

På sidan Jobb på arbetsytan väljer du experimentnamnet.
På sidan med experimentinformation väljer du fliken Mått .
Välj loggade mått för att återge diagram till höger på sidan. Du kan anpassa diagrammen genom att använda utjämning, ändra färg eller rita flera mått i en enda graf. Du kan också ändra storlek på och ordna om layouten.
När du har skapat den vy som du vill använda sparar du den för framtida användning och delar den med dina teammedlemmar med hjälp av en direktlänk.

Om du vill komma åt eller fråga efter mått, parametrar och artefakter programmatiskt med hjälp av MLflow SDK använder du mlflow.get_run().

import mlflow

run = mlflow.get_run("<RUN_ID>")

metrics = run.data.metrics
params = run.data.params
tags = run.data.tags

print(metrics, params, tags)

Tips/Råd

Föregående exempel returnerar endast det sista värdet för ett visst mått. Om du vill hämta alla värden för ett visst mått använder du mlflow.get_metric_history metoden. Mer information om hur du hämtar måttvärden finns i Hämta parametrar och mått från ett genomförande.

Om du vill ladda ned artefakter som du har loggat, till exempel filer och modeller, använd mlflow.artifacts.download_artifacts().

mlflow.artifacts.download_artifacts(run_id="<RUN_ID>", artifact_path="helloworld.txt")

Mer information om hur du hämtar eller jämför information från experiment och körs i Azure Machine Learning med hjälp av MLflow finns i Fråga och jämföra experiment och körningar med MLflow.

Feedback

Var den här sidan till hjälp?