Prognostisering (serverlös) med AutoML

2025-04-09

Viktig

Den här funktionen finns i offentlig förhandsversion.

Den här artikeln visar hur du kör ett serverlöst prognosexperiment med hjälp av mosaic AI Model Training-användargränssnittet.

Mosaic AI Model Training – prognostisering förenklar prognostisering av tidsseriedata genom att automatiskt välja den bästa algoritmen och hyperparametrar, allt medan det körs på fullständigt hanterade beräkningsresurser.

Information om skillnaden mellan serverlös prognostisering och klassisk beräkningsprognos finns i Serverless forecasting vs. classic compute forecasting.

Krav

Träningsdata med en tidsseriekolumn, sparad som en Unity Catalog-tabell.

Om arbetsytan har aktiverat Secure Egress Gateway (SEG), måste pypi.org läggas till i listan över Tillåtna domäner . Se Hantera nätverksprinciper för serverlös utgående kontroll.

Skapa ett prognosexperiment med användargränssnittet

Gå till din Azure Databricks-landningssida och klicka på Experiment i sidofältet.

I panelen Forecasting väljer du Starta träning.
Välj Träningsdata från en lista över Unity Catalog-tabeller som du kan komma åt.
- Kolumnen Tid: Välj kolumnen som innehåller tidsperioderna för tidsserierna. Kolumnerna måste vara av typen timestamp eller date.
- Prognosfrekvens: Välj den tidsenhet som representerar dina indatas frekvens. Till exempel minuter, timmar, dagar, månader. Detta avgör kornigheten för din tidsserie.
- Prognoshorisont: Ange hur många enheter av den valda frekvensen som ska prognostiseras in i framtiden. Tillsammans med prognosfrekvensen definierar detta både tidsenheterna och antalet tidsenheter som ska prognostiseras.
Obs

Om du vill använda algoritmen Auto-ARIMA måste tidsserien ha en regelbunden frekvens där intervallet mellan två punkter måste vara detsamma under hela tidsserien. AutoML hanterar saknade tidssteg genom att fylla i dessa värden med föregående värde.
Välj en förutsägelsemålkolumn som du vill att modellen ska förutsäga.
Du kan också ange en Unity Catalog-tabell Prognosdataväg för att lagra det resulterande prognosdata.
Välj en plats och ett namn för registreringen av modellen, Unity Catalog.
Du kan också ange Avancerade alternativ:
- Experimentnamn: Ange ett MLflow-experimentnamn.
- Kolumner för tidsserieidentifierare – För prognostisering i flera serier väljer du de kolumner som identifierar den enskilda tidsserien. Databricks grupperar data efter dessa kolumner som olika tidsserier och tränar en modell för varje serie oberoende av varandra.
- Primärt mått: Välj det primära mått som används för att utvärdera och välj den bästa modellen.
- Training Framework: Välj de ramverk som AutoML ska utforska.
- Dela kolumn: Välj den kolumn som innehåller anpassad datadelning. Värden måste vara "train", "validate", "test"
- Weight column: Ange vilken kolumn som ska användas för viktning av tidsserier. Alla prover för en viss tidsserie måste ha samma vikt. Vikten måste ligga inom intervallet [0, 10000].
- Semesterregion: Välj den semesterregion som ska användas som samvariat i modellträningen.
- Timeout: Ange en maximal varaktighet för AutoML-experimentet.

Kör experimentet och övervaka resultaten

Starta AutoML-experimentet genom att klicka på Starta träning. Från experimentträningssidan kan du göra följande:

Stoppa experimentet när som helst.
Övervaka processer.
Navigera till körningssidan för valfri körning.

Dessutom kan du kontrollera statusen för experimentet när det går igenom följande steg:

Förbehandling: Verifiera och förbereda indatatabellen genom att imputera saknade värden och dela upp data i tränings-, validerings- och testuppsättningar. Automatisk bearbetning av egenskapsgenerering, till exempel one-hot-kodning för kategoriska egenskaper, sker också under den här fasen.
Tuning: Utforska olika prognosalgoritmer och finjustera hyperparametrar.
Träning: Träna och utvärdera den slutliga modellen med de bästa konfigurationerna. Registrera modellen i Unity Catalog om en sökväg har angetts.

Visa resultat eller använd den bästa modellen

När träningen har slutförts lagras förutsägelseresultaten i den angivna Delta-tabellen och den bästa modellen registreras i Unity Catalog.

På sidan experiment väljer du följande steg:

Välj Visa förutsägelser för att se tabellen med prognosresultat.
Välj batchinferens-notebook för att öppna ett automatiskt genererat anteckningsblock för batchinferensprocessen med hjälp av den bästa modellen.
Välj Skapa serverdelsslutpunkt för att distribuera den bästa modellen till en modellserverslutpunkt.

Serverlös prognostisering jämfört med klassisk beräkningsprognos

I följande tabell sammanfattas skillnaderna mellan serverlös prognostisering och prognostisering med klassisk beräkning

Funktion	Serverlös prognos	Klassisk beräkningsprognos
Beräkningsinfrastruktur	Azure Databricks hanterar beräkningskonfigurationen och optimerar automatiskt för kostnader och prestanda.	Användarkonfigurerad beräkning
Styrelseskick	Modeller och artefakter som registrerats i Unity Catalog	Användarkonfigurerat lagringsutrymme för arbetsytefiler
Algoritmval	Statistiska modeller plus algoritmen för neuralt nät för djupinlärning DeepAR	Statistiska modeller
Integrering av funktionellt datalager	Stöds inte	stöds
Automatiskt genererade anteckningsböcker	Anteckningsbok för batchslutsatser	Källkod för alla utvärderingsversioner
En-klicksmodell för distribution	Understödd	Ej stödd
Anpassade tränings-/validerings-/testuppdelningar	Understödd	Stöds inte
Anpassade vikter för enskilda tidsserier	Understödd	Stöds inte

Feedback

Var den här sidan till hjälp?