Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Viktig
Den här funktionen finns i offentlig förhandsversion.
Den här artikeln visar hur du kör ett serverlöst prognosexperiment med hjälp av mosaic AI Model Training-användargränssnittet.
Mosaic AI Model Training – prognostisering förenklar prognostisering av tidsseriedata genom att automatiskt välja den bästa algoritmen och hyperparametrar, allt medan det körs på fullständigt hanterade beräkningsresurser.
Information om skillnaden mellan serverlös prognostisering och klassisk beräkningsprognos finns i Serverless forecasting vs. classic compute forecasting.
Krav
- Träningsdata med en tidsseriekolumn, sparad som en Unity Catalog-tabell.
- Om arbetsytan har aktiverat Secure Egress Gateway (SEG), måste
pypi.orgläggas till i listan över Tillåtna domäner . Se Hantera nätverksprinciper för serverlös utgående kontroll.
Skapa ett prognosexperiment med användargränssnittet
Gå till din Azure Databricks-landningssida och klicka på Experiment i sidofältet.
I panelen Forecasting väljer du Starta träning.
Välj Träningsdata från en lista över Unity Catalog-tabeller som du kan komma åt.
-
Kolumnen Tid: Välj kolumnen som innehåller tidsperioderna för tidsserierna. Kolumnerna måste vara av typen
timestampellerdate. - Prognosfrekvens: Välj den tidsenhet som representerar dina indatas frekvens. Till exempel minuter, timmar, dagar, månader. Detta avgör kornigheten för din tidsserie.
- Prognoshorisont: Ange hur många enheter av den valda frekvensen som ska prognostiseras in i framtiden. Tillsammans med prognosfrekvensen definierar detta både tidsenheterna och antalet tidsenheter som ska prognostiseras.
Obs
Om du vill använda algoritmen Auto-ARIMA måste tidsserien ha en regelbunden frekvens där intervallet mellan två punkter måste vara detsamma under hela tidsserien. AutoML hanterar saknade tidssteg genom att fylla i dessa värden med föregående värde.
-
Kolumnen Tid: Välj kolumnen som innehåller tidsperioderna för tidsserierna. Kolumnerna måste vara av typen
Välj en förutsägelsemålkolumn som du vill att modellen ska förutsäga.
Du kan också ange en Unity Catalog-tabell Prognosdataväg för att lagra det resulterande prognosdata.
Välj en plats och ett namn för registreringen av modellen, Unity Catalog.
Du kan också ange Avancerade alternativ:
- Experimentnamn: Ange ett MLflow-experimentnamn.
- Kolumner för tidsserieidentifierare – För prognostisering i flera serier väljer du de kolumner som identifierar den enskilda tidsserien. Databricks grupperar data efter dessa kolumner som olika tidsserier och tränar en modell för varje serie oberoende av varandra.
- Primärt mått: Välj det primära mått som används för att utvärdera och välj den bästa modellen.
- Training Framework: Välj de ramverk som AutoML ska utforska.
- Dela kolumn: Välj den kolumn som innehåller anpassad datadelning. Värden måste vara "train", "validate", "test"
- Weight column: Ange vilken kolumn som ska användas för viktning av tidsserier. Alla prover för en viss tidsserie måste ha samma vikt. Vikten måste ligga inom intervallet [0, 10000].
- Semesterregion: Välj den semesterregion som ska användas som samvariat i modellträningen.
- Timeout: Ange en maximal varaktighet för AutoML-experimentet.
Kör experimentet och övervaka resultaten
Starta AutoML-experimentet genom att klicka på Starta träning. Från experimentträningssidan kan du göra följande:
- Stoppa experimentet när som helst.
- Övervaka processer.
- Navigera till körningssidan för valfri körning.
Dessutom kan du kontrollera statusen för experimentet när det går igenom följande steg:
- Förbehandling: Verifiera och förbereda indatatabellen genom att imputera saknade värden och dela upp data i tränings-, validerings- och testuppsättningar. Automatisk bearbetning av egenskapsgenerering, till exempel one-hot-kodning för kategoriska egenskaper, sker också under den här fasen.
- Tuning: Utforska olika prognosalgoritmer och finjustera hyperparametrar.
- Träning: Träna och utvärdera den slutliga modellen med de bästa konfigurationerna. Registrera modellen i Unity Catalog om en sökväg har angetts.
Visa resultat eller använd den bästa modellen
När träningen har slutförts lagras förutsägelseresultaten i den angivna Delta-tabellen och den bästa modellen registreras i Unity Catalog.
På sidan experiment väljer du följande steg:
- Välj Visa förutsägelser för att se tabellen med prognosresultat.
- Välj batchinferens-notebook för att öppna ett automatiskt genererat anteckningsblock för batchinferensprocessen med hjälp av den bästa modellen.
- Välj Skapa serverdelsslutpunkt för att distribuera den bästa modellen till en modellserverslutpunkt.
Serverlös prognostisering jämfört med klassisk beräkningsprognos
I följande tabell sammanfattas skillnaderna mellan serverlös prognostisering och prognostisering med klassisk beräkning
| Funktion | Serverlös prognos | Klassisk beräkningsprognos |
|---|---|---|
| Beräkningsinfrastruktur | Azure Databricks hanterar beräkningskonfigurationen och optimerar automatiskt för kostnader och prestanda. | Användarkonfigurerad beräkning |
| Styrelseskick | Modeller och artefakter som registrerats i Unity Catalog | Användarkonfigurerat lagringsutrymme för arbetsytefiler |
| Algoritmval | Statistiska modeller plus algoritmen för neuralt nät för djupinlärning DeepAR | Statistiska modeller |
| Integrering av funktionellt datalager | Stöds inte | stöds |
| Automatiskt genererade anteckningsböcker | Anteckningsbok för batchslutsatser | Källkod för alla utvärderingsversioner |
| En-klicksmodell för distribution | Understödd | Ej stödd |
| Anpassade tränings-/validerings-/testuppdelningar | Understödd | Stöds inte |
| Anpassade vikter för enskilda tidsserier | Understödd | Stöds inte |