Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Använd AutoML för att automatiskt hitta den bästa prognosalgoritmen och hyperparameterkonfigurationen för att förutsäga värden baserat på tidsseriedata.
Prognostisering av tidsserier är endast tillgängligt för Databricks Runtime 10.0 ML eller senare.
Konfigurera prognosexperiment med användargränssnittet
Du kan konfigurera ett prognosproblem med autoML-användargränssnittet med följande steg:
- I sidofältet väljer du Experiment.
- På kortet Forecasting väljer du Starta träningen.
Prognosgränssnittet använder standardinställningarna serverlös prognostisering. Om du vill komma åt prognostisering med din egen beräkning väljer du återgå till den gamla upplevelsen.
Konfigurera AutoML-experimentet
Sidan Konfigurera AutoML-experiment visas. På den här sidan konfigurerar du AutoML-processen, anger datamängden, problemtypen, mål- eller etikettkolumnen som ska predikteras, det mått som ska användas för att utvärdera och bedöma experimentkörningarna, och stoppvillkor.
I fältet Compute väljer du ett kluster som kör Databricks Runtime 10.0 ML eller senare.
Under Datauppsättning klickar du på Bläddra. Gå till den tabell som du vill använda och klicka på Välj. Tabellschemat visas.
Klicka i fältet Förutsägelsemål . En rullgardinsmeny visas med de kolumner som visas i schemat. Välj den kolumn som du vill att modellen ska förutsäga.
Klicka i kolumnen Tid fältet. En listruta visas som visar de datauppsättningskolumner som är av typen
timestampellerdate. Välj kolumnen som innehåller tidsperioderna för tidsserierna.För flerserieprognoser väljer du de kolumner som identifierar de enskilda tidsserierna i listrutan tidsserieidentifierare. AutoML grupperar data efter dessa kolumner som olika tidsserier och tränar en modell för varje serie separat. Om du lämnar det här fältet tomt förutsätter AutoML att datamängden innehåller en enda tidsserie.
I fälten Prognoshorisont och frekvens anger du antalet tidsperioder i framtiden som AutoML ska beräkna prognostiserade värden för. I den vänstra rutan anger du det heltalsantal perioder som ska prognostiseras. I den högra rutan väljer du enheterna.
Kommentar
Om du vill använda Auto-ARIMA måste tidsserierna ha en regelbunden frekvens där intervallet mellan två punkter måste vara detsamma under hela tidsserien. Frekvensen måste matcha den frekvensenhet som anges i API-anropet eller i AutoML-användargränssnittet. AutoML hanterar saknade tidssteg genom att fylla i dessa värden med föregående värde.
I Databricks Runtime 11.3 LTS ML och senare kan du spara förutsägelseresultat. Det gör du genom att ange en databas i fältet Utdatadatabas . Klicka på Bläddra och välj en databas i dialogrutan. AutoML skriver förutsägelseresultatet till en tabell i den här databasen.
Fältet Experimentnamn visar standardnamnet. Om du vill ändra det skriver du det nya namnet i fältet.
Du kan även:
- Ange ytterligare konfigurationsalternativ.
- Använd befintliga funktionstabeller i Funktionsarkiv för att utöka den ursprungliga indatauppsättningen.
Avancerade konfigurationer
Öppna avsnittet Avancerad konfiguration (valfritt) för att få åtkomst till dessa parametrar.
- Utvärderingsmåttet är det primära måttet som används för att bedöma körningarna.
- I Databricks Runtime 10.4 LTS ML och senare kan du undanta träningsramverk från övervägande. Som standard tränar AutoML modeller med ramverk som anges under AutoML-algoritmer.
- Du kan redigera stoppvillkoren. Standardvillkor för stopp är:
- Stoppa efter 120 minuter för prognostiseringsexperiment.
- I Databricks Runtime 10.4 LTS ML och nedan ska du för klassificerings- och regressionsexperiment stoppa efter 60 minuter eller efter att ha slutfört 200 utvärderingsversioner, beroende på vilket som inträffar först. För Databricks Runtime 11.0 ML och senare används inte antalet utvärderingsversioner som ett stoppvillkor.
- I Databricks Runtime 10.4 LTS ML och senare, för klassificerings- och regressionsexperiment, innehåller AutoML tidig stoppning. den stoppar tränings- och justeringsmodeller om valideringsmåttet inte längre förbättras.
- I Databricks Runtime 10.4 LTS ML och senare kan du välja en
time columnför att dela upp data för träning, validering och testning i kronologisk ordning (gäller endast för klassificering och regression). - Databricks rekommenderar att datakatalogfältet lämnas tomt. Om du inte fyller i det här fältet utlöses standardbeteendet att lagra datamängden på ett säkert sätt som en MLflow-artefakt. En DBFS-sökväg kan anges, men i det här fallet ärver datauppsättningen inte AutoML-experimentets åtkomstbehörigheter.
Kör experimentet och övervaka resultaten
Starta AutoML-experimentet genom att klicka på Starta AutoML. Experimentet börjar köras och autoML-träningssidan visas. Om du vill uppdatera körningstabellen klickar du på knappen
.
Visa experiment förlopp
Från den här sidan kan du:
- Stoppa experimentet när som helst.
- Öppna notebook-filen för datautforskning.
- Övervaka körningar.
- Navigera till körningssidan för alla körningar.
Med Databricks Runtime 10.1 ML och senare visar AutoML varningar för potentiella problem med datauppsättningen, till exempel kolumntyper som inte stöds eller kolumner med hög kardinalitet.
Kommentar
Databricks gör sitt bästa för att indikera potentiella fel eller problem. Detta kanske dock inte är omfattande och kanske inte fångar upp de problem eller fel som du kanske söker efter.
Om du vill se varningar för datamängden klickar du på fliken Varningar på träningssidan eller på experimentsidan när experimentet har slutförts.
Visa resultat
När experimentet är klart kan du:
- Registrera och distribuera en av modellerna med MLflow.
- Välj Visa anteckningsbok för den bästa modellen för att granska och redigera anteckningsboken som skapade den bästa modellen.
- Välj Öppna datautforskningsnotebooken för att öppna den.
- Sök, filtrera och sortera körningarna i körningstabellen.
- Se information om alla körningar:
- Du hittar den genererade notebook-filen som innehåller källkod för en utvärderingskörning genom att klicka på MLflow-körningen. Anteckningsboken sparas i avsnittet Artefakter på körningssidan. Du kan ladda ned den här notebook-filen och importera den till arbetsytan om du har aktiverat nedladdning av artefakter av arbetsyteadministratörerna.
- Om du vill visa körningsresultatet klickar du i kolumnen Modeller eller kolumnen starttid. Körningssidan visas med information om utvärderingskörningen (till exempel parametrar, mått och taggar) och artefakter som skapats av körningen, inklusive modellen. Den här sidan innehåller även kodfragment som du kan använda för att göra förutsägelser med modellen.
Om du vill återgå till autoML-experimentet senare hittar du det i tabellen på sidan Experiment. Resultatet av varje AutoML-experiment, inklusive datautforsknings- och träningsanteckningsböckerna, lagras i en databricks_automl mapp i hemmappen för den användare som körde experimentet.
Registrera och distribuera en modell
Registrera och distribuera din modell med autoML-användargränssnittet. När en körning är klar visar den översta raden den bästa modellen baserat på det primära måttet.
- Välj länken i kolumnen Modeller för den modell som du vill registrera.
- Välj
för att registrera den i Unity Catalog eller Model Registry.
Kommentar
Databricks rekommenderar att du registrerar modeller i Unity Catalog för de senaste funktionerna.
- Efter registreringen kan du distribuera modellen till en anpassad modell som betjänar slutpunkten.
Ingen modul med namnet 'pandas.core.indexes.numeric
När du hanterar en modell som skapats med AutoML med modellservering kan du få felet: No module named 'pandas.core.indexes.numeric.
Detta beror på en inkompatibel pandas version mellan AutoML och modellen som betjänar slutpunktsmiljön. Du kan lösa det här felet genom att köra skriptet add-pandas-dependency.py. Skriptet redigerar requirements.txt och conda.yaml för din loggade modell så att den innehåller rätt pandas beroendeversion: pandas==1.5.3
- Ändra skriptet så att det innehåller
run_idför MLflow-körningen där din modell loggades. - Registrera om modellen till Unity Catalog eller modellregistret.
- Prova att hantera den nya versionen av MLflow-modellen.