Dela via


Använda scikit-learn i Azure Databricks

Den här sidan innehåller exempel på hur du kan använda scikit-learn paketet för att träna maskininlärningsmodeller i Azure Databricks. scikit-learn är ett av de mest populära Python-biblioteken för maskininlärning med en nod och ingår i Databricks Runtime och Databricks Runtime ML. Se Databricks Runtime versionsinformation för scikit-learn-biblioteksversionen som ingår i klustrets runtime.

Du kan importera dessa notebook-filer och köra dem på din Azure Databricks-arbetsyta.

Grundläggande exempel med scikit-learn

Den här notebook-filen ger en snabb översikt över maskininlärningsmodellträning i Azure Databricks. Det använder paketet scikit-learn för att träna en enkel klassificeringsmodell. Det illustrerar också användningen av MLflow för att spåra modellutvecklingsprocessen och Optuna för att automatisera justering av hyperparametrar.

Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

scikit-learn-klassificeringsanteckningsbok (Unity Catalog)

Hämta notebook-fil

Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

scikit-learn-klassificeringsanteckningsbok

Hämta notebook-fil

Exempel från slutpunkt till slutpunkt med scikit-learn i Azure Databricks

Den här notebook-filen använder scikit-learn för att illustrera ett komplett exempel från slutpunkt till slutpunkt på inläsning av data, modellträning, distribuerad hyperparameterjustering och modellinferens. Den illustrerar också modelllivscykelhantering med MLflow Model Registry för att logga och registrera din modell.

Om din arbetsyta är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

Använda scikit-learn med MLflow-integrering på Databricks (Unity Catalog)

Hämta notebook-fil

Om arbetsytan inte är aktiverad för Unity Catalog använder du den här versionen av notebook-filen:

Använda scikit-learn med MLflow-integrering på Databricks

Hämta notebook-fil