Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Deze sectie bevat voorbeelden van het trainen van machine learning-modellen in Azure Databricks met behulp van veel populaire opensource-bibliotheken.
U kunt ook AutoML-gebruiken, waarmee automatisch een gegevensset wordt voorbereid voor modeltraining, een reeks proefversies wordt uitgevoerd met behulp van opensource-bibliotheken, zoals scikit-learn en XGBoost, en een Python-notebook wordt gemaakt met de broncode voor elke proefuitvoering, zodat u de code kunt bekijken, reproduceren en wijzigen.
Voorbeelden van machine learning
| Pakket | Notebook(s) | Functies |
|---|---|---|
| scikit-learn | Zelfstudie over machine learning | Unity Catalog, classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow |
| scikit-learn | End-to-end-voorbeeld | Unity Catalog, classificatiemodel, MLflow, geautomatiseerde afstemming van hyperparameters met Hyperopt en MLflow, XGBoost |
| MLlib | Voorbeelden van MLlib | Binaire classificatie, beslissingsstructuren, GBT-regressie, Gestructureerd streamen, aangepaste transformator |
| xgboost | XGBoost-voorbeelden | Python, PySpark en Scala, workloads met één knooppunt en gedistribueerde training |
Voorbeelden van hyperparameterafstemming
Zie Hyperparameter-afstemming voor algemene informatie over het afstemmen van hyperparameters in Azure Databricks.
| Pakket | Notebook | Functies |
|---|---|---|
| Optuna | Aan de slag met Optuna | Optuna, gedistribueerde Optuna, scikit-learn, MLflow |
| Hyperopt | Gedistribueerde hyperopt | Gedistribueerde hyperopt, scikit-learn, MLflow |
| Hyperopt | Modellen vergelijken | Gedistribueerde hyperopt gebruiken om hyperparameterruimte voor verschillende modeltypen tegelijk te doorzoeken |
| Hyperopt | Gedistribueerde trainingsalgoritmen en hyperopt | Hyperopt, MLlib |
| Hyperopt | Best practices voor Hyperopt | Aanbevolen procedures voor gegevenssets met verschillende grootten |