Dela via


SKLearn Klass

Skapar en estimator för träning i Scikit-learn-experiment.

DEPRECATED. Använd objektet ScriptRunConfig med din egen definierade miljö eller den AzureML-Tutorial kuraterade miljön. En introduktion till att konfigurera SKLearn-experimentkörningar med ScriptRunConfig finns i Träna scikit-learn-modeller i stor skala med Azure Machine Learning.

Den här uppskattningen stöder endast cpu-träning med en nod.

Versioner som stöds: 0.20.3

Initiera en Scikit-learn-skattare.

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parametrar

Name Description
source_directory
Obligatorisk
str

En lokal katalog som innehåller experimentkonfigurationsfiler.

compute_target
Obligatorisk

Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett objekt eller strängen "lokal".

vm_size
Obligatorisk
str

Vm-storleken på beräkningsmålet som ska skapas för träningen.

Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
Obligatorisk
str

Den virtuella datorns prioritet för det beräkningsmål som ska skapas för träningen. Om det inte anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta börjar gälla endast när vm_size param anges i indata.

entry_script
Obligatorisk
str

En sträng som representerar den relativa sökvägen till filen som används för att starta träningen.

script_params
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till ditt träningsskript som anges i entry_script.

custom_docker_image
Obligatorisk
str

Namnet på Docker-avbildningen som avbildningen ska använda för träning skapas från. Om den inte har angetts används en standard-CPU-baserad avbildning som basavbildning.

image_registry_details
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. False innebär att AzureML skapar en Python-miljö baserat på conda-beroendespecifikationen.

conda_packages
Obligatorisk

En lista över strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
Obligatorisk

En lista över strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
Obligatorisk
str

En sträng som representerar den relativa sökvägen till yaml-filen conda-beroenden. Om det anges kommer Azure ML inte att installera några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages . DEPRECATED. Använd parametern conda_dependencies_file .

pip_requirements_file_path
Obligatorisk
str

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages . DEPRECATED. Använd parametern pip_requirements_file .

conda_dependencies_file
Obligatorisk
str

En sträng som representerar den relativa sökvägen till yaml-filen conda-beroenden. Om det anges kommer Azure ML inte att installera några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages .

pip_requirements_file
Obligatorisk
str

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages .

environment_variables
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i den process där användarskript körs.

environment_definition
Obligatorisk

Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av environment_definition parametern. Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras ogiltiga kombinationer.

inputs
Obligatorisk

En lista över DataReference eller DatasetConsumptionConfig objekt som ska användas som indata.

shm_size
Obligatorisk
str

Storleken på Docker-containerns delade minnesblock. Om den inte har angetts används standard azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
Obligatorisk

Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från.

max_run_duration_seconds
Obligatorisk
int

Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet.

framework_version
Obligatorisk
str

Scikit-learn-versionen som ska användas för att köra träningskod. SKLearn.get_supported_versions() returnerar en lista över de versioner som stöds av det aktuella SDK:et.

source_directory
Obligatorisk
str

En lokal katalog som innehåller experimentkonfigurationsfiler.

compute_target
Obligatorisk

Beräkningsmålet där träningen ska ske. Detta kan antingen vara ett objekt eller strängen "lokal".

vm_size
Obligatorisk
str

Vm-storleken på beräkningsmålet som ska skapas för träningen. Värden som stöds: Valfri storlek på virtuella Azure-datorer.

vm_priority
Obligatorisk
str

Den virtuella datorns prioritet för det beräkningsmål som ska skapas för träningen. Om det inte anges används "dedikerad".

Värden som stöds: "dedikerad" och "lågprioritet".

Detta börjar gälla endast när vm_size param anges i indata.

entry_script
Obligatorisk
str

En sträng som representerar den relativa sökvägen till filen som används för att starta träningen.

script_params
Obligatorisk

En ordlista med kommandoradsargument som ska skickas till ditt träningsskript som anges i entry_script.

use_docker
Obligatorisk

Ett bool-värde som anger om miljön som ska köra experimentet ska vara Docker-baserad.

custom_docker_image
Obligatorisk
str

Namnet på Docker-avbildningen som avbildningen ska använda för träning skapas från. Om den inte har angetts används en cpu-baserad standardavbildning som basavbildning.

image_registry_details
Obligatorisk

Information om Docker-avbildningsregistret.

user_managed
Obligatorisk

Anger om Azure ML återanvänder en befintlig Python-miljö. False innebär att AzureML skapar en Python-miljö baserat på conda-beroendespecifikationen.

conda_packages
Obligatorisk

En lista över strängar som representerar conda-paket som ska läggas till i Python-miljön för experimentet.

pip_packages
Obligatorisk

En lista över strängar som representerar pip-paket som ska läggas till i Python-miljön för experimentet.

conda_dependencies_file_path
Obligatorisk
str

En sträng som representerar den relativa sökvägen till yaml-filen conda-beroenden. Om det anges kommer Azure ML inte att installera några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages . DEPRECATED. Använd parametern conda_dependencies_file .

pip_requirements_file_path
Obligatorisk
str

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages . DEPRECATED. Använd parametern pip_requirements_file .

conda_dependencies_file
Obligatorisk
str

En sträng som representerar den relativa sökvägen till yaml-filen conda-beroenden. Om det anges kommer Azure ML inte att installera några ramverksrelaterade paket. Detta kan anges i kombination med parametern conda_packages .

pip_requirements_file
Obligatorisk
str

En sträng som representerar den relativa sökvägen till textfilen pip-krav. Detta kan anges i kombination med parametern pip_packages .

environment_variables
Obligatorisk

En ordlista med miljövariablers namn och värden. Dessa miljövariabler anges i den process där användarskript körs.

environment_definition
Obligatorisk

Miljödefinitionen för ett experiment innehåller PythonSection, DockerSection och miljövariabler. Alla miljöalternativ som inte exponeras direkt via andra parametrar för beräkningskonstruktionen kan anges med hjälp av environment_definition parametern. Om den här parametern anges har den företräde framför andra miljörelaterade parametrar som use_gpu, custom_docker_image, conda_packageseller pip_packages. Fel rapporteras ogiltiga kombinationer.

inputs
Obligatorisk

En lista över azureml.data.data_reference. DataReference-objekt som ska användas som indata.

shm_size
Obligatorisk
str

Storleken på Docker-containerns delade minnesblock. Om den inte har angetts används standard azureml.core.environment._DEFAULT_SHM_SIZE.

resume_from
Obligatorisk

Datasökvägen som innehåller kontrollpunkten eller modellfilerna som experimentet ska återupptas från.

max_run_duration_seconds
Obligatorisk
int

Den maximala tillåtna tiden för körningen. Azure ML försöker automatiskt avbryta körningen om det tar längre tid än det här värdet.

framework_version
Obligatorisk
str

Scikit-learn-versionen som ska användas för att köra träningskod. SKLearn.get_supported_versions() returnerar en lista över de versioner som stöds av det aktuella SDK:et.

_enable_optimized_mode
Obligatorisk

Aktivera inkrementell miljöversion med fördefinierade ramverksbilder för snabbare förberedelse av miljön. En fördefinierad ramverksavbildning bygger på Azure ML-standard-CPU/GPU-basavbildningar med förinstallerade ramverksberoenden.

_disable_validation
Obligatorisk

Inaktivera skriptverifiering innan du kör sändningen. Standardvärdet är Sant.

_show_lint_warnings
Obligatorisk

Visa varningar för skriptlintning. Standardvärdet är False.

_show_package_warnings
Obligatorisk

Visa paketverifieringsvarningar. Standardvärdet är False.

Kommentarer

När du skickar ett träningsjobb kör Azure ML skriptet i en conda-miljö i en Docker-container. SKLearn-containrar har följande beroenden installerade.

Beroenden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Senaste | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Docker-avbildningarna utökar Ubuntu 16.04.

Om du behöver installera ytterligare beroenden kan du antingen använda parametrarna pip_packages eller conda_packages eller ange din pip_requirements_file eller conda_dependencies_file filen. Du kan också skapa en egen avbildning och skicka parametern custom_docker_image till beräkningskonstruktorn.

Attribut

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'