Delen via


core Pakket

Bevat kernfunctionaliteit voor Azure Machine Learning-pijplijnen, die configureerbare machine learning-werkstromen zijn.

Met Azure Machine Learning-pijplijnen kunt u herbruikbare machine learning-werkstromen maken die kunnen worden gebruikt als sjabloon voor uw machine learning-scenario's. Dit pakket bevat de kernfunctionaliteit voor het werken met Azure ML-pijplijnen en wordt doorgaans samen met de klassen in het steps pakket gebruikt.

Een machine learning-pijplijn wordt vertegenwoordigd door een verzameling PipelineStep objecten die kunnen worden gesequentieerd en parallelliseerd, of worden gemaakt met expliciete afhankelijkheden tussen stappen. Pijplijnstappen worden gebruikt om een Pipeline object te definiëren dat de werkstroom vertegenwoordigt die moet worden uitgevoerd. U kunt pijplijnen maken en gebruiken in een Jupyter Notebook of een andere IDE waarop de Azure ML SDK is geïnstalleerd.

Met Azure ML-pijplijnen kunt u zich richten op machine learning in plaats van infrastructuur. Als u aan de slag wilt gaan met het bouwen van een pijplijn, raadpleegt u https://aka.ms/pl-first-pipeline.

Zie Wat zijn ML-pijplijnen in Azure Machine Learning Service voor meer informatie over de voordelen van de Machine Learning-pijplijn en hoe deze is gerelateerd aan andere pijplijnen die door Azure worden aangeboden?

Modules

builder

Definieert klassen voor het bouwen van een Azure Machine Learning-pijplijn.

Een pijplijngrafiek bestaat uit pijplijnstappen (PipelineStep), optionele pijplijngegevens (PipelineData) die in elke stap worden geproduceerd of gebruikt en een optionele uitvoeringsvolgorde voor stappen (StepSequence).

graph

Definieert klassen voor het maken van Azure Machine Learning-pijplijngrafieken.

Azure ML-pijplijngrafieken worden gemaakt voor Pipeline objecten, wanneer u (en afgeleide klassen) PipelineStepen PipelineData objecten gebruikt PipelineData . In typische gebruiksvoorbeelden hoeft u de klassen in deze module niet rechtstreeks te gebruiken.

Een pijplijnuitvoeringsgrafiek bestaat uit moduleknooppunten die basiseenheden vertegenwoordigen, zoals een gegevensbron of stap. Knooppunten kunnen invoerpoorten en uitvoerpoorten en bijbehorende parameters hebben. Randen definiëren relaties tussen twee knooppuntpoorten in een grafiek.

module

Bevat klassen voor het maken en beheren van herbruikbare rekeneenheden van een Azure Machine Learning-pijplijn.

Met modules kunt u rekeneenheden maken in een Pipeline, die invoer, uitvoer en afhankelijk kan zijn van parameters en een omgevingsconfiguratie die moet worden uitgevoerd. Een module kan worden versiebeheer en worden gebruikt in verschillende Azure Machine Learning-pijplijnen in tegenstelling tot PipelineStep (en afgeleide klassen) die in één pijplijn worden gebruikt.

Modules zijn ontworpen om opnieuw te worden gebruikt in verschillende pijplijnen en kunnen zich ontwikkelen om een specifieke rekenlogica aan te passen voor verschillende use cases. Een stap in een pijplijn kan worden gebruikt in snelle iteraties om een algoritme te verbeteren en zodra het doel is bereikt, wordt het algoritme meestal gepubliceerd als een module om hergebruik mogelijk te maken.

module_step_base

Bevat functionaliteit om een stap toe te voegen aan een pijplijn met behulp van een versie van een Module.

pipeline

Definieert de klasse voor het maken van herbruikbare Azure Machine Learning-werkstromen.

pipeline_draft

Definieert klassen voor het beheren van onveranderbare pijplijnen.

pipeline_endpoint

Definieert klassen voor het beheren van pijplijnen, waaronder versiebeheer en eindpunten.

pipeline_output_dataset

Bevat functionaliteit voor het promoten van een tussenliggende uitvoer naar een Azure Machine Learning-gegevensset.

Tussenliggende gegevens (uitvoer) in een pijplijn worden standaard geen Azure Machine Learning-gegevensset. Als u tussenliggende gegevens wilt promoveren naar een Azure Machine Learning-gegevensset, roept u de as_dataset methode in de PipelineData-klasse aan om een PipelineOutputFileDataset object te retourneren. Vanuit een PipelineOutputFileDataset-object kunt u vervolgens een PipelineOutputTabularDataset object maken.

run

Definieert klassen voor ingediende pijplijnen, inclusief klassen voor het controleren van de status en het ophalen van uitvoeringsdetails.

schedule

Definieert klassen voor het plannen van verzendingen van Azure Machine Learning-pijplijnen.

Klassen

InputPortBinding

Definieert een binding van een bron naar een invoer van een pijplijnstap.

Een InputPortBinding kan worden gebruikt als invoer voor een stap. De bron kan een PipelineData, PortDataReference, DataReferenceof PipelineDataset.OutputPortBinding

InputPortBinding is handig om de naam van de stapinvoer op te geven, als deze anders moet zijn dan de naam van het bindingsobject (dat wil bijvoorbeeld om dubbele invoer-/uitvoernamen te voorkomen of omdat het stapscript een invoer nodig heeft om een bepaalde naam te hebben). Het kan ook worden gebruikt om de bind_mode voor PythonScriptStep invoer op te geven.

Initialiseer InputPortBinding.

Module

Vertegenwoordigt een rekeneenheid die wordt gebruikt in een Azure Machine Learning-pijplijn.

Een module is een verzameling bestanden die worden uitgevoerd op een rekendoel en een beschrijving van een interface. De verzameling bestanden kan scripts, binaire bestanden of andere bestanden zijn die nodig zijn om uit te voeren op het rekendoel. In de module-interface worden invoer-, uitvoer- en parameterdefinities beschreven. Ze worden niet gekoppeld aan specifieke waarden of gegevens. Aan een module is een momentopname gekoppeld, waarmee de verzameling bestanden wordt vastgelegd die zijn gedefinieerd voor de module.

Initialiseer module.

ModuleVersion

Vertegenwoordigt de werkelijke rekeneenheid binnen een Module.

U mag deze klasse niet rechtstreeks gebruiken. Gebruik in plaats daarvan een van de publicatiemethoden van de Module klasse.

Initialiseer ModuleVersion.

ModuleVersionDescriptor

Definieert de versie en id van een ModuleVersion.

Initialiseer ModuleVersionDescriptor.

OutputPortBinding

Definieert een benoemde uitvoer van een pijplijnstap.

OutputPortBinding kan worden gebruikt om het type gegevens op te geven dat door een stap wordt geproduceerd en hoe de gegevens worden geproduceerd. Deze kan worden gebruikt om InputPortBinding op te geven dat de stapuitvoer een vereiste invoer van een andere stap is.

Initialiseer OutputPortBinding.

Pipeline

Vertegenwoordigt een verzameling stappen die kunnen worden uitgevoerd als een herbruikbare Azure Machine Learning-werkstroom.

Gebruik een pijplijn om werkstromen te maken en te beheren die verschillende machine learning-fasen samenvoegen. Elke machine learning-fase, zoals gegevensvoorbereiding en modeltraining, kan bestaan uit een of meer stappen in een pijplijn.

Zie voor een overzicht van waarom en wanneer pijplijnen https://aka.ms/pl-conceptmoeten worden gebruikt.

Zie voor een overzicht van het maken van een pijplijn https://aka.ms/pl-first-pipeline.

Initialiseer de pijplijn.

PipelineData

Vertegenwoordigt tussenliggende gegevens in een Azure Machine Learning-pijplijn.

Gegevens die in de pijplijn worden gebruikt, kunnen in één stap worden geproduceerd en in een andere stap worden gebruikt door een PipelineData-object op te geven als uitvoer van één stap en een invoer van een of meer volgende stappen.

Als u de pijplijngegevens gebruikt, controleert u of de gebruikte map bestaat.

Een Python-voorbeeld om ervoor te zorgen dat de map bestaat, stel dat u een uitvoerpoort hebt met de naam output_folder in één pijplijnstap. U wilt enkele gegevens naar het relatieve pad in deze map schrijven.


   import os
   os.makedirs(args.output_folder, exist_ok=True)
   f = open(args.output_folder + '/relative_path/file_name', 'w+')

PipelineData gebruikt DataReference-onderliggende gegevens die niet langer de aanbevolen benadering voor gegevenstoegang en -levering is. Gebruik in plaats daarvan OutputFileDatasetConfig . Hier vindt u een voorbeeld: Pipeline using OutputFileDatasetConfig.

Initialiseer PipelineData.

PipelineDataset

Fungeert als een adapter voor gegevensset en pijplijn.

Opmerking

Deze klasse is afgeschaft. Meer informatie over het gebruik van gegevenssets met pijplijn, zie https://aka.ms/pipeline-with-dataset.

Dit is een interne klasse. U moet deze klasse niet rechtstreeks maken, maar de as_*-exemplaarmethoden aanroepen voor de gegevensset of de OutputDatasetConfig-klassen.

Fungeren als een adapter voor gegevensset en pijplijn.

Dit is een interne klasse. U moet deze klasse niet rechtstreeks maken, maar de as_*-exemplaarmethoden aanroepen voor de gegevensset of de OutputDatasetConfig-klassen.

PipelineDraft

Vertegenwoordigt een veranderlijke pijplijn die kan worden gebruikt voor het verzenden van uitvoeringen en het maken van gepubliceerde pijplijnen.

Gebruik PipelineDrafts om pijplijnen te herhalen. PipelineDrafts kunnen helemaal opnieuw worden gemaakt, een andere PipelineDraft of bestaande pijplijnen: Pipeline, PublishedPipelineof PipelineRun.

Initialiseer PipelineDraft.

PipelineEndpoint

Vertegenwoordigt een Pipeline werkstroom die kan worden geactiveerd vanuit een unieke eindpunt-URL.

PipelineEndpoints kunnen worden gebruikt om nieuwe versies van een te PublishedPipeline maken terwijl hetzelfde eindpunt wordt onderhouden. PipelineEndpoints hebben een unieke naam binnen een werkruimte.

Met behulp van het eindpuntkenmerk van een PipelineEndpoint-object kunt u nieuwe pijplijnuitvoeringen activeren vanuit externe toepassingen met REST-aanroepen. Zie voor meer informatie over het verifiëren bij het aanroepen van REST-eindpunten https://aka.ms/pl-restep-auth.

Zie voor meer informatie over het maken en uitvoeren van machine learning-pijplijnen https://aka.ms/pl-first-pipeline.

Initialiseer PipelineEndpoint.

PipelineParameter

Definieert een parameter in een pijplijnuitvoering.

Gebruik PipelineParameters om veelzijdige pijplijnen te maken die later opnieuw kunnen worden ingediend met verschillende parameterwaarden.

Initialiseer pijplijnparameters.

PipelineRun

Vertegenwoordigt een uitvoering van een Pipeline.

Deze klasse kan worden gebruikt voor het beheren, controleren van de status en het ophalen van uitvoeringsdetails zodra een pijplijnuitvoering is verzonden. Hiermee get_steps haalt u de StepRun objecten op die zijn gemaakt door de pijplijnuitvoering. Andere toepassingen zijn onder andere het ophalen van het Graph object dat is gekoppeld aan de pijplijnuitvoering, het ophalen van de status van de pijplijnuitvoering en het wachten op voltooiing van de uitvoering.

Initialiseer een pijplijnuitvoering.

PipelineStep

Vertegenwoordigt een uitvoeringsstap in een Azure Machine Learning-pijplijn.

Pijplijnen worden samengesteld uit meerdere pijplijnstappen, die afzonderlijke rekeneenheden in de pijplijn zijn. Elke stap kan onafhankelijk worden uitgevoerd en geïsoleerde rekenresources gebruiken. Elke stap heeft doorgaans een eigen benoemde invoer, uitvoer en parameters.

De klasse PipelineStep is de basisklasse waaruit andere ingebouwde stapklassen zijn ontworpen voor veelvoorkomende scenario's, zoals PythonScriptStep, DataTransferStepen HyperDriveStep.

Zie Wat zijn ML-pijplijnen voor een overzicht van de relatie tussen pijplijnen en pipelineSteps.

Initialiseer PipelineStep.

PortDataReference

Modelgegevens die zijn gekoppeld aan een uitvoer van een voltooide StepRun.

Een PortDataReference-object kan worden gebruikt om de uitvoergegevens te downloaden die zijn geproduceerd door een StepRun. Het kan ook worden gebruikt als stapinvoer in een toekomstige pijplijn.

Initialiseer PortDataReference.

PublishedPipeline

Vertegenwoordigt een pijplijn die moet worden verzonden zonder de Python-code die deze heeft samengesteld.

Daarnaast kan een PublishedPipeline worden gebruikt om een Pipeline met verschillende PipelineParameter waarden en invoer opnieuw in te dienen.

Initialiseer PublishedPipeline.

:p aram-eindpunt De REST-eindpunt-URL voor het verzenden van pijplijnuitvoeringen voor deze pijplijn. :type eindpunt: str :p aram total_run_steps: het aantal stappen in deze pijplijn :type total_run_steps: int :p aram-werkruimte: de werkruimte van de gepubliceerde pijplijn. :type werkruimte: azureml.core.Workspace :p aram continue_on_step_failure: of u wilt doorgaan met het uitvoeren van andere stappen in de PipelineRun

als een stap mislukt, is de standaardwaarde onwaar.

Schedule

Definieert een schema waarop een pijplijn moet worden verzonden.

Zodra een pijplijn is gepubliceerd, kan een planning worden gebruikt om de pijplijn te verzenden met een opgegeven interval of wanneer wijzigingen in een blobopslaglocatie worden gedetecteerd.

Initialiseer de planning.

ScheduleRecurrence

Definieert de frequentie, het interval en de begintijd van een pijplijn Schedule.

Met ScheduleRecurrence kunt u ook de tijdzone en de uren of minuten of weekdagen voor het terugkeerpatroon opgeven.

Initialiseer een schema-terugkeerpatroon.

Hiermee kunt u ook de tijdzone en de uren of minuten of weekdagen voor het terugkeerpatroon opgeven.

StepRun

Een uitvoering van een stap in een Pipeline.

Deze klasse kan worden gebruikt voor het beheren, controleren van de status en het ophalen van uitvoeringsdetails zodra de bovenliggende pijplijnuitvoering is verzonden en de pijplijn de stapuitvoering heeft ingediend.

Initialiseer een StepRun.

StepRunOutput

Vertegenwoordigt een uitvoer die is gemaakt door een in een StepRun pijplijn.

StepRunOutput kan worden gebruikt voor toegang tot de PortDataReference gemaakte stap.

Initialiseer StepRunOutput.

StepSequence

Vertegenwoordigt een lijst met stappen in een Pipeline en de volgorde waarin deze moeten worden uitgevoerd.

Gebruik een StepSequence bij het initialiseren van een pijplijn om een werkstroom te maken die stappen bevat om in een specifieke volgorde uit te voeren.

Initialiseer StepSequence.

TrainingOutput

Definieert een gespecialiseerde uitvoer van bepaalde PipelineSteps voor gebruik in een pijplijn.

Met TrainingOutput kan een geautomatiseerde metrische machine learning-waarde of -model beschikbaar worden gesteld als een stapuitvoer die kan worden gebruikt door een andere stap in een Azure Machine Learning-pijplijn. Kan worden gebruikt met AutoMLStep of HyperDriveStep.

Initialiseer TrainingOutput.

param model_file: het specifieke modelbestand dat moet worden opgenomen in de uitvoer. Alleen voor HyperDriveStep .

Enums

TimeZone

Inventariseert de geldige tijdzones voor een terugkeerpatroon Schedule.