Beslissing met meerdere klasses

2019-05-06

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
Meer informatie over Azure Machine Learning.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Hiermee maakt u een classificatiemodel met meerdere klassen met behulp van het beslissingsalgoritme

Categorie: Machine Learning/ Model/classificatie initialiseren

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Multiclass Decision Door in Machine Learning Studio (klassiek) gebruikt om een machine learning-model te maken dat is gebaseerd op een leeralgoritme onder supervisie dat beslissingsprocessen wordt genoemd.

U definieert het model en de parameters ervan met behulp van deze module en verbindt vervolgens een gelabelde set met trainingsgegevens om het model te trainen met behulp van een van de trainingsmodules. Het getrainde model kan worden gebruikt om een doel met meerdere waarden te voorspellen.

Meer informatie over beslissingsbeslissingen

Beslissingsbeslissingen zijn een recente uitbreiding van beslissings forests. Een beslissingsding bestaat uit een geheel van beslissingsgestuurde acyclische grafieken (DAG's).

Beslissingsbeslissingen hebben de volgende voordelen:

Doordat boom branches kunnen worden samengevoegd, heeft een beslissings-DAG doorgaans een lagere geheugenvoetafdruk en betere generalisatieprestaties dan een beslissingsstructuur, hoewel dit ten koste gaat van een iets hogere trainingstijd.
Beslissingsmodellen zijn niet-parametrische modellen die niet-lineaire beslissingsgrenzen kunnen vertegenwoordigen.
Ze voeren geïntegreerde functieselectie en -classificatie uit en zijn flexibel in de aanwezigheid van ruisfuncties.

Voor meer informatie over het onderzoek achter dit machine learning algoritme, zie Decision Welkes: Compact and Rich Models for Classification (downloadbare PDF).

Multiclass Decision Model configureren

Voeg de module Multiclass Decision Door toe aan uw experiment in Studio (klassiek). U vindt deze module onder Machine Learning, Model initialiseren en Classificatie.
Dubbelklik op de module om het deelvenster Eigenschappen te openen.
Kies de methode voor het opnieuw nemen van een steekproef, waarbij u meerdere boomen maakt, hetzij in een zak of replicatie.
- Bagging: selecteer deze optie om bagging te gebruiken, ook wel bootstrap aggregeren genoemd.
  
  Elke boomstructuur in een beslissings forest heeft een Gaussiaanse distributie via voorspelling. De aggregatie is om een Gaussian te vinden waarvan de eerste twee momenten overeenkomen met de momenten van de combinatie van Gaussians die worden gegeven door alle Gaussians te combineren die worden geretourneerd door afzonderlijke boomsoorten.
- Repliceren: selecteer deze optie om replicatie te gebruiken. In deze methode wordt elke structuur getraind op exact dezelfde invoergegevens. Het bepalen van welk splitsingspredicaat wordt gebruikt voor elk structuur-knooppunt blijft willekeurig, zodat er diverse boomen worden gemaakt.
Geef op hoe u het model wilt trainen door de optie Trainer-modus maken in te stellen.
- Enkele parameter: gebruik deze optie als u weet hoe u het model wilt configureren.
- Parameterbereik: gebruik deze optie als u niet zeker bent van de beste parameters en een parameter-opruiming wilt gebruiken.
Aantal beslissings-DAG's: hiermee geeft u het maximum aantal grafieken aan dat in het ensemble kan worden gemaakt.
Maximale diepte van de beslissings-DAG's: geef de maximale diepte van elke grafiek op.
Maximale breedte van de beslissings-DAG's: geef de maximale breedte van elke grafiek op.
Aantal optimalisatiestappen per dag-beslissingslaag: geef aan hoeveel iteraties de gegevens moeten uitvoeren bij het bouwen van elke DAG.
Onbekende waarden voor categorische functies toestaan: selecteer deze optie om een groep te maken voor onbekende waarden in test- of validatiegegevens. Het model is mogelijk minder nauwkeurig voor bekende waarden, maar kan betere voorspellingen geven voor nieuwe (onbekende) waarden.

Als u deze optie uitselecteert, kan het model alleen waarden accepteren die aanwezig waren in de trainingsgegevens.
Verbinding maken gelabelde gegevensset en een van de trainingsmodules:
- Als u de modus Create train mode instelt op Single Parameter, gebruikt u de module Train Model .
- Als u De modus Maken in stelt op Parameterbereik, gebruikt u de module Tune Model Hyperparameters . Met deze optie doorsteert het algoritme meerdere combinaties van de instellingen die u hebt opgegeven en bepaalt het de combinatie van waarden die het beste model produceren.
Notitie

Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de eerste waarde in de lijst met parameterbereiken gebruikt.

Als u één set parameterwaarden doorgeeft aan de module Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de learner genegeerd wanneer er een bereik van instellingen voor elke parameter wordt verwacht.

Als u de optie Parameterbereik selecteert en één waarde voor een parameter ingeeft, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens het opruimen, zelfs als andere parameters binnen een bereik van waarden veranderen.
Voer het experiment uit.

Resultaten

Nadat de training is voltooid:

Als u het model wilt gebruiken om te scoren, verbindt u het met Score Model om waarden voor nieuwe invoervoorbeelden te voorspellen.

Voorbeelden

Voor voorbeelden van hoe beslissings forests worden gebruikt in machine learning, zie de Azure AI Gallery:

Voorbeeld van classificaties met meerdere klassen vergelijken: maakt gebruik van verschillende algoritmen en bespreekt de voor- en nadelen.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Zie voor meer informatie over het trainingsproces met de optie Repliceren:

Beslissings forests voor computer vision en analyse van medische afbeeldingen. Criminisi en Shotton. Springer 2013

Gebruikstips

Als u beperkte gegevens hebt of de tijd die u nodig hebt om het model te trainen wilt minimaliseren, kunt u de volgende aanbevelingen proberen:

Beperkte trainingsset

Als de trainingsset een beperkt aantal exemplaren bevat:

De beslissingsdeser maken met behulp van een groot aantal beslissings-DAG's (bijvoorbeeld meer dan 20)
Gebruik de optie Bagging om opnieuw een steekproef te nemen.
Geef een groot aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld meer dan 10.000).

Beperkte trainingtijd

Als de trainingsset een groot aantal instanties bevat en de training tijd beperkt is:

Maak de beslissingsdeser die gebruikmaakt van een kleiner aantal beslissings-DAG's (bijvoorbeeld 5-10).
Gebruik de optie Repliceren om opnieuw een steekproef te maken.
Geef een kleiner aantal optimalisatiestappen per DAG-laag op (bijvoorbeeld minder dan 2000).

Moduleparameters

Name	Bereik	Type	Standaard	Beschrijving
Methode Resampling	Alle	ResamplingMethod	Zakken	Een hersampling-methode kiezen
Aantal beslissings-DAG's	>= 1	Geheel getal	8	Geef het aantal beslissingsgrafieken op dat in het ensemble kan worden gemaakt
Maximale diepte van de beslissings-DAG's	>= 1	Geheel getal	32	Geef de maximale diepte op van de beslissingsgrafieken die in het ensemble moeten worden gemaakt
Maximale breedte van de beslissings-DAG's	>= 8	Geheel getal	128	Geef de maximale breedte op van de beslissingsgrafieken die in het ensemble moeten worden gemaakt
Aantal optimalisatiestappen per dag-beslissingslaag	>= 1000	Geheel getal	2048	Geef het aantal stappen op dat moet worden gebruikt om elk niveau van de beslissingsgrafieken te optimaliseren
Onbekende waarden voor categorische functies toestaan	Alle	Boolean-waarde	True	Aangeven of onbekende waarden van bestaande categorische functies kunnen worden toegevoegd aan een nieuwe, aanvullende functie

Uitvoerwaarden

Naam	Type	Description
Niet-getraind model	ILearner-interface	Een ongetraind classificatiemodel met meerdere klassen

Zie ook

Beslissing met twee klassen
Classificatie
Lijst met A-Z-modules

Delen via