Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Samenvatting van een Microsoft R Machine Learning-model.
Gebruik
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumenten
object
Een modelobject dat wordt geretourneerd door een MicrosoftML-analyse .
top
Hiermee geeft u het aantal topcoëfficiënten weer te geven in de samenvatting voor lineaire modellen zoals rxLogisticRegression en rxFastLinear. De vooroordelen worden eerst weergegeven, gevolgd door andere gewichten, gesorteerd op de absolute waarden in aflopende volgorde. Als dit is ingesteld NULLop, worden alle niet-nulcoëfficiënten weergegeven. Anders worden alleen de eerste top coëfficiënten weergegeven.
...
Aanvullende argumenten die moeten worden doorgegeven aan de samenvattingsmethode.
Bijzonderheden
Geeft samenvattingsinformatie over de oorspronkelijke functie-aanroep, de
gegevensset die wordt gebruikt om het model te trainen en statistieken voor coëfficiënten in het model.
Waarde
De summary methode van de MicrosoftML-analyseobjecten retourneert een lijst met de oorspronkelijke functieoproep en de onderliggende parameters die worden gebruikt. De coef methode retourneert een benoemde vector met gewichten, die informatie van het modelobject verwerkt.
Voor rxLogisticRegression kunnen de volgende statistieken ook aanwezig zijn in de samenvatting wanneer showTrainingStats deze is ingesteld op TRUE.
training.size
De grootte, wat betreft het aantal rijen, van de gegevensset die wordt gebruikt om het model te trainen.
deviance
De modeldeviantie wordt gegeven door -2 * ln(L) waar L de kans is dat de waarnemingen worden verkregen met alle functies die in het model zijn opgenomen.
null.deviance
De null-afwijking wordt gegeven door -2 * ln(L0) waar L0 de kans is dat de waarnemingen worden verkregen zonder dat dit van invloed is op de kenmerken. Het null-model bevat de vooroordelen als er een in het model aanwezig is.
aic
Het AIC (Akaike Information Criterion) wordt gedefinieerd als 2 * k ``+ deviance, waarbij k het aantal coëfficiënten van het model is. De bias telt als een van de coëfficiënten. De AIC is een meting van de relatieve kwaliteit van het model. Het gaat om de afweging tussen de geschiktheid van het model (gemeten door afwijking) en de complexiteit van het model (gemeten door het aantal coëfficiënten).
coefficients.stats
Dit is een gegevensframe met de statistieken voor elke coëfficiënt in het model. Voor elke coëfficiënt worden de volgende statistieken weergegeven. De vooroordelen worden weergegeven in de eerste rij en de resterende coëfficiënten in oplopende volgorde van p-waarde.
- Schatting De geschatte coëfficiëntswaarde van het model.
- Std ErrorThis is de vierkantswortel van de variantie van de grote steekproef van de schatting van de coëfficiënt.
- z-ScoreWe kan testen op basis van de nulhypothese, die aangeeft dat de coëfficiënt nul moet zijn, met betrekking tot de significantie van de coëfficiënt door de verhouding van de schatting en de standaardfout ervan te berekenen. Als er volgens de nulhypothese geen regularisatie is toegepast, volgt de schatting van de betreffende coëfficiënt een normale verdeling met gemiddelde 0 en een standaarddeviatie die gelijk is aan de hierboven berekende standaardfout. De z-score levert de verhouding tussen de schatting van een coëfficiënt en de standaardfout van de coëfficiënt.
- Pr(>|z|) Dit is de bijbehorende p-waarde voor de tweezijdige test van de z-score. Op basis van het significantieniveau wordt een significantie-indicator toegevoegd aan de p-waarde. Als
F(x)het CDF van de normale standaardverdelingN(0, 1)is, danP(>|z|) = 2 - ``2 * F(|z|).
Auteur(en)
Microsoft Corporation Microsoft Technical Support
Zie ook
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Voorbeelden
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]