Anteckning
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Sammanfattning av en Microsoft R Machine Learning-modell.
Användning
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumentpunkter
object
Ett modellobjekt som returneras från en MicrosoftML-analys .
top
Anger antalet högsta koefficienter som ska visas i sammanfattningen för linjära modeller som rxLogisticRegression och rxFastLinear. Bias visas först, följt av andra vikter, sorterade efter deras absoluta värden i fallande ordning. Om värdet NULLär visas alla koefficienter som inte är noll. Annars visas endast de första top koefficienterna.
...
Ytterligare argument som ska skickas till sammanfattningsmetoden.
Detaljer
Innehåller sammanfattningsinformation om det ursprungliga funktionsanropet,
datauppsättning som används för att träna modellen och statistik för koefficienter i modellen.
Värde
Metoden summary för MicrosoftML-analysobjekten returnerar en lista som innehåller det ursprungliga funktionsanropet och de underliggande parametrar som används. Metoden coef returnerar en namngiven viktvektor som bearbetar information från modellobjektet.
För rxLogisticRegression kan följande statistik också visas i sammanfattningen när showTrainingStats är inställd på TRUE.
training.size
Storleken, när det gäller radantal, på den datauppsättning som används för att träna modellen.
deviance
Modellavvikelsen ges av -2 * ln(L) var L är sannolikheten att få observationer med alla funktioner som ingår i modellen.
null.deviance
Nullavvikelsen ges genom -2 * ln(L0) var L0 är sannolikheten att få observationer utan effekt från funktionerna. Null-modellen innehåller bias om det finns en i modellen.
aic
AIC (Akaike Information Criterion) definieras som 2 * k ``+ deviance, där k är antalet koefficienter för modellen. Bias räknas som en av koefficienterna. AIC är ett mått på modellens relativa kvalitet. Den handlar om kompromissen mellan modellens lämplighet (mätt med avvikelse) och modellens komplexitet (mätt med antal koefficienter).
coefficients.stats
Det här är en dataram som innehåller statistiken för varje koefficient i modellen. För varje koefficient visas följande statistik. Bias visas på den första raden och de återstående koefficienterna i den stigande ordningen för p-värde.
- EstimateDen uppskattade koefficientvärdet för modellen.
- Std ErrorThis är kvadratroten för den stora urvalsavvikelsen för uppskattningen av koefficienten.
- z-ScoreWe kan testa mot nollhypotesen, som anger att koefficienten ska vara noll, angående koefficientens betydelse genom att beräkna förhållandet mellan uppskattningen och dess standardfel. Om ingen regularisering tillämpas enligt nollhypotesen följer uppskattningen av den gällande koefficienten en normal fördelning med medelvärdet 0 och en standardavvikelse som är lika med det standardfel som beräknats ovan. Z-poängen matar ut förhållandet mellan uppskattningen av en koefficient och koefficientens standardfel.
- Pr(>|z|) Detta är motsvarande p-värde för det dubbelsidiga testet av z-score. Baserat på signifikansnivå läggs en signifikansindikator till i p-värdet. Om
F(x)är CDF för standardnormaldistributionenN(0, 1), dåP(>|z|) = 2 - ``2 * F(|z|).
Författare
Microsoft Corporation Microsoft Technical Support
Se även
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Exempel
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]