Dela via


summary.mlModel: Sammanfattning av en Microsoft R Machine Learning-modell.

Sammanfattning av en Microsoft R Machine Learning-modell.

Användning

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumentpunkter

object

Ett modellobjekt som returneras från en MicrosoftML-analys .

top

Anger antalet högsta koefficienter som ska visas i sammanfattningen för linjära modeller som rxLogisticRegression och rxFastLinear. Bias visas först, följt av andra vikter, sorterade efter deras absoluta värden i fallande ordning. Om värdet NULLär visas alla koefficienter som inte är noll. Annars visas endast de första top koefficienterna.

...

Ytterligare argument som ska skickas till sammanfattningsmetoden.

Detaljer

Innehåller sammanfattningsinformation om det ursprungliga funktionsanropet,
datauppsättning som används för att träna modellen och statistik för koefficienter i modellen.

Värde

Metoden summary för MicrosoftML-analysobjekten returnerar en lista som innehåller det ursprungliga funktionsanropet och de underliggande parametrar som används. Metoden coef returnerar en namngiven viktvektor som bearbetar information från modellobjektet.

För rxLogisticRegression kan följande statistik också visas i sammanfattningen när showTrainingStats är inställd på TRUE.

training.size

Storleken, när det gäller radantal, på den datauppsättning som används för att träna modellen.

deviance

Modellavvikelsen ges av -2 * ln(L) var L är sannolikheten att få observationer med alla funktioner som ingår i modellen.

null.deviance

Nullavvikelsen ges genom -2 * ln(L0) var L0 är sannolikheten att få observationer utan effekt från funktionerna. Null-modellen innehåller bias om det finns en i modellen.

aic

AIC (Akaike Information Criterion) definieras som 2 * k ``+ deviance, där k är antalet koefficienter för modellen. Bias räknas som en av koefficienterna. AIC är ett mått på modellens relativa kvalitet. Den handlar om kompromissen mellan modellens lämplighet (mätt med avvikelse) och modellens komplexitet (mätt med antal koefficienter).

coefficients.stats

Det här är en dataram som innehåller statistiken för varje koefficient i modellen. För varje koefficient visas följande statistik. Bias visas på den första raden och de återstående koefficienterna i den stigande ordningen för p-värde.

  • EstimateDen uppskattade koefficientvärdet för modellen.
  • Std ErrorThis är kvadratroten för den stora urvalsavvikelsen för uppskattningen av koefficienten.
  • z-ScoreWe kan testa mot nollhypotesen, som anger att koefficienten ska vara noll, angående koefficientens betydelse genom att beräkna förhållandet mellan uppskattningen och dess standardfel. Om ingen regularisering tillämpas enligt nollhypotesen följer uppskattningen av den gällande koefficienten en normal fördelning med medelvärdet 0 och en standardavvikelse som är lika med det standardfel som beräknats ovan. Z-poängen matar ut förhållandet mellan uppskattningen av en koefficient och koefficientens standardfel.
  • Pr(>|z|) Detta är motsvarande p-värde för det dubbelsidiga testet av z-score. Baserat på signifikansnivå läggs en signifikansindikator till i p-värdet. Om F(x) är CDF för standardnormaldistributionen N(0, 1), då P(>|z|) = 2 - ``2 * F(|z|).

Författare

Microsoft Corporation Microsoft Technical Support

Se även

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Exempel


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]