Delen via


summary.mlModel: Samenvatting van een Microsoft R Machine Learning-model.

Samenvatting van een Microsoft R Machine Learning-model.

Gebruik

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumenten

object

Een modelobject dat wordt geretourneerd door een MicrosoftML-analyse .

top

Hiermee geeft u het aantal topcoëfficiënten weer te geven in de samenvatting voor lineaire modellen zoals rxLogisticRegression en rxFastLinear. De vooroordelen worden eerst weergegeven, gevolgd door andere gewichten, gesorteerd op de absolute waarden in aflopende volgorde. Als dit is ingesteld NULLop, worden alle niet-nulcoëfficiënten weergegeven. Anders worden alleen de eerste top coëfficiënten weergegeven.

...

Aanvullende argumenten die moeten worden doorgegeven aan de samenvattingsmethode.

Bijzonderheden

Geeft samenvattingsinformatie over de oorspronkelijke functie-aanroep, de
gegevensset die wordt gebruikt om het model te trainen en statistieken voor coëfficiënten in het model.

Waarde

De summary methode van de MicrosoftML-analyseobjecten retourneert een lijst met de oorspronkelijke functieoproep en de onderliggende parameters die worden gebruikt. De coef methode retourneert een benoemde vector met gewichten, die informatie van het modelobject verwerkt.

Voor rxLogisticRegression kunnen de volgende statistieken ook aanwezig zijn in de samenvatting wanneer showTrainingStats deze is ingesteld op TRUE.

training.size

De grootte, wat betreft het aantal rijen, van de gegevensset die wordt gebruikt om het model te trainen.

deviance

De modeldeviantie wordt gegeven door -2 * ln(L) waar L de kans is dat de waarnemingen worden verkregen met alle functies die in het model zijn opgenomen.

null.deviance

De null-afwijking wordt gegeven door -2 * ln(L0) waar L0 de kans is dat de waarnemingen worden verkregen zonder dat dit van invloed is op de kenmerken. Het null-model bevat de vooroordelen als er een in het model aanwezig is.

aic

Het AIC (Akaike Information Criterion) wordt gedefinieerd als 2 * k ``+ deviance, waarbij k het aantal coëfficiënten van het model is. De bias telt als een van de coëfficiënten. De AIC is een meting van de relatieve kwaliteit van het model. Het gaat om de afweging tussen de geschiktheid van het model (gemeten door afwijking) en de complexiteit van het model (gemeten door het aantal coëfficiënten).

coefficients.stats

Dit is een gegevensframe met de statistieken voor elke coëfficiënt in het model. Voor elke coëfficiënt worden de volgende statistieken weergegeven. De vooroordelen worden weergegeven in de eerste rij en de resterende coëfficiënten in oplopende volgorde van p-waarde.

  • Schatting De geschatte coëfficiëntswaarde van het model.
  • Std ErrorThis is de vierkantswortel van de variantie van de grote steekproef van de schatting van de coëfficiënt.
  • z-ScoreWe kan testen op basis van de nulhypothese, die aangeeft dat de coëfficiënt nul moet zijn, met betrekking tot de significantie van de coëfficiënt door de verhouding van de schatting en de standaardfout ervan te berekenen. Als er volgens de nulhypothese geen regularisatie is toegepast, volgt de schatting van de betreffende coëfficiënt een normale verdeling met gemiddelde 0 en een standaarddeviatie die gelijk is aan de hierboven berekende standaardfout. De z-score levert de verhouding tussen de schatting van een coëfficiënt en de standaardfout van de coëfficiënt.
  • Pr(>|z|) Dit is de bijbehorende p-waarde voor de tweezijdige test van de z-score. Op basis van het significantieniveau wordt een significantie-indicator toegevoegd aan de p-waarde. Als F(x) het CDF van de normale standaardverdeling N(0, 1)is, dan P(>|z|) = 2 - ``2 * F(|z|).

Auteur(en)

Microsoft Corporation Microsoft Technical Support

Zie ook

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Voorbeelden


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]