2014-04-29 17 views
6

Wdrażam 10-krotne sprawdzanie poprawności dla Naive Bayes na niektórych danych testowych z 2 klasami (0 i 1). Wykonałem poniższe czynności i otrzymałem komunikat o błędzie.niewłaściwy typ modelu dla błędu regresji w 10-krotnym sprawdzaniu poprawności dla Naive Bayes przy użyciu R

data(testdata) 

attach(testdata) 

X <- subset(testdata, select=-Class) 

Y <- Class 

library(e1071) 

naive_bayes <- naiveBayes(X,Y) 

library(caret) 
library(klaR) 

nb_cv <- train(X, Y, method = "nb", trControl = trainControl(method = "cv", number = 10)) 

## Error: 
## Error in train.default(X, Y, method = "nb", trControl = trainControl(number = 10)) : 
## wrong model type for regression 


dput(testdata) 

structure(list(Feature.1 = 6.534088, Feature.2 = -19.050915, 
Feature.3 = 7.599378, Feature.4 = 5.093594, Feature.5 = -22.15166, 
Feature.6 = -7.478444, Feature.7 = -59.534652, Feature.8 = -1.587918, 
Feature.9 = -5.76889, Feature.10 = 95.810563, Feature.11 = 49.124086, 
Feature.12 = -21.101489, Feature.13 = -9.187984, Feature.14 = -10.53006, 
Feature.15 = -3.782506, Feature.16 = -10.805074, Feature.17 = 34.039509, 
Feature.18 = 5.64245, Feature.19 = 19.389724, Feature.20 = 16.450196, 
Class = 1L), .Names = c("Feature.1", "Feature.2", "Feature.3", 
"Feature.4", "Feature.5", "Feature.6", "Feature.7", "Feature.8", 
"Feature.9", "Feature.10", "Feature.11", "Feature.12", "Feature.13", 
"Feature.14", "Feature.15", "Feature.16", "Feature.17", "Feature.18", 
"Feature.19", "Feature.20", "Class"), class = "data.frame", row.names = c(NA, 
-1L)) 

Ponadto, jak calculare kwadrat R lub AUC dla tego modelu

Dataset: Istnieją 10000 rekordy z 20 funkcji i Binary klasie.

+0

Please 'dput (testdata)' jeśli chcesz uzyskać pomoc –

+0

Thanks David. Dodano dput (testdata) z 1 rekordem. –

+0

Działa po zmianie etykiet klas z (1, 0) na (tak, nie) –

Odpowiedz

8

NaiveBayes jest klasyfikator, a tym samym przekształcenie Y, aby czynnik lub logiczną jest właściwym sposobem rozwiązania problemu. Twoje oryginalne sformułowanie używało narzędzia do klasyfikowania, ale używając wartości numerycznych, a zatem R było zdezorientowane.

Jeśli chodzi o R-kwadrat, ponownie ta metryka jest obliczana tylko dla problemów regresji, a nie problemów z klasyfikacją. Aby ocenić problemy z klasyfikacją, istnieją inne wskaźniki, takie jak Dokładność i Przypomnienie.

Proszę odnieść się do łącza wikipedia, aby uzyskać więcej informacji na temat tych metryk: http://en.wikipedia.org/wiki/Binary_classification

3

To działa po zmianie wektor etykieta Y < - as.factor (Y)

Powiązane problemy