2013-03-21 9 views
6

Zapisałem losowy model lasu do pliku przy użyciu Weka 3.7.9, a teraz próbuję ocenić go względem innego (bardzo dużego) zestawu (na niektórych dużych maszynach w Amazon EC2). Używam następujące polecenie:Wyjściowa macierz zamieszania w Weka z linii poleceń

> java -server -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -T test.arff -l random-forest.model 
-i -no-cv 

Jednak tylko wyjście mam to coś takiego:

=== Error on test data === 

Correctly Classified Instances  3252532    80.0686 % 
Incorrectly Classified Instances 809651    19.9314 % 
Kappa statistic       0.2884 
Mean absolute error      0.2539 
Root mean squared error     0.3608 
Coverage of cases (0.95 level)   98.7413 % 
Total Number of Instances   4062183 

Podczas gdy szukam oprócz czegoś takiego:

=== Detailed Accuracy By Class === 

       TP Rate FP Rate Precision Recall F-Measure MCC  ROC Area PRC Area Class 
       0.804 0.295 0.731  0.804 0.766  0.512 0.826  0.803  buyer 
       0.705 0.196 0.783  0.705 0.742  0.512 0.826  0.798  non-buyer 
Weighted Avg. 0.755 0.245 0.757  0.755 0.754  0.512 0.826  0.801  

=== Confusion Matrix === 

    a  b <-- classified as 
61728 15004 |  a = buyer 
22662 54066 |  b = non-buyer 

Należy pamiętać, że nawet jeśli ponownie uruchomię pełną metodę szkoleniową, to:

> java -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -t train.arff -T test.arff 
-I 10 -K 0 -S 1 -num-slots 8 -d random-forest.model -i -no-cv 

Nadal nie pokazuję macierzy błędów dla danych testowych (tylko dla wyszkolonych danych).

+1

Działa dobrze dla mnie bez '-no-cv'. –

+0

Głupi mnie! Ty, panie, zasługujesz na reputację +100 :-) Odpowiedz, aby móc to nagrodzić. –

+0

Dzięki, zrobione :) –

Odpowiedz

3

Działa, gdy pominięto opcję -no-cv.