2010-06-18 19 views
20

Potrzebuję jakoś opisowego przykładu pokazującego, jak wykonać dziesięciokrotną klasyfikację SVM na dwóch klasach danych. jest tylko jeden przykład w dokumentacji MATLAB, ale nie jest to 10-krotne. Czy ktoś może mi pomóc?Przykład 10-krotnej klasyfikacji SVM w MATLAB

Odpowiedz

39

Oto pełna przykładów, stosując następujące funkcje z Bioinformatyki Toolbox: SVMTRAIN, SVMCLASSIFY, CLASSPERF, CROSSVALIND.

load fisheriris        %# load iris dataset 
groups = ismember(species,'setosa');   %# create a two-class problem 

%# number of cross-validation folds: 
%# If you have 50 samples, divide them into 10 groups of 5 samples each, 
%# then train with 9 groups (45 samples) and test with 1 group (5 samples). 
%# This is repeated ten times, with each group used exactly once as a test set. 
%# Finally the 10 results from the folds are averaged to produce a single 
%# performance estimation. 
k=10; 

cvFolds = crossvalind('Kfold', groups, k); %# get indices of 10-fold CV 
cp = classperf(groups);      %# init performance tracker 

for i = 1:k         %# for each fold 
    testIdx = (cvFolds == i);    %# get indices of test instances 
    trainIdx = ~testIdx;      %# get indices training instances 

    %# train an SVM model over training instances 
    svmModel = svmtrain(meas(trainIdx,:), groups(trainIdx), ... 
       'Autoscale',true, 'Showplot',false, 'Method','QP', ... 
       'BoxConstraint',2e-1, 'Kernel_Function','rbf', 'RBF_Sigma',1); 

    %# test using test instances 
    pred = svmclassify(svmModel, meas(testIdx,:), 'Showplot',false); 

    %# evaluate and update performance object 
    cp = classperf(cp, pred, testIdx); 
end 

%# get accuracy 
cp.CorrectRate 

%# get confusion matrix 
%# columns:actual, rows:predicted, last-row: unclassified instances 
cp.CountingMatrix 

z wyjściem:

ans = 
     0.99333 
ans = 
    100  1 
    0 49 
    0  0 

uzyskano 99.33% dokładność, z tylko jedną "Setosa wystąpieniami MIS sklasyfikowane jako 'nie-Setosa'


UPDATE: SVM funkcje zostały przeniesione do zestawu narzędzi statystycznych w R2013a

+0

Dzięki za t on miły przykład. Trochę zamieszania, które mam. Załóżmy, że mam w sumie 50 wpisów. Powyższy kod dzieli go na 10 zestawów po 5 wpisów, a następnie za pomocą 9 do trenowania i 1 do testowania w każdej iteracji. Ale zwykły przepływ powinien być trochę inny, tzn. 1. pociąg 2. sprawdzić poprawność powtórzyć powyższe, a następnie sprawdzić? czy to nie robi różnicy? –

+0

@ user488652: Nie jestem pewien na twoje pytanie, ale powyższy kod jest zgodny ze standardową metodą sprawdzania poprawności krzyżowej (n-krotna walidacja) (http://en.wikipedia.org/wiki/Cross-validation_%28statistics%29 # K-fold_cross-validation) – Amro

+0

@Amro Czy możesz wyjaśnić 'groups = ismember (species, 'setosa');' Dlaczego użyłeś 'setosa', a nie innych dwóch typów danych wyjściowych. Również Jak mogę go użyć do mojego zestawu danych przechowywanego w macierzy 25X5 i skutkuje macierzą 25X1 z dwoma wyjściami. – MaxSteel

Powiązane problemy