2013-12-13 12 views

Odpowiedz

21

Jeszcze jedna rzecz do dodania: liniowy SVM jest mniej podatny na przeuczenie niż nieliniowy. I musisz zdecydować, które jądro wybrać w zależności od twojej sytuacji: jeśli twoja liczba funkcji jest naprawdę duża w porównaniu do próbki treningowej, po prostu użyj liniowego jądra; jeśli twoja liczba funkcji jest niewielka, ale próbka szkoleniowa jest duża, możesz również potrzebować liniowego jądra, ale spróbuj dodać więcej funkcji; jeśli Twój numer funkcji jest mały (10^0 - 10^3), a numer próbki jest pośredni (10^1 - 10^4), użyj jądra Gaussa będzie lepszy.

O ile mi wiadomo, SVM z liniowym jądrem jest zwykle porównywalny z regresją logistyczną.

2

SVM z jądrem liniowym jest rzeczywiście jednym z najprostszych klasyfikatorów, ale nie będzie zaskoczeniem, jeśli osiągniemy bardzo wysoką dokładność działania, gdy dystrybucja danych będzie liniowo rozdzielana.

W tym sensie myślę, że pańska opinia jest poprawna. Jednak musisz zdać sobie sprawę, że moc SVM leży w rozszerzeniu o znacznie bardziej złożone jądra nieliniowe (np. RBF).

Jeden link na choosing classifiers.

3

Zastosowanie wektora nośnego z liniowym jądrem polega na przeprowadzeniu klasyfikacji lub regresji. Najlepiej sprawdzi się, gdy istnieje liniowa granica decyzyjna lub liniowe dopasowanie do danych, a więc liniowe jądro.

4

Jądro liniowe ma pewne zalety, ale prawdopodobnie (moim zdaniem) najbardziej znaczący jest fakt, że generalnie szybciej jest trenować w porównaniu z nieliniowymi jądrami, takimi jak RBF.

Jeśli rozmiar zbioru danych jest wyrażony w gigabajtach, można zauważyć, że różnica czasu szkolenia jest ogromna (minuty w stosunku do godzin).

4

Jądra liniowe najlepiej stosować do danych rozdzielanych liniowo. Wyobraź sobie, że twój zestaw danych zawiera tylko 2 funkcje i 2 klasy. Jeśli wykreślisz próbki danych na wykresie, używając dwóch funkcji jako X i Y, zobaczysz, jak próbki z różnych klas są względem siebie ustawione.

Jeśli łatwo jest narysować linię, która oddziela dwie klasy, a następnie jądro liniowy jest świetny do pracy:

enter image description here

Oczywiście to działa z wieloma funkcjami, a nie tylko dwa, czyniąc wielo -wymiarowe spacje. Jeśli jednak danych nie można oddzielić liniowo, trzeba zmapować próbki do innej przestrzeni wymiarowej, używając jąder takich jak RBF lub wielomian.

Ponadto, ponieważ jądro liniowe nie wykonuje żadnego mapowania, generalnie szybciej jest trenować klasyfikator niż w przypadku innych jąder.

Powiązane problemy