Pracuję nad binarną klasyfikacją danych i chcę poznać zalety i wady korzystania z maszyny wektorów wsparcia na drzewach decyzyjnych i algorytmach Adaptive Boosting.Zalety SVM nad drzewem decion i algorytmem AdaBoost
Odpowiedz
Coś, co możesz chcieć zrobić, to użyć weka, który jest ładnym pakietem, który możesz wykorzystać do podłączenia danych, a następnie wypróbować kilka różnych klasyfikatorów uczących się maszyn, aby zobaczyć, jak każdy z nich działa na konkretnym zestawie. To dobra ścieżka dla ludzi, którzy uczą się maszynowego.
Nie wiedząc nic o twoich konkretnych danych lub problemie z klasyfikacją, który próbujesz rozwiązać, nie mogę tak naprawdę wyjść poza samo opowiadanie ci przypadkowych rzeczy, które znam o każdej z metod. To powiedziawszy, tutaj jest zrzut mózgu i łączy się z przydatnymi slajdami do nauki maszyn.
Adaptive Boosting wykorzystuje komisję słabych klasyfikatorów podstawowych do głosowania na przydziale klasowego punktu próbnego. Podstawowymi klasyfikatorami mogą być pnie decyzyjne, drzewa decyzyjne, maszyny SVM itp. Wymagane jest podejście iteracyjne. Przy każdej iteracji - jeśli komisja jest zgodna i poprawna w odniesieniu do przydziału klasowego dla konkretnej próby, to traci ważność (mniej ważne, aby uzyskać prawo do następnej iteracji), a jeśli komitet nie zgadza się, to staje się ważone (ważniejsze dla zaklasyfikowania zaraz po kolejnej iteracji). Adaboost jest znany z dobrego uogólniania (nie przeuczania).
SVMs to przydatna pierwsza próba. Dodatkowo można używać różnych jąder z maszynami SVM i uzyskać nie tylko liniowe granice decyzyjne, ale także bardziej funkcjonalne. A jeśli umieścisz na nim regulamin L1 (zmienne luźne), nie tylko zapobiegniesz przeuczeniu, ale także możesz sklasyfikować dane, które nie są rozdzielne.
Decision trees są użyteczne ze względu na ich interpretowalność przez prawie każdego. Są łatwe w użyciu. Używanie drzew oznacza również, że możesz również zorientować się, jak ważna była konkretna funkcja do tworzenia tego drzewa. Coś, co możesz chcieć sprawdzić to drzewa addytywne (takie jak MART).
"jeśli komitet zgadza się co do przydziału klasy dla konkretnej próbki, to traci ważność". To nie jest dokładnie prawda. Jeśli komisja odda go poprawnie (w porównaniu z podstawową etykietą prawdy), wówczas zostanie obniżona. Na odwrót, aby zwiększyć wagę. –
Dobra uwaga. Poprawione w poście. – kitchenette
- 1. Zalety [HandleError] nad Application_Error
- 2. Zalety paczki nad JSON
- 3. Zalety Executorów nad nowym wątkiem
- 4. jakie są zalety MVC3 nad MVC2
- 5. Jakie są zalety PyQt nad PyGTK i na odwrót?
- 6. Jakie są zalety/wady szwy nad sprężyną?
- 7. Zalety JavaConfig nad konfiguracjami XML na wiosnę?
- 8. Szczególne zalety NServiceBus nad zwykłym RabbitMQ
- 9. Jakie są zalety QAbstractItemModel nad QStandardItemModel?
- 10. Wybór parametrów w adaboost
- 11. Używanie GridSearchCV z AdaBoost i DecisionTreeClassifier
- 12. Różnica między kompletnym drzewem binarnym i zbalansowanym drzewem binarnym
- 13. Różnica między drzewem regresji a drzewem modelu
- 14. Wykrywacz OpenCV i Latent SVM
- 15. Jakie są zalety LLDB nad GDB w rozwoju iOS?
- 16. Zalety korzystania Realm ListView nad standardem React Native ListView
- 17. Podróżujący sprzedawca z algorytmem wstrzymującym i karpowym
- 18. Jakie zalety ma Scala nad Javą do programowania współbieżnego?
- 19. Jakie są zalety wzorca Konstruktora danych testowych nad Inicjatorami obiektów?
- 20. Jaka jest różnica między algorytmem Forward-backward a algorytmem Viterbiego?
- 21. jaka jest różnica między drzewem DOM przeglądarki a drzewem renderowania
- 22. Zalety i wady Haskella
- 23. Zalety i wady CardView
- 24. Zalety i wady BPMN?
- 25. Zalety posiadania funkcji statycznej, takiej jak len(), max() i min() nad odziedziczonymi wywołaniami metod
- 26. Problemy z algorytmem stacji manewrowej
- 27. Zalety i wady korzystania z programu Storyboarding?
- 28. Vectorized SVM gradientu
- 29. svm skalowanie wartości wejściowych
- 30. Ostatnio do systemu Mahout dodano implementację SVM i planuję użyć SVM. Ktoś już tego próbował?
Dlaczego jest to oznaczane jako Java? –
Ile punktów danych i funkcji posiadasz? głośny, skąpy? Proponuję zacząć od szybkiego linear-SVM [scikit-learn SGDClassifier] (http://scikit-learn.org/stable/modules/sgd.html). – denis