W przykładzie drzewa decyzyjnego J48, kiedy mówimy, że drzewo jest przycinane lub nieobcinane, jaka jest różnica?Co to jest przycięte i niecięte drzewo w Weka?
Odpowiedz
Nieprzycięte drzewa są większe. Zasadniczo drzewo jest tworzone zgodnie z zaimplementowanym algorytmem i jeśli jest włączone oczyszczanie, dodatkowy krok sprawdza, które węzły/gałęzie można usunąć bez zbytniego wpływu na wydajność.
Ideą przycinania jest to, że oprócz łatwiejszego zrozumienia drzewa, zmniejszasz ryzyko przeuczenia danych treningowych. Oznacza to, że potrafimy idealnie (dokładnie) zaklasyfikować dane treningowe, ale nic więcej, ponieważ zamiast poznawać leżącą u podstaw koncepcję, drzewo nauczyło się właściwości wewnętrznych i specyficznych dla danych treningowych.
Zważywszy, że Weka to pakiet uczenie maszynowe, to brzmi jak co oni na myśli to:
http://en.wikipedia.org/wiki/Pruning_(decision_trees)
W skrócie przycinanie drzewa decyzyjnego wydaje się być usunięcie ewentualnych decyzji, które nie przynoszą wiele korzyści.
Jednak nie użyłem Weka i nie znam tego. Odwróć się do innych odpowiedzi i sprawdź, czy to, co mówią, ma sens.
Chciałbym dodać następujące odpowiedzi Larsa. Zaczerpnięte z następujących link
wiele algorytmów próbę „prune” lub uproszczenia, ich wyniki. Przycinanie daje mniej, łatwiej interpretować wyniki. Co ważniejsze, przycinanie może być wykorzystywane jako narzędzie do korygowania potencjalnego przeuczenia. ...
J48 zatrudnia dwie metody przycinania.
Pierwsza z nich jest nazywana wymianą subtree. Oznacza to, że węzły w drzewie decyzyjnym można zastąpić liściem - zasadniczo zmniejszając liczbę testów wzdłuż określonej ścieżki. Proces ten rozpoczyna się od liści w pełni uformowanego drzewa i działa wstecz w kierunku korzenia.
Drugi rodzaj przycinania używany w J48 jest nazywany podciąganiem. W takim przypadku węzeł może zostać przesunięty w górę w kierunku katalogu głównego drzewa, zastępując inne węzły po drodze. Podnoszenie podnośni często ma znikomy wpływ na modele drzew decyzyjnych. Często nie ma jasnego sposobu przewidywania użyteczności opcji, chociaż może być wskazane, aby spróbować wyłączyć, jeśli proces wprowadzania trwa długo. Wynika to z faktu, że podtworzenie może być nieco skomplikowane obliczeniowo.
- 1. Co to jest jitter w wizualizacji zakładki weka
- 2. Co to jest drzewo urządzeń? Zalety i wady?
- 3. Co to jest drzewo lewostronne, prawe-rodzeństwo reprezentujące drzewo? Dlaczego miałbyś go używać?
- 4. Co to jest Thread.CurrentPrincipal i co robi?
- 5. Co to jest S_ISREG() i co robi?
- 6. Co to jest POI i co to znaczy?
- 7. Co to jest "!", "?", "_" I "." składnia w eliksiru
- 8. Co to jest introspekcja kodu w haskell?
- 9. Co to jest "naturalna kolejność" w TreeMap?
- 10. Co to jest WebIDL i (dlaczego) jest to ważne?
- 11. Przycięte średnie obliczenie w MySQL
- 12. Co to jest "usuń to"?
- 13. django pozostałe elementy przycięte
- 14. Co to jest Serializable? Co to znaczy?
- 15. Jak utworzyć drzewo Expression zrobić to samo co „startswith”
- 16. Co to jest: w php?
- 17. Co to jest "==" w C?
- 18. Co to jest {} + {} w JavaScript?
- 19. Co to jest @ $ w perlu?
- 20. Co to jest === w javascript?
- 21. Co to jest [....] w Rubim?
- 22. Co to jest %% w Happy?
- 23. Co to jest @ @ w Perlu?
- 24. Co to jest @ @ w Bash?
- 25. Co to jest `$?` W Powershell?
- 26. Co to jest @. w Perlu?
- 27. co to jest Ljava.lang.String; @
- 28. Co to jest VertiPaq i jak działa
- 29. Co to jest jQuery18007779947370290756
- 30. Co to jest głód?
Pierwsze zdanie może być błędne. Nieprzetworzone drzewa są * większe *, prawda? – stackoverflowuser2010
Ups, tak, przepraszam. Zmienię to. –