Dodając do powyższych dwóch odpowiedzi, ponieważ wspomniałeś proste wyjaśnienie. Oto zapis, który moim zdaniem jest najprostszym sposobem wyjaśnienia losowych lasów.
Kredyty otrzymują Edwin Chen za proste wyjaśnienie w odniesieniu do losowych lasów: here. Zamieszczam to samo poniżej.
Załóżmy, że jesteś bardzo niezdecydowany, więc gdy chcesz obejrzeć film, poprosić znajomego Willow czy ona myśli, że Ci się spodoba. Aby odpowiedzieć, Willow najpierw musi dowiedzieć się, jakie filmy Ci się podobają, więc dajesz jej kilka filmów i mówisz jej, czy podobał ci się każdy, czy nie (tj. Dajesz jej etykietowany zestaw treningowy). Kiedy zapytasz ją, czy myśli, że spodoba ci się film X, czy nie, gra z IMDB na 20 pytań, zadając pytania typu "Czy X to romantyczny film?", "Czy Johnny Depp jest gwiazdą w X?" , i tak dalej. Najpierw prosi o więcej informacji (tzn. Maksymalizuje zysk z informacji każdego pytania) i daje odpowiedź tak/nie na końcu.
W ten sposób Willow jest drzewem decyzyjnym dla Twoich preferencji filmowych.
Ale Willow jest tylko człowiekiem, więc nie zawsze bardzo dobrze uogólnia twoje preferencje (to znaczy, ona się nadaje). Aby uzyskać dokładniejsze rekomendacje, chciałbyś zapytać kilku znajomych i obejrzeć film X, jeśli większość z nich twierdzi, że ci się spodoba. To znaczy, zamiast pytać tylko Willow, chcesz zapytać także Woody'ego, Apple'a i Cartmana, i głosują na to, czy spodoba ci się film (np. W tym przypadku budujesz klasyfikator zespołu, czyli las).
Teraz nie chcesz, aby każdy z twoich znajomych robił to samo i dawał ci tę samą odpowiedź, więc najpierw podaj każdemu z nich nieco inne dane. W końcu nie jesteś absolutnie pewien własnych preferencji - powiedziałeś Willow, że kochasz Titanica, ale może byłeś po prostu szczęśliwy tego dnia, ponieważ to były twoje urodziny, więc może niektórzy z twoich znajomych nie powinni używać tego, co ci się podobało Titanic w tworzeniu ich zaleceń. A może powiedziałeś jej, że kochasz Kopciuszek, ale tak naprawdę to naprawdę ci się podobało, więc niektórzy z twoich znajomych powinni dać Kopciuszkowi więcej wagi. Więc zamiast dawać przyjaciołom te same dane, które dałeś Willow, dajesz im nieco zirytowane wersje. Nie zmieniasz decyzji dotyczących miłości/nienawiści, po prostu mówisz, że kochasz/nienawidzisz niektórych filmów trochę mniej więcej (formalnie, dajesz każdemu z twoich przyjaciół bootstrapową wersję oryginalnych danych treningowych). Na przykład, podczas gdy powiedziałeś Willow, że lubisz Czarnego Łabędzia i Harry'ego Pottera i nie lubisz Avatar'a, mówisz Woody'emu, że podobał Ci się Czarny Łabędź tak bardzo, że oglądałeś go dwa razy, nie lubiłeś Avatar'a i w ogóle nie wspominasz o Harrym Potterze.
Korzystając z tego zestawu, masz nadzieję, że podczas gdy każdy z twoich znajomych daje nieco idiosynkratyczne rekomendacje (Willow uważa, że lubisz filmy o wampirach bardziej niż ty, Woody myśli, że lubisz filmy Pixar, a Cartman myśli, że po prostu nienawidzisz wszystkiego), błędy zostaną anulowane w większości. W związku z tym Twoi znajomi tworzą teraz upakowany (bootstrap) las Twoich preferencji filmowych.
Jednak wciąż istnieje jeden problem z Twoimi danymi. Podczas gdy kochałeś zarówno Titanic, jak i Inception, nie dlatego, że lubisz filmy z Leonardo DiCaprio. Może podobały ci się oba filmy z innych powodów. W związku z tym nie chcesz, aby Twoi przyjaciele opierali swoje zalecenia na tym, czy Leo jest w filmie, czy nie. Tak więc, gdy każdy przyjaciel zadaje IMDB pytanie, dozwolony jest tylko losowy podzbiór możliwych pytań (np. Kiedy budujesz drzewo decyzyjne, w każdym węźle używasz losowości przy wybieraniu atrybutu do podziału, powiedzmy losowo wybierając atrybut lub wybór atrybutu z losowego podzbioru). Oznacza to, że Twoi znajomi nie mogą pytać, czy Leonardo DiCaprio jest w filmie, kiedy tylko chce. Więc podczas gdy wcześniej wstrzykiwałeś przypadkowość na poziomie danych, nieco zakłócając twoje preferencje filmowe, teraz wstrzykujesz przypadkowość na poziomie modelu, sprawiając, że twoi przyjaciele zadają różne pytania w różnym czasie.
Tak więc twoi przyjaciele tworzą teraz losowy las.
https: //www.quora.com/Random-Forests/How-do-losowy-las-work-in-laymans-terms – CoryKramer