wiem formuły obliczania entropii:Obliczanie entropia w drzewo decyzyjne (uczenia maszynowego)
H(Y) = - ∑ (p(yj) * log2(p(yj)))
w słowach, wybierz atrybut i dla każdego celu wyboru wartości atrybutu wartość ... więc p (yj) jest ułamkiem wzorów w węźle N są w kategorii yj - jeden dla prawdziwej wartości docelowej, a jeden dla fałszywej.
Ale mam zestaw danych, w którym atrybutem docelowym jest cena, a więc zakres. Jak obliczyć entropię dla tego rodzaju zestawu danych?
(określony: http://decisiontrees.net/decision-trees-tutorial/tutorial-5-exercise-2/)
ale jak mogę określić zakresy? Przypuśćmy, że posortowałem dane, jak określić zasięg ... po prostu zgaduję, czy chcę danych binarnych, a następnie tych danych? –
Istnieje wiele metod na to, dodam więcej informacji do odpowiedzi, daj mi sekundę ... –
oops to nie ma sensu .. jeśli atrybuty mają dwie wartości, to binarne ... dzięki @Vic Smith! –