Czy istnieją metody selekcji cech w Scikit-Learn
(lub ogólnie w algach), które podają wagę zdolności/predykcyjności/ważności atrybutu do przewidywania określonego cel? Na przykład: from sklearn.datasets import load_iris
, w rankingu każdego z 4 atrybutów wagi, aby przewidzieć osobno trzy gatunki tęczówki, ale dla znacznie bardziej złożonych zestawów danych o atrybutach w/~ 1k-10k.Zdolność predykcyjna atrybutu dla konkretnego celu w Pythonie, przy użyciu wyboru funkcji w Sklearn
Szukam czegoś analogicznego do feature_importances_
z RandomForestClassifier. Jednak RandomForestClassifer
podaje wagi dla każdego atrybutu dla całego procesu prognozowania. Wagi nie muszą sumować się do jednego, ale chcę znaleźć sposób na skorelowanie określonego podzbioru atrybutów z konkretnym celem.
Najpierw spróbowałem "przeładowania" modeli, aby wzbogacić je dla określonego celu, ale wyniki nie wydawały się zbytnio zmieniać między celami. Po drugie, próbowałem przejść na ścieżkę ordynacji, stwierdzając, które atrybuty mają największą zmienność, ale nie przekłada się bezpośrednio na zdolność predykcyjną. Po trzecie próbowałem rzadkich modeli, ale napotkałem ten sam problem, co użycie feature_importances_
.
Link do przykładu lub samouczek, który dokładnie to robi, jest wystarczający. Prawdopodobnie samouczek na temat przechodzenia przez drzewa decyzyjne w losowym lesie i przechowywania węzłów, które przewidują określone cele.
Czy ten cel jest specyficzny? Czy może ogólnie zastosować proces przewidywania? –
Zaktualizowałem swoją odpowiedź, aby lepiej rozwiązać problem związany z określonym celem. –
Dziękujemy za aktualizacje odpowiedzi. Sekcja pojedynczych celów daje pewien wgląd w to, jak można to zrobić, ale zasadniczo mówi się, aby budować modele od zera i katalogować dane. Analiza wrażliwości i spoglądanie wstecz na sekcje modelu wydają się wymagać intensywnej kombinatoryki, aby wypróbować wszystkie warianty i ich możliwości predykcyjne. Ogólne znaczenie ma to, czego starałem się uniknąć. Chociaż test f jest bardzo interesujący i nie wiedziałem, że istnieje. Dziękuję za to. Wcześniej głosowano. –