To jest bardziej pytanie "teoretyczne". Pracuję z pakietem naukowo-naukowym, aby wykonać pewne zadanie NLP. Sklearn oferuje wiele metod, które umożliwiają zarówno wybór cech, jak i ustawienie parametrów modelu. Zastanawiam się, co powinienem zrobić jako pierwszy.Co zrobić najpierw: Ustawienie funkcji lub ustawienia parametrów modelu?
Jeśli używam univariate feature selection, to jest oczywiste, że powinienem najpierw dokonać wyboru cech i, z wybranymi funkcjami, nastroić parametry estymatora.
Ale co jeśli chcę użyć recursive feature elimination? Czy najpierw powinienem ustawić parametry przy pomocy grid search używając WSZYSTKICH oryginalnych funkcji, a dopiero potem dokonać wyboru funkcji? A może powinienem najpierw wybrać funkcje (z domyślnymi parametrami estymatora), a następnie ustawić parametry z wybranymi funkcjami?
Z góry dziękuję za pomoc, jaką możesz mi udzielić.
EDIT
Mam dość dużo ten sam problem stwierdził here. Do tego czasu nie było rozwiązania. Czy ktoś wie, czy istnieje teraz?
Dzięki za sugestię. Ponieważ planuję użyć LogistRegression i SVC, myślę, że chi2 i/lub L1 będą wystarczające. – feralvam