Używając algorytmu klasyfikacji klas (na przykład naiwnych lub SVM) i StringToWordVector, byłoby możliwe użycie TF/IDF i zliczanie częstotliwości w całej bieżącej klasie zamiast po prostu zaglądając do jednego dokumentu?Czy TF/IDF może pobierać klasy na konto
Pozwól mi wyjaśnić, chciałbym, aby obliczenia dawały wysoki wynik słowom, które są bardzo częste dla danej klasy (nie tylko dla danego dokumentu), ale niezbyt często w całym korpusie.
Czy jest to możliwe po wyjęciu z pudełka, czy wymaga to dodatkowych ulepszeń?
Dzięki :)