2009-04-02 11 views
11

Szybkie wyszukiwanie w Google ujawnia, że ​​istnieje duża liczba klasyfikatorów bayesowskich zaimplementowanych jako moduły Pythona. Jeśli chcę zapakowaną, wysokopoziomową funkcjonalność podobną do dbacl, który z tych modułów jest dla mnie odpowiedni?Które moduły klasyfikacji tekstu Python Bayesian są podobne do dbacl?

Szkolenie

% dbacl -l one sample1.txt 
% dbacl -l two sample2.txt 

Klasyfikacja

% dbacl -c one -c two sample3.txt -v 
one 

Odpowiedz

9

myślę Znajdziesz nltk pomocne. W szczególności, classify module.

+0

Nie wierzę, że NLTK zawiera algorytm wyboru funkcji, ale ma narzędzia do wyszukiwania częstotliwości itp., Więc możesz napisać własne i podać je do wybranego przez siebie klasyfikatora. – apexdodge

0

Jeśli próbujesz wykryć język, this działa dobrze nawet z krótkimi tekstami.

Api jest bardzo blisko Ciebie, ale nie wiem, czy nazywa się klasyfikatorem Bayesian.

1

Zauważywszy to pytanie. Umieściłem moją implementację naiwnego klasyfikatora Bayesian na gitHub.

Here it is - beiyesi

Nadal potrzebuje dużo poprawy. Każda pomoc jest doceniana.

-1

Wypróbuj Mallet i LingPipe. zapewniają więcej modeli dla klasyfikatora.

+0

To są biblioteki Java, a nie Python. – tripleee

Powiązane problemy