Potrzebuję do sklasyfikowania tekstu i używam modułu Text blob python, aby go osiągnąć. Mogę użyć klasyfikatora Naive Bayes/drzewa decyzyjnego. Obawiam się o poniższych punktach.Klasyfikacja tekstu w python - (oparte na zdaniu NLTK)
1) Muszę zaklasyfikować zdań jako argument/Nie argument. Używam dwóch klasyfikatorów i trenuję model przy użyciu zestawów danych apt. Moje pytanie dotyczy tylko tego, czy muszę wyszkolić model za pomocą tylko słów kluczowych? lub mogę wyszkolić zestaw danych ze wszystkimi możliwymi argumentami i bez argumentów przykładowe zdania? Jakie byłoby najlepsze podejście w zakresie dokładności klasyfikacji tekstu i czasu jego pobierania?
2) Ponieważ klasyfikacja byłaby albo argumentem/nie argumentem, który klasyfikator uzyskałby dokładne wyniki? To jest Naive Bayes/Drzewo decyzyjne/Pozytywne naiwne bayes?
Z góry dziękuję.