Niedawno zacząłem używać Weka i staram się klasyfikować tweety na pozytywne lub negatywne przy użyciu Naive Bayes. Mam więc zestaw szkoleniowy z tweetami, które dostarczyłem etykietą i zestawem testowym z tweetami, które mają etykietę "pozytywną". Kiedy wpadłem Naive Bayesa, mam następujące wyniki:Znaczenie poprawnie sklasyfikowanych instancji Weka
prawidłowo sklasyfikowanych instancje: 69 92% Błędnie sklasyfikowane przypadki: 6 8%
Następnie, jeśli mogę zmienić etykiety tweets w teście jest ustawiony na " negatywne”, raz za naiwny Bayesa, wyniki odwrócony:
prawidłowo sklasyfikowanych przypadki: 6 do 8% błędnej klasyfikacji przypadki: 69 92%
i uważał, że prawidłowo zaklasyfikowane przykłady pokazują dokładność naiwnych Bayesa i że powinno być takie samo nie znaczenie etykiet tweetów w zestawie testowym. Czy coś jest nie tak z moimi danymi lub nie rozumiem poprawnie znaczenia prawidłowo sklasyfikowanych wystąpień?
dziękuję za poświęcony czas,
Nantia
Wielkie dzięki @Junnux & Antimony za szybkie odpowiedzi! Zestaw testowy jest tworzony w ten sposób: podaję wyszukiwany termin do mojego programu, twitter api zwraca tweety zawierające ten termin, te tweety tworzą mój zestaw testowy, a następnie uruchamia Naive Bayes. Nie mogę więc dodać poprawnych etykiet dla zestawu testowego. Jeśli dobrze cię zrozumiałem, w tym przypadku będę mógł uzyskać odpowiedzi klasyfikatora na etykiety zestawu testowego, ale nie będę w stanie ocenić dokładności. Czy dobrze to rozumiem? – nadia
Masz rację, zakładając, że masz etykiety dla zestawu treningowego przynajmniej. Jeśli nawet tego nie masz, podejmiesz niewłaściwe podejście. Naive Bayes to algorytm nadzorowanej nauki. Jeśli nie masz etykiet, to czego szukasz, to nauka __unsupervised__, która wymaga innego zestawu algorytmów, a ogólnie daje o wiele gorsze wyniki. Proponuję albo znaleźć sposób na oznaczenie twoich danych lub google dla uczenia się bez nadzoru. – Antimony
Tak, moim celem jest nadzorowanie nauki, więc mam etykiety do mojego zestawu treningowego. Wielkie dzięki! Naprawdę pomógł mi rozwiązać kilka rzeczy. :) – nadia