Obecny Mahout 0.8-SNAPSHOT zawiera zwiniętą wariacyjną wersję Bayesa (cvb) do modelowania tematycznego i usunął metodę Latent Dirichlet Analysis (lda), ponieważ cvb może być lepiej zrównoleglony. Niestety istnieje tylko dokumentacja dla lda, jak uruchomić przykład i wygenerować znaczące wyniki.Uruchom cvb w mahout 0.8
Zatem chcę:
- przetwórz niektóre teksty poprawnie
- prowadzą cvb0_local wersji CVB
- sprawdzać wyniki patrząc na góry N słów w każdym z powstałych tematów
Czy istnieje jakiś sposób na sprowadzaniu eache tematy dokumen ts? lub w inny sposób, aby pobierać tematy dokumentów? –