2009-02-27 16 views
6

Stemming to coś, co jest potrzebne w systemach znakowania. Używam pysznych i nie mam czasu, aby zarządzać i przycinać moje tagi. Jestem trochę bardziej ostrożny z moim blogiem, ale nie jest idealny. Piszę oprogramowanie dla systemów wbudowanych, które byłoby o wiele bardziej funkcjonalne (pomocne dla użytkownika), gdyby zawierało tłumaczenie.Stemming - przykłady kodu lub projekty open source?

Na przykład:
Parse
Parser
analizowaniem

powinny oznaczać to samo co układ Kładę je.

Idealnie istnieje licencjonowany BSD gdzieś, ale jeśli nie, to gdzie mam się nauczyć wspólnych algorytmów i technik?

Oprócz rdzennych odmian BSD, jakie inne licencjonowane źdźbła o otwartym kodzie źródłowym są dostępne?

-Adam

+0

Ktoś musi dodać http://snowball.tartarus.org/ jako odpowiedź (podpowiedź, podpowiedź) ... –

+0

Hehe, strippergram –

+0

Ale chciałbym zobaczyć innych, a konkretnie więcej informacji o używanych algorytmach . –

Odpowiedz

1

Lucene ma Stemmer w, wierzę (i IIRC to pozwala użyć własnej jeden, jeśli chcesz).

EDYCJA: Właśnie sprawdziłem, a Lucence odnosi się do strony Snowball, która jest biblioteką o otwartym kodzie źródłowym, o ile wiem.