2012-04-27 13 views
7

Zastanawiam się, czy istnieje jako API w Javie, które można zdefiniować słowa i znaleźć pochodzenie słów. Pamiętam chwilę z powrotem przeszukując to i widząc "Apache commons", ale nie jestem pewien.Definiowanie słów przy użyciu Java

Zasadniczo użytkownik będzie mógł wprowadzić słowo "przepełnienie", a następnie program będzie mógł zdefiniować słowo. Tak więc szukam API, który może definiować słowa i znajdować pochodzenie słów. Zatem słowo "recherche" ma pochodzenie "francuskie".

+1

Szukasz sieci [lematu] (http : //en.wikipedia.org/wiki/Lemma_%28morphology%29) tokeny? Twoje pytanie jest trochę niejasne, powinieneś wyjaśnić, czego szukasz - najlepiej z przykładem: – amit

+0

Dodałem wyjaśnienie. Mam nadzieję, że pytanie będzie mniej niejasne –

+1

Recherche jest również niemieckim słowem Należy pamiętać, że to samo słowo może istnieć w kilku językach – oers

Odpowiedz

8

WordNet da ci połowę tego, czego szukasz: możesz wyszukać definicję słowa. Zauważ, że istnieje kilka implementacji WordNet dla Java: jwi, jaws, Dan Bikel's, WordnetAPI. Niektóre z nich mogą być łatwiejsze do użycia w tym celu niż jwordnet zasugerowane przez miku (użyłem tylko szczęk i jwi).

Uwaga: WordNet nie da ci pochodzenia (AFAIK). Nie znam oprogramowania, które to robi.

Uwaga: Będziesz musiał dostarczyć lematu wyrazu, aby móc zajrzeć do słownika. Oznacza to, że będziesz musiał zastosować pewne techniki przetwarzania języka naturalnego (NLP), jeśli chcesz to zrobić automatycznie w dokumencie tekstowym (który może zawierać odfiltrowane formularze). Jeśli wybierzesz tę trasę, proponuję GATE projekt Morph plugin.

4

Jest strona Etymologia: http://www.etymonline.com/

To daje wynik: Recherche 1722, z Fr. recherché "starannie poszukiwany", pp. z Rechercher ", aby szukać." Powszechnie używane 19c. żywności, stylów itp., aby wskazać niejasną doskonałość.

Nie wiem, czy mają interfejs API, ale używają jakiegoś skryptu do wysłania zapytania.

Znajdź więc dobry sposób na wykrycie "Fr." w zdaniu powyżej.

Cheers, Erik

2

Czy szukać JWKTL?

„Wikisłownik jest wielojęzyczna, web-based, swobodnie dostępny słownik, tezaurus i zwrot książek, zaprojektowany jako leksykalnym towarzysz Wikipedii.Ostatnio, że została uznana za obiecujący leksykalnym semantycznego zasobu dla aplikacji przetwarzania języka naturalnego.”

Korzystanie z tym, można zobaczyć etymologię słów.

Powiązane problemy