Szukam biblioteki, która może wykonać analizę morfologiczną słów niemieckich, tzn. Przekształca dowolne słowo w jego formę podstawową i dostarcza meta informacji o analizowanym słowie.Czy istnieje bezpłatna biblioteka do analizy morfologicznej języka niemieckiego?
Na przykład:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
Moja lista życzeń:
- To musi działać z obu rzeczowników i czasowników.
- Jestem świadomy, że jest to bardzo trudne zadanie ze względu na złożoność języka niemieckiego, więc szukam również bibliotek, które zapewniają tylko przybliżenia lub mogą być tylko w 80% dokładne.
- Wolałbym biblioteki, które nie działają ze słownikami, ale znowu jestem otwarty na kompromis, biorąc pod uwagę okoliczności.
- Wolałabym także biblioteki C/C++/Delphi dla systemu Windows, ponieważ to ułatwiłoby integrację, ale także .NET, Java, ....
- To musi być bezpłatna biblioteka. (L) GPL, MPL, ...
EDIT: Zdaję sobie sprawę, że nie ma sposobu, aby przeprowadzić analizę morfologiczną bez słownika w ogóle, z powodu nieregularnych słów. Kiedy mówię, wolę bibliotekę bez słownika mam na myśli te pełnowartościowy słowniki który mapować każdy i każde słowo:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
słowniki te mają kilka wad, w tym ogromnych rozmiarów i niezdolność do przetworzenia nieznanych słów.
Oczywiście wszystkie wyjątki mogą być obsługiwane tylko ze słownikiem:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(Mój umysł wiruje teraz :))
Jesteś częściowo rację, aktualizowane na moje pytanie. –