2009-06-30 11 views
27

Czy ktoś wie, czy taki istnieje?Lucene Analizator hebrajski

Byłem googlowania to dla monthes ...

Dzięki

+0

Czas, aby powstała społeczność open source. Wydaje mi się, że prawdziwa klęska jest bardzo trudna, do tego stopnia, że ​​wymaga ogromnej ilości siły roboczej, ale możliwe jest pewne podstawowe jej wyzwolenie, a być może minimalna łodyga jest lepsza od zera. Prawdopodobnie rozpocznę pracę nad tym samodzielnie. Jeśli ktoś jest zainteresowany, skontaktuj się ze mną. –

+0

... A jako pierwszy krok, spróbuję użyć wyliczenia hspell (3). To skutecznie gotowe łodygi! –

Odpowiedz

21

Aktualizacja
HebMorph

z ciekawości wywołanej swoje pytanie, skontaktowałem Itamar Syn-Hershko który aktywny na listach dyskusyjnych Lucene około roku temu, kiedy pracował nad analizatorem hebrajskim dla Lucene. Zapytałem go, czy ukończył swój analizator. Oto kilka istotnych bitów z jego odpowiedzi:

Na krótką historię nr I nie. Nie ma przyzwoitego darmowego/ analizatora hebrajskiego open source dla Lucene, który mogę powiedzieć na pewno. Jestem nie jestem pewien, jakie jest twoje tło na temat, ale uwierz mi, gdy mówię nie ma prostego sposobu robienia tego; it może być również Lucene nie jest zbudowany do wyszukiwania w języku hebrajskim, ale zgadzam się, że należy podać rozwiązanie . To prawda, że ​​najbezpieczniejszym sposobem indeksowania i wyszukiwania hebrajskiego jest tłumaczenie , a integracja z Lucene nie jest najłatwiejsza nawet po wykonaniu tego. Istnieje kilka bardzo dobrych rozwiązań dla hebrajskiego wyszukiwania na rynku, tylko jeden, który znam używa Lucene w to jest rdzeń; I niedawno próbował je kontaktując jeszcze żadnej odpowiedzi ...

Produkt handlowy oparty na Lucene, który jest wymieniony nazywa ATTIVIO i the ATTIVIO website rości mieć wsparcie hebrajskiego. Pod numerem SIGTRS (Hebrew Text Retrieval interest group) pojawiło się jakieś discussion regarding ATTIVIO, które twierdzi, że jest oparte na Lucene.

Najwyraźniej możliwe jest stworzenie przyzwoitego analizatora hebrajskiego dla Lucene, ale nie ma obecnie dostępnego darmowego analizatora.

+0

Wow, dziękuję całej paczce! – Roey

+0

Bez problemu; cieszę się, że to było pomocne. ;) – Naaff

+4

Cześć, w końcu mam czas, aby rozpocząć pracę nad jednym i jak dotąd wygląda obiecująco. Zobacz: http://www.code972.com/blog/hebmorph/. Itamar. – synhershko

0

dtsearch ma hebrajski odpowiednik wtyczki "pensim". Wygląda na to, że został opracowany przez "wizcomtech.com".