2010-08-09 12 views
7

Obecnie napisałem algorytm w języku Ruby na podstawie kodu czytelności arc90, aby wyodrębnić artykuł ze strony internetowej.Coś lepszego niż alchemia ruby ​​do wydobywania słów kluczowych?

Teraz mam artykuł, chcę, aby wyodrębnić słowa kluczowe i konkretne informacje od niego (nazwy, autor, etc)

usłyszałem Alchemy był wielki rubin gem dla tej operacji choć zużywa dużo zasobów . Czy są jakieś lepsze klejnoty, które mogę w tym celu wykorzystać?

+0

Myślę, że słowo kluczowe "alchemia" odnosi się do projektu Alchemy Adobe, a nie do Ruby Gem. Zobacz faq: http://stackoverflow.com/tags/alchemy/info – paleozogt

Odpowiedz

2

Istnieje OpenCalais gem, który zapewnia podobną funkcję. Oprócz ekstrakcji jednostki może również wykrywać zdarzenia i relacje między jednostkami. Nie jest lekki, chociaż nie mogłem stwierdzić, czy jest lepszy czy gorszy od Alchemy, ponieważ nie korzystałem z klejnotu Alchemy. Mam nadzieję że to pomoże.

+0

Poszedłem i napisałem własny klejnot do OpenCalais: https://github.com/RedFred7/dover_to_calais – RedFred

9

szybko, leightweight i łatwe w użyciu gem do ekstrakcji słów kluczowych z dłuższym treści:

https://rubygems.org/gems/highscore

go używać w produkcji, działa jak czar.

To pytanie jest nieco starsze, ale zostawiam to tutaj innym osobom, które przyjdą z Google, aby zobaczyć to pytanie.

Powiązane problemy