2015-06-14 31 views
5

Czy istnieje usługa/biblioteka (bezpłatna lub płatna), która pobiera fragment tekstu i zwraca jego wersję językową?Interfejs API/biblioteka wykrywania języka

Muszę przejść ponad milion wpisów na blogu i określić ich języki.

+0

Czy obejrzysz https://github.com/shuyo/language-detection? –

+1

zobacz odpowiedzi na to pytanie: http://stackoverflow.com/q/29290107/4588780 –

Odpowiedz

0

słyszałem dobre rzeczy o langid.py.

Cechy z README:

  • Szybka
  • Pre-przeszkolony na dużej liczbie języków (obecnie 97)
  • nie jest wrażliwy na funkcji dla konkretnych domen (np HTML/XML znaczników)
  • Pojedynczy plik .py z minimalnymi zależnościami
  • Wdrażany jako usługa internetowa

https://github.com/saffsd/langid.py

Powiązane problemy