Czy istnieje usługa/biblioteka (bezpłatna lub płatna), która pobiera fragment tekstu i zwraca jego wersję językową?Interfejs API/biblioteka wykrywania języka
Muszę przejść ponad milion wpisów na blogu i określić ich języki.
Czy istnieje usługa/biblioteka (bezpłatna lub płatna), która pobiera fragment tekstu i zwraca jego wersję językową?Interfejs API/biblioteka wykrywania języka
Muszę przejść ponad milion wpisów na blogu i określić ich języki.
Myślę, że to jest najlepsze!
słyszałem dobre rzeczy o langid.py
.
Cechy z README:
- Szybka
- Pre-przeszkolony na dużej liczbie języków (obecnie 97)
- nie jest wrażliwy na funkcji dla konkretnych domen (np HTML/XML znaczników)
- Pojedynczy plik .py z minimalnymi zależnościami
- Wdrażany jako usługa internetowa
Czy obejrzysz https://github.com/shuyo/language-detection? –
zobacz odpowiedzi na to pytanie: http://stackoverflow.com/q/29290107/4588780 –