Chciałbym przeanalizować każdy token w tekście i wiedzieć, czy jest to miejsce geograficzne lub lokalizacja (miasto, kraj itp.).Baza danych lokalizacji lub lokalizacji
Czy istnieje dostępna do pobrania baza danych miejsc i lokalizacji?
Chciałbym przeanalizować każdy token w tekście i wiedzieć, czy jest to miejsce geograficzne lub lokalizacja (miasto, kraj itp.).Baza danych lokalizacji lub lokalizacji
Czy istnieje dostępna do pobrania baza danych miejsc i lokalizacji?
Powinieneś zajrzeć do bazy danych projektów miejsc OpenStreetMap. Możesz przeszukać tak zwaną Nominatim, aby sprawdzić, czy spełnia ona Twoje wymagania, a jeśli tak, pobierz OpenStreetMap data. Najpopularniejszym sposobem korzystania z OSM jest ładowanie danych do bazy danych PostgreSQL. Jeśli nie potrzebujesz pełnych funkcji renderowania geograficznego i map, prawdopodobnie możliwe jest tylko wyodrębnienie nazw miejsc.
Plik wszystkich danych OSM jest ogromny, ale dostępne są wyciągi z poszczególnych kontynentów, krajów i miast.
Być może toczyć własne z tego:
Zamówienie Geonames.org, mają znormalizowaną informację miejsca dla całego świata. The whole world is a 1 GB text file, możesz także download specific parts z tego, takich jak miasta, lokalne atrakcje i tak dalej.
Właśnie tego użyłem: P Dziękuję jednak – Ema
Lista miast link działa! Lista krajów jest jednak uszkodzonym linkiem. Czy mogę zasugerować http://pl.wikipedia.org/wiki/ISO_3166-1_alpha-2 lub http://pl.wikipedia.org/wiki/ISO_3166-1_numeric – Colin