Pracuję nad projektem, którego nie jestem do końca pewien. Problem można podsumować w następujący sposób:Określanie położenia geograficznego według arbitralnej treści tekstu
- Biorąc pod uwagę dowolną treść tekstu (rodzaj raportu), określ, w jakim położeniu geograficznym się znajduje każda część raportu.
Lokalizacje geograficzne obejmują zakres od stanów do powiatów (wszystko w USA), więc ich liczba jest ograniczona, ale każdy raport zawiera na ogół odniesienia do wielu lokalizacji. Na przykład pierwsze 5 akapitów raportu może dotyczyć stanu jako całości, a następnie następne 5 będzie dotyczyć poszczególnych powiatów w tym stanie lub czegoś podobnego.
Ciekaw jestem, jaki byłby najlepszy sposób podejścia do takiego problemu, być może z konkretnym zaleceniem dotyczącym ram NLP lub ML (Python lub Java)?
Czy możesz podać przykład danych wejściowych i oczekiwanych wyników? – Blacksad