Mam korpus kilku 100-tysięcznych dokumentów prawnych (głównie z Unii Europejskiej) - prawa, komentarze, dokumenty sądowe itp. Próbuję je algorytmicznie zrozumieć.NLP tekstów prawnych?
Wymodelowałem znane relacje (czasowe, to-zmiany-to, itp.). Ale na poziomie pojedynczego dokumentu, chciałbym mieć lepsze narzędzia umożliwiające szybkie zrozumienie. Jestem otwarty na pomysły, ale tutaj jest bardziej szczegółowe pytanie:
Na przykład: czy istnieją metody NLP w celu określenia odpowiednich/kontrowersyjnych części dokumentów w przeciwieństwie do schematu? Niedawno wyciekły papiery TTIP to tysiące stron z tabelami danych, ale jedno zdanie może zniszczyć przemysł.
Grałem z nowym Google Parsey McParface
i innymi rozwiązaniami NLP w przeszłości, ale gdy działają one imponująco dobrze, nie jestem pewien, jak dobrze są w izolowaniu znaczenia.