Mam kolekcję rachunków i faktur, więc nie ma kontekstu w tekście (mam na myśli, że nie opowiadają historii). Chcę wydobyć nazwiska ludzi z tych rachunków. Próbowałem OpenNLP, ale jakość wyszkolonego modelu nie jest dobra, ponieważ nie mam kontekstu. , więc pierwsze pytanie brzmi: czy mogę trenować model zawiera tylko nazwiska osób bez kontekstu? i jeśli to możliwe, możesz dać mi dobry artykuł na temat tego, jak zbudować ten nowy model (większość artykułu, który przeczytałem, nie wyjaśniła kroków, które powinienem wykonać, aby zbudować nowy model).Wyodrębnij imię osoby z tekstu Unstruktura
Mam nazwę bazy danych z ponad 100 000 osób (imię, nazwisko), więc jeśli systemy NER nie działają w moim przypadku (ponieważ nie ma kontekstu), jaki jest najlepszy sposób wyszukiwania tych kandydatów (mam na myśli szukanie każdego imienia z wszystkimi innymi nazwiskami?)
dziękuję.