Algorytmy/techniki rejestracji obrazu stosowane do aktywacji ekstrakcji pól ze zeskanowanego dokumentu?

enter image description here Próbuję określić najlepszą metodę wyodrębniania odręcznych danych z zeskanowanego dokumentu.Algorytmy/techniki rejestracji obrazu stosowane do aktywacji ekstrakcji pól ze zeskanowanego dokumentu?

Odręczne dane znajdują się w określonych obszarach pudełkowych. Wygenerowałem cyfrową wersję dokumentu i dlatego znam oba współrzędne w obszarach pudełkowych, a także w razie potrzeby mogę wygenerować dodatkowe odmiany dokumentu (tj. Wersję, która jest zamaskowana, aby pola były łatwiejsze do wyodrębnienia)

Powód, dla którego nie mogę po prostu wyodrębnić pól za pomocą współrzędnych z generowania dokumentów, jest zmiana/zmiana skali/zmiana perspektywy, które występują podczas procesu skanowania, które mogą wypychać/wyciągać współrzędne dla każdego pojedyncze pudełko w różny sposób (zeskanowany dokument ma znaczniki narożne używane do wyrównania, ale nawet tak często zachodzą niezamierzone transformacje).

Zakładam, że na wysokim poziomie są dwa sposoby rozwiązania tego problemu: krok po współrzędnych każdego z pól na stronie i spróbuj "poprawić" je za pomocą jakiejś techniki/algorytmu lub porównać wypełniony formularz z pustym tekstem formularz (zamaskowany?) i spróbuj wyodrębnić w ten sposób odpowiednie pola.

Jaka jest najskuteczniejsza technika/algorytm, aby dostosować się do tych modyfikacji i dokładnie wyodrębnić obszary, które zawierają pismo ręczne? Czy są inne opcje?

Źródło

2013-02-12 HipHop-opatamus

Jeśli twoje pudełko jest otoczone liniami, możesz je łatwo znaleźć przez korelację lub dowolną inną metodą (transformacja haczyka itp.). BTW, jeśli obraz mógłby zostać obrócony, korelacja da ci złe wyniki, ale przekształcenia Hough pomogą ci określić kąt obrotu (ponieważ główne linie w dokumentach to poziomy i pionowe). Po korekcji rotacji możesz naprawdę wykonać prostą korelację z etalonem, aby znaleźć współrzędne przesunięcia. –

Nie widząc formularza, po prostu zgaduję. Mój ostatni projekt zidentyfikował wzory kropek. To, co jest przydatne w kropkach, to kropka to kropka, bez względu na to, jaki obrót jest ustawiony. Wzory kropek mogą tworzyć punkty orientacyjne, które oprogramowanie może wykorzystać jako punkt początkowy obrotu. Znając punkt początkowy i kąt, łatwo jest wyodrębnić regiony. Wzór kropek może również wskazywać rozdzielczość. Jestem zdezorientowany, dlaczego znaki narożne mogą osiągnąć tylko do 5 stopni. Znaczki oddalone od siebie tak daleko powinny zrobić znacznie więcej. –

Zamieszczanie obrazów formularzy pomoże znaleźć rozwiązanie. –

Istnieje wiele możliwych techniques, które mogą osiągnąć prawie 100% dokładności dla twojego problemu.

Wykonaj następujące czynności opisane na tej stronie: http://www.codeproject.com/Articles/24809/Image-Alignment-Algorithms. Krótko mówiąc, najpierw obliczyć przepływ optyczny między dwoma obrazami, a następnie oszacować transformację, która wytwarza taki przepływ optyczny.

Uwaga: to podejście działa najlepiej, gdy dopasowane obrazy są niemal identyczne.

Źródło

2015-04-02 01:43:48

Algorytmy/techniki rejestracji obrazu stosowane do aktywacji ekstrakcji pól ze zeskanowanego dokumentu?

Odpowiedz

Powiązane problemy