2011-09-24 13 views
14

Jestem początkującym na komputerowej wizji, ale wiem, jak korzystać z niektórych funkcji na opencv. Próbuję użyć Opencv do rozpoznawania dokumentów, chcę pomóc znaleźć kroki dla niego.Jak korzystać z Opencv do rozpoznawania dokumentów za pomocą OCR?

Zamierzam użyć opencv przykład find_obj.cpp, ale dokumenty, na przykład paszport, ma pewne zmienne, imię, datę urodzin, zdjęcia. Potrzebuję więc pomocy w zdefiniowaniu kroków, a jeśli jest to możliwe, w jaki sposób funkcję muszę użyć na poszczególnych etapach.

Nie pytam o cały kod, ale jeśli ktoś ma przykładowy link lub możesz po prostu wpisać instrukcję, jest bardzo pomocny.

Odpowiedz

24

Występują tutaj dwa różne etapy. Jeden wykrywa twój obiekt, a drugi go analizuje.

Do wykrywania obiektów, próbujesz po prostu dowiedzieć się, czy obiekt znajduje się w ramce, i w przybliżeniu, gdzie się znajduje. Struktura funkcji OpenCv jest świetna do tego. W przypadku niektórych samouczków i obszernego przykładowego kodu zobacz samouczki dotyczące funkcji OpenCv features2d, a zwłaszcza feature matching tutorial.

Do analizy potrzebne jest wykrywanie optycznego rozpoznawania znaków (OCR). OpenCv nie zawiera bibliotek OCR, ale polecam wypróbować tesseract-ocr, która jest świetną biblioteką OCR. Jeśli twoje dokumenty mają stałą strukturę (spójny układ pól tekstowych), to wszystko czego potrzebujesz to tesseract-ocr. Aby uzyskać bardziej zaawansowaną analizę, sprawdź: ocropus, która używa tesseract-ocr, ale dodaje analizę układu.

+0

Próbuję tego rozwiązania, ale jeśli mam, nie mam sukcesu na rzeczywistym przykładzie świata, myślę, że przy szablonowej matematyce muszę używać tylko obrazu o tej samej rozdzielczości. Albo nie? – Ricardo

+1

Jeśli masz problem z prawdziwym przykładem świata, możesz potrzebować tesseract-ocr dla konkretnej czcionki, której używasz. W przeciwnym razie będzie używać domyślnej bazy danych, która może nie być zgodna z tekstem, z którym pracujesz. Możesz spróbować skalować swój tekst, zanim podasz go do tesseract-ocr, stwierdziłem, że wysokość około 20 pikseli działa dobrze. –

+0

Czy masz link do szkolenia tesseract? Mam problemy z uzyskaniem dobrych wyników i nie mogę znaleźć zrozumiałego, dobrego samouczka dotyczącego szkolenia – Tjorriemorrie

Powiązane problemy