2013-03-27 15 views
15

Planuję opracować aplikację taką jak Word Lens. Czy ktokolwiek może zaproponować dobrą bibliotekę, z której mogę skorzystać? lub ktoś wyjaśnia technologię za pomocą aplikacji Word Lens? czy jest to dopasowanie czasu kołowrotka lub OCR? Znam pewną bibliotekę przetwarzania obrazów, jak OpenCv, tesseract ... Każda pomoc jest bardzo ceniona ...Real TIme Image Processing (OCR)

Odpowiedz

42

Jestem jednym z twórców Word Lens. Chociaż istnieje kilka bibliotek OCR (takich jak tesseract), zdecydowaliśmy się stworzyć własne, aby uzyskać lepsze wyniki i lepszą wydajność. Nasz ogólny algorytm idzie tak:

  1. skopiować obraz z kamery i uzyskać jego komponent skali szarości
  2. poziom się obraz tak tekst wyróżnia się wyraźnie na tle
  3. rysowanie ramek wokół rzeczy, które wyglądają jak znaki & zdania
  4. do OCR: dopasuj piksele w każdym polu do bazy danych postaci - to naprawdę trudne!
  5. zbierać znaki w słowa, spojrzeć w słowniku (jest to trudne także dlatego, że nie będzie błędów w OCR)
  6. wyciągnąć wyniki z powrotem na obraz

Image Matching sama w sobie jest nie jest wystarczająco dobra, ze względu na ogromną różnorodność czcionek, słów i języków.

OpenCV to świetna biblioteka, z której możesz zacząć korzystać i dowiedzieć się więcej o ogólnej wizji komputera. Polecam budowanie ich przykładów i zabawę tam. Baw się dobrze!

+0

Czy uzyskasz lepsze wyniki, łącząc 4 i 5 w jakiś sposób? Jako outsider do OCR, wydaje mi się, że straciłeś informacje przez "5", co może być przydatne w trudnych przypadkach. –

+1

martin: całkiem dobrze; np. "O" jest bardzo podobne do "0", a nawet "8" i "B", więc pomaga utrzymać listę możliwości, a następnie przyciąć je w kolejnych etapach, gdy więcej informacji ujednolicających jest dostępnych (prosty rodzaj opinii) –

+0

@jd. Dziękuję za komentarz. Czy mogę wiedzieć, ile czasu zajęło Ci stworzenie Word Lens? czy mógłbyś zaproponować dobre samouczki do OCR? –