Planuję opracować aplikację taką jak Word Lens. Czy ktokolwiek może zaproponować dobrą bibliotekę, z której mogę skorzystać? lub ktoś wyjaśnia technologię za pomocą aplikacji Word Lens? czy jest to dopasowanie czasu kołowrotka lub OCR? Znam pewną bibliotekę przetwarzania obrazów, jak OpenCv, tesseract ... Każda pomoc jest bardzo ceniona ...Real TIme Image Processing (OCR)
15
A
Odpowiedz
42
Jestem jednym z twórców Word Lens. Chociaż istnieje kilka bibliotek OCR (takich jak tesseract), zdecydowaliśmy się stworzyć własne, aby uzyskać lepsze wyniki i lepszą wydajność. Nasz ogólny algorytm idzie tak:
- skopiować obraz z kamery i uzyskać jego komponent skali szarości
- poziom się obraz tak tekst wyróżnia się wyraźnie na tle
- rysowanie ramek wokół rzeczy, które wyglądają jak znaki & zdania
- do OCR: dopasuj piksele w każdym polu do bazy danych postaci - to naprawdę trudne!
- zbierać znaki w słowa, spojrzeć w słowniku (jest to trudne także dlatego, że nie będzie błędów w OCR)
- wyciągnąć wyniki z powrotem na obraz
Image Matching sama w sobie jest nie jest wystarczająco dobra, ze względu na ogromną różnorodność czcionek, słów i języków.
OpenCV to świetna biblioteka, z której możesz zacząć korzystać i dowiedzieć się więcej o ogólnej wizji komputera. Polecam budowanie ich przykładów i zabawę tam. Baw się dobrze!
Powiązane problemy
- 1. C# Real Time Try Catch
- 2. Image Processing - Dress Segmentacja za pomocą OpenCV
- 3. Scala i Java Real-Time system
- 4. Czy istnieje sposób użycia Matlab Image Processing Toolbox w F #?
- 5. bezpłatny Real-Time konwersji Wymiana walut posuw xml url
- 6. Kiedy używać języka Processing?
- 7. UTF8 processing in C
- 8. Enums in Processing 2.0
- 9. Electron - Processing Input
- 10. Java Parallel Processing File
- 11. Czy istnieje coś takiego jak "Multi-Path Push" w bazie danych Firebase Real-Time?
- 12. Real-Time z Node.js: WebSocket + Polling po stronie serwera vs. Polling po stronie klienta
- 13. Przygotowanie złożonego obrazu do OCR
- 14. Real HLSL IDE/debugger
- 15. Real-world Complex Rails?
- 16. Mockito- calling real method
- 17. operator kompilacji sizeof-time lub run-time
- 18. Implementacja Java OCR
- 19. Biblioteka OCR systemu Android
- 20. OCR dla znanej czcionki
- 21. Jak utworzyć program OCR?
- 22. javascript OCR API
- 23. Wzorce użytkownika OCR Tesseract
- 24. Open source OCR
- 25. Integer to real conversion function
- 26. Scala Real Interval, Int Interval
- 27. przykłady klasy ogólnej Real life
- 28. jquery: fade in image after image
- 29. OCR zapewniający nakładkę HTML na obraz?
- 30. Parallel Processing i wielożyłowe w R
Czy uzyskasz lepsze wyniki, łącząc 4 i 5 w jakiś sposób? Jako outsider do OCR, wydaje mi się, że straciłeś informacje przez "5", co może być przydatne w trudnych przypadkach. –
martin: całkiem dobrze; np. "O" jest bardzo podobne do "0", a nawet "8" i "B", więc pomaga utrzymać listę możliwości, a następnie przyciąć je w kolejnych etapach, gdy więcej informacji ujednolicających jest dostępnych (prosty rodzaj opinii) –
@jd. Dziękuję za komentarz. Czy mogę wiedzieć, ile czasu zajęło Ci stworzenie Word Lens? czy mógłbyś zaproponować dobre samouczki do OCR? –