Istnieje wiele bibliotek dostępne do wydobywania tekstu z obrazów.
Tesseract i Abby są najlepszym Użyłem OCR SDK. Główną zaletą programu Abby SDK jest to, że jego wyniki są dobre w porównaniu z Tesseract. A jedyną wadą jest to, że jest do kupienia. Podczas gdy główną zaletą w Tesseract jest to, że jest open source i można poprawić jego wynik za pomocą dowolnej biblioteki przetwarzania obrazu.
1) Abby - https://github.com/abbyysdk/ocrsdk.com to przesyła obraz do swojego serwera, konwertuje obraz na tekst i pobiera wynik
2) Tesseract - https://github.com/nolanbrown/Tesseract-iPhone-Demo/tree/master/OCRDemo konwertuje obraz na tekst za pomocą tessrect SDK. Nie tak dokładny wynik jak Abby, ale nie wymaga połączenia z Internetem.
3) Tesseract + OpenCV - https://github.com/pablosproject/iPhone-OCR-Tesseract-and-OpenCV Prawdopodobnie najlepszy SDK znalazłem tak daleko, aby odczytać obraz bez połączenia z Internetem. Zaletą tego kodu jest także integracja OpenCV, dzięki czemu można dodać algorytmy, takie jak algorytm wyodrębniania blogów i transformacja hough, aby zwiększyć dokładność wyniku.
Mam nadzieję, że to pomaga.
Użyłem Tesseract + OpenCV, który bardzo mi pomógł. Nie jest zbyt optymalna, ale rozpoznaje tekst z obrazów. –