2011-05-14 12 views
5

Szukam biblioteki OCR lub jakichkolwiek próbek, które mogłyby go używać do czytania arabskich liter z image.i googled dużo i nie znalazłem nic .. proszę pomóc dzięki w postęp.Open Source OCR dla języka arabskiego

+0

http://stackoverflow.com/questions/4696180/open-source-ocr-library-for-arabic http://stackoverflow.com/questions/6825712/need-an-opensource-of-arabic-ocr- albo-in-java-or-in-dotnet –

Odpowiedz

1

Możesz wypróbować numer Abbyy Fine Reader, mogą one mieć język, którego szukasz.

+0

to zamknięta biblioteka. Potrzebuję open source, aby to zrobić. – Ramah

+1

Może powinieneś o tym wspomnieć w swoim pytaniu. Znalezienie dobrego otwartego źródła OCR będzie bardzo trudne, szczególnie w przypadku języka arabskiego. –

7

TesseractOCR to prawdopodobnie najlepszy otwarty mechanizm OCR na rynku i jest bardzo elastyczny, co można rozpoznać. Pozwala na trening z niestandardowymi danymi, więc zasadniczo każdy język jest możliwy, o ile tylko zechcesz umieścić pracę (np. Utworzyć zestaw szkoleniowy).

Istnieją tools provided by tesseract (z interfejsem GUI), które mogą pomóc w utworzeniu zestawu danych, w którym określa się ramkę ograniczającą znaków i odpowiednią transkrypcję.

EDYCJA: Zauważono z innego posta (link powyżej), że zestaw szkoleniowy w języku arabskim został już utworzony dla wersji 3.01. Wystarczy podłączyć dane arabskie, a twój problem zostanie rozwiązany :).

Powiązane problemy