Pracuję nad rozpoznawaniem tekstu drukowanego przez OCR. W szczególności skupiam się na etapie przetwarzania wstępnego, aby poprawić wyniki silnika Tesseract. Osiągnąłem już dobre wyniki z progowaniem adaptacyjnym, usuwaniem szumów, korektą tekstu itp. Jednak nadal wydaje się, że Tesseract się nie udaje, gdy inny produkt komercyjny zwraca przyzwoite wyniki.Popraw wyniki OCR Tesseract z rozmytym tekstem
Użyłem następującego obrazu testowego, a tutaj są wyniki uzyskane w Tesseract 3.04 w porównaniu do dwóch komercyjnych OCR apis. Wszystkie 3 usługi zostały wyposażone w ten sam obraz binarny, który zawiera nieco lekko zamazany tekst.
Tesserakt
Careers in Technology Consulting
Networking Lunch
21 m 2014, 11:00 - 14:30
Definingthecorporatellstmtegy, Wammmwdngdeal, creating
uniquebwinessisighnwilgbigdam-doesflismflxemmyouafioy?
Findoutmoreabanhowitfeektomkasatedlflogymbyjoiningour
for further mm please visit mAeloittexom/weers
ABBYY Fine Reader Online
Careers in Technology Consulting
Networking Lunch
21 November 2014,1140-14:30
Defining the corporate IT strategy, planning a multHnKon <Mar outsourcing deal, creating unique business insights using big data-doesthis sound Ifce something you enjoy?
Find out more about hour it feels to work as a technology consultant by joining our exclusive networking lunch,
For further information please visit wrwMuleloittexom/carcert
Careers in Technology Consulting Networking Lunch 21 November 2014, 11;00 —14:30
Defining the corporate IT strategy, planning a muiti-indlimi dollar outsourcing deal, creating unique business insights using big data—does this sound like something you enjoy?
Find out more about how it feels to work as a tedmology consultant by joining our exclusive networking lunch,
For further information' please visit wwwdeloitte,com/careers
Teraz zastanawiam się, czy duża różnica między Tesseract i pozostałymi dwoma produktami wynika z odmiennego silnika (na pewno ABBYY używa własnego silnika, nie ma pewności co do usługi OCR Web Service) lub są pewne inne kroki przetwarzania wstępnego, które można zrobić przed uruchomieniem Tesseract. Masz jakieś sugestie?
Co powiesz na sprawdzenie postu i zaakceptowanie odpowiedzi? – Claudio
Co powiesz na sprawdzenie postu i zaakceptowanie odpowiedzi? – Claudio