Próbowałem Tesseract z iPhonem i oceniłem jego dokładność na 70% bez przetwarzania obrazu. Zauważyłem również, że może to być złe przy wyodrębnianiu cyfr. Słyszałem o silniku OCRopus OCR: co jest lepsze, Tesseract lub OCRopus, jeśli chodzi o ekstrakcję cyfr i czy mój preprocessing obrazu jest niski?
Czy ktoś uruchomił testy przy użyciu obu silników, porównując wyniki, korzystając z typowych danych?Który silnik OCR jest lepszy: Tesseract lub OCRopus?
Odpowiedz
Początkowo OCRopus faktycznie używał Tesseract jako silnika rozpoznawczego w środku, ale później zmienił go na własny nowy silnik. Jest wciąż świeży i nie dojrzały. Porównaliśmy dokładność rok temu, a OCRopus zdecydowanie przegrywał z Tesseract, nawet nie mówię o komercyjnych wersjach. Od tego czasu przestałem śledzić postępy OCRopus, ale wiem, że aktywność na forum pomocy OCRopus jest teraz bliska zeru. Oznacza to, że nikt go nie używa. Przeważnie ludzie używają silników komercyjnych, ale jeśli cena jest dla nich problemem i mogą tolerować mniejszą dokładność, to używają Tesseract. Jest zdecydowanie najlepszy wśród Open Source.
Cześć Pomidor, jeśli chcemy używać komercyjnych silników, co polecacie? –
ABBYY jest liderem na rynku OCR. W zależności od potrzeb i budżetu możesz wybrać między ABBYY FineReader Engine (http://abbyy.com/ocr_sdk), ABBYY Cloud OCR SDK (http://ocrsdk.com), ABBYY Mobile OCR Engine (http: // www. abbyy.com/mobileocr/) i ABBYY FlexiCapture Engine (http://www.abbyy.com/flexicapture_engine). Pracuję dla ABBYY i mogę Ci zapewnić dodatkowe informacje, jeśli potrzebujesz. –
Można również sprawdzić aktywność w projektach "zmiany" link
https://code.google.com/p/ocropus/source/list?repo=ocropy
https://code.google.com/p/tesseract-ocr/source/list
tesseract jest znacznie bardziej ruchliwe
- 1. Wzorce użytkownika OCR Tesseract
- 2. OCR (tesseract), inteligentna rotacja obrazu
- 3. Który przypadek jest lepszy?
- 4. Popraw wyniki OCR Tesseract z rozmytym tekstem
- 5. Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?
- 6. rozpoznawanie chińskiego znaku za pomocą Tesseract OCR
- 7. Tesseract 3.0 OCR .NET 4.0 Wrapper
- 8. Który silnik 3D dla ruby
- 9. Jawnie ustawiono czcionkę używaną do rozpoznawania przez Tesseract-OCR
- 10. Który jest lepszy, zwrot "ModelAndView" lub "String" na kontrolerze spring3
- 11. Apache2: mod_wsgi lub mod_python, który z nich jest lepszy?
- 12. Który Android IDE jest lepszy - Android Studio lub Eclipse?
- 13. Czy mogę przetestować tesseract ocr w linii poleceń systemu Windows?
- 14. dict() vs {} w python, który jest lepszy?
- 15. heroku vs openshift, który jest lepszy PaaS?
- 16. Który silnik workflow do wyboru?
- 17. Używanie tesseract na Androidzie
- 18. Niestandardowy słownik dla Tesseract
- 19. Tesseract: Określanie regionów tekstu
- 20. Real TIme Image Processing (OCR)
- 21. AngularJS - Który lepszy, $ emit/$ on lub dziedziczenie zakresu?
- 22. Dodawanie nowych czcionek do Tesseract 3
- 23. Jak korzystać z biblioteki php OCR (TesseractOCR)
- 24. Tesseract myli dwa numery
- 25. Team City kontra CruiseControl.net - który z nich jest lepszy?
- 26. Co to jest silnik JavaScript, który uruchamia powłokę mongoDB?
- 27. Błąd uruchamiania Tesseract
- 28. Poprawianie wydajności OCR w skanach wielostopniowych
- 29. Silnik aparatu XNA 2D, który śledzi Sprite
- 30. ASP.NET vs SharePoint - który z nich jest lepszy dla programistów?
Nie rozumiem, dlaczego ta sprawa jest zamknięta. Silniki OCR można porównywać ze sobą pod względem dokładności - to bardzo obiektywne porównanie. Niewiele "opartych na opionie". –