Nie mogłem znaleźć szczegółowej dokumentacji i nie czuję przeglądania kodu źródłowego. Nie chcę na nowo wykrywać niepożądanych krawędzi, na przykład, jeśli jest to już zrobione przez silnik Tesseract.Jakie operacje wstępnego przetwarzania są wykonywane przez Tesseract OCR?
5
A
Odpowiedz
6
Niniejszy dokument zawiera przegląd silnika: https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf
Wygląda więc na to, że nie trzeba zaimplementować canny.
Tesseract wykorzystuje Otsu progowanie do binarize obrazu przed przetworzeniem go https://github.com/tesseract-ocr/tesseract/blob/master/ccstruct/otsuthr.h
Edycja: Jeśli chcesz zobaczyć obrazu binarnego wystarczy utworzyć nowy plik konfiguracyjny w „\ tessdata \ configs \”, należy dodać linię: tessedit_write_images True
i przetworzyć swój obraz: tesseract your_image out your_config_file
. Tesseract zapisuje binaryzowany obraz jako tessinput.tif
.
Powiązane problemy
- 1. Operacje matematyczne podczas wstępnego przetwarzania kompilatora
- 2. Wzorce użytkownika OCR Tesseract
- 3. Popraw wyniki OCR Tesseract z rozmytym tekstem
- 4. Jakie operacje są operacje atomowe
- 5. OCR (tesseract), inteligentna rotacja obrazu
- 6. Techniki wstępnego przetwarzania obrazu i obrazu
- 7. Jawnie ustawiono czcionkę używaną do rozpoznawania przez Tesseract-OCR
- 8. rozpoznawanie chińskiego znaku za pomocą Tesseract OCR
- 9. Tesseract 3.0 OCR .NET 4.0 Wrapper
- 10. Który silnik OCR jest lepszy: Tesseract lub OCRopus?
- 11. Czy istnieje narzędzie do przetwarzania wstępnego C#?
- 12. Jakie operacje unieważnią więzy?
- 13. Czy mogę przetestować tesseract ocr w linii poleceń systemu Windows?
- 14. Czy Z3 może być używany do wstępnego przetwarzania problemów?
- 15. Tesseract myli dwa numery
- 16. Real TIme Image Processing (OCR)
- 17. Jakie operacje w Javie są uważane za atomowe?
- 18. Jakie są trywialne operacje w std :: is_trivially_copy_constructible w C++
- 19. Poprawianie wydajności OCR w skanach wielostopniowych
- 20. Metody Open Source do przetwarzania obrazu OCR w czasie rzeczywistym?
- 21. poprawić wydajność Tesseract z OpenCV na Androidzie
- 22. Jakie są obecnie najlepsze biblioteki przetwarzania obrazu dla Javy?
- 23. testowanie pobierania wstępnego/wstępnego
- 24. Jakie operacje dopuszcza zakres bigquery.readonly?
- 25. Czy MongoDB zapytuje o operacje wykonywane po stronie klienta?
- 26. sprawdzić czy 2 drzewa węzły są związane (przodek/potomek) w czasie O (1) wstępnego przetwarzania
- 27. Niestandardowy słownik dla Tesseract
- 28. Tesseract: Określanie regionów tekstu
- 29. Jak używać wstępnego przetwarzania/normalizacji scikita wraz z walidacją krzyżową?
- 30. błąd: wklejanie "." i "czerwony" nie daje prawidłowego tokena przetwarzania wstępnego
Gdzie to zapisuje plik tessinput.tif? – kiwicomb123
@neoneye @ cortex42 W moim katalogu '\ tessdata \ configs \' mam kilka plików, takich jak 'api_config', więc kiedy mówisz" Utwórz nowy plik konfiguracyjny ", masz na myśli tylko duplikowanie istniejącej konfiguracji? Jak mogę otworzyć te pliki, aby dodać sugerowaną linię? Gdzie będę mógł zobaczyć plik '.tif'? – Joshua